第二章：搜索引擎如何工作：爬行，索引和排名

2021年8月5日
乾龍品牌
SEO营销

正如我们在第1章中提到的，搜索引擎是答案机。它们的存在是为了发现，理解和组织互联网的内容，以便为搜索者提出的问题提供最相关的结果。为了显示在搜索结果中，您的内容需要首先在搜索引擎中可见。这可以说是SEO难题中最重要的一部分：如果找不到您的网站，您将永远不会出现在SERPs（搜索引擎结果页面）中。

搜索引擎如何工作？

搜索引擎通过三个主要功能工作：

爬行：在互联网上搜索内容，查看他们找到的每个URL的代码/内容。
索引：存储和组织爬行过程中发现的内容。一旦页面处于索引中，它将作为相关查询的结果显示在运行中。
排名：提供最能回答搜索者查询的内容，这意味着结果按与最不相关的最相关排序。

什么是搜索引擎爬行？

爬行是搜索引擎发出一组机器人（称为爬行器或蜘蛛）以查找新的和更新的内容的发现过程。内容可以变化-它可以是网页，图像，视频，PDF等-但无论格式如何，内容都是通过链接发现的。

蜘蛛爬虫示意图

Googlebot首先获取一些网页，然后跟随这些网页上的链接查找新的URL。通过沿着这条链接路径跳跃，爬行器能够找到新的内容并将其添加到名为CAFFINE的索引中-这是一个包含已发现URL的庞大数据库-当搜索者正在寻找该URL上的内容是一个很好的匹配。

什么是搜索引擎索引？

搜索引擎处理和存储他们在索引中找到的信息，这是一个包含他们发现的所有内容的庞大数据库，并且被认为足够好以服务于搜索者。

搜索引擎排名

当有人执行搜索时，搜索引擎会搜索他们的索引以获取高度相关的内容，然后订购该内容以期解决搜索者的查询。按相关性对搜索结果进行的这种排序称为排名。通常，您可以假设网站排名越高，搜索引擎认为该网站与查询的相关性就越高。

可以阻止搜索引擎从您的部分或全部站点爬行器，或指示搜索引擎避免在其索引中存储某些页面。虽然有这样做的原因，但如果您希望搜索者找到您的内容，则必须首先确保爬行者可以访问并且是不可侵犯的。否则，它和看不见一样好。

到本章末尾，您将拥有使用搜索引擎所需的上下文，而不是针对它！

4P-BOO-SEO-CRO网站结构优化-会话率优化

在SEO中，并非所有搜索引擎都是相同的（市场份额有差距）

许多初学者想知道特定搜索引擎的相对重要性。大多数人都知道Google拥有最大的市场份额，但为Bing，Yahoo等进行优化有多重要？事实是，尽管存在超过30个主要的网络搜索引擎，但搜索引擎优化社区实际上只关注Google。为什么？简短的答案是Google是绝大多数人搜索web的地方。如果我们包括Google图像，Google地图和YouTube（Google属性），超过90%的网络搜索发生在Google上-这是Bing和Yahoo合并的近20倍。

爬行：搜索引擎可以找到你的页面吗？

正如您刚刚学到的那样，确保您的网站被爬行和索引是出现在SERP中的先决条件。如果您已经有一个网站，最好先查看索引中有多少页面。这将对Google是否正在爬行并查找您想要的所有页面提供一些很好的见解，而不是您不想要的页面。

检查索引页面的一种方法是“site:yourdomain.com”，一种高级搜索操作员。转到Google并在搜索栏中输入“site:yourdomain.com”。这将返回Google在其指定站点的索引中的结果：

SEO-索引量提升案例-site结果mgshcomcn-2

Google显示的结果数量（请参阅上面的“关于XX结果”）并不准确，但它确实可以让您了解网站上索引了哪些页面以及它们当前如何显示在搜索结果中。

为了获得更准确的结果，请监视和使用Google搜索控制台中的索引覆盖率报告。如果您目前没有一个Google搜索控制台帐户，您可以注册免费的Google搜索控制台帐户。使用此工具，您可以为您的网站提交网站地图，并监控实际添加到Google索引的已提交页面数量等。

如果您没有出现在搜索结果的任何地方，有几个可能的原因：

你的网站是全新的，还没有被爬行。
您的网站未链接到任何外部网站。
您网站的导航使机器人难以有效爬行。
您的网站包含一些称为crawler指令的基本代码，这些代码阻止了搜索引擎。
Google的spammy策略已经对您的网站进行了处罚。

告诉搜索引擎如何爬行您的网站

如果您使用Google搜索控制台或“site:domain.com”高级搜索操作员，发现索引中缺少某些重要页面和/或某些不重要页面被错误索引，则可以实施一些优化以更好地指导谷歌搜索您想要的web内容爬行。告诉搜索引擎如何爬行您的网站可以让您更好地控制最终在索引中的内容。

大多数人都在考虑确保Google可以找到他们重要的页面，但很容易忘记，可能有一些页面您不希望Googlebot找到。这些可能包括内容较薄的旧URL，重复URL（如电子商务的排序和过滤参数），特殊promo代码页面，分期或测试页面等。

要将Googlebot引导远离站点的某些页面和部分，请使用robots.txt。

Googlebot如何处理robots.txt文件

如果Googlebot无法找到网站的robots.txt文件，则会继续爬行网站。

如果Googlebot找到网站的robots.txt文件，它通常会遵守建议并继续爬行网站。

如果Googlebot在尝试访问站点的robots.txt文件时遇到错误，并且无法确定是否存在，则不会爬行站点。

优化爬行预算！又叫爬行深度

爬行预算是Googlebot在离开之前将在网站上爬行的URL的平均数量，因此爬行预算优化可确保Googlebot不会浪费时间在不重要的页面上爬行，从而有可能忽略重要页面。爬行预算在拥有数万个URL的非常大的网站上最为重要，但阻止爬行者访问您绝对不关心的内容绝不是坏主意。只需确保不要阻止crawler访问您添加的其他指令的页面，例如canonical或noindex标签。如果Googlebot被阻止在页面上，它将无法看到该页面上的说明。

并非所有网络机器人都遵循robots.txt。有不良意图的人（例如，电子邮件地址刮擦者）构建不遵循此协议的机器人。事实上，一些坏演员使用robots.txt文件来查找您的私人内容的位置。虽然阻止来自私人页面（如登录页面和管理页面）的爬行者以便它们不出现在索引中似乎是合乎逻辑的，但将这些URL的位置放置在可公开访问的robots.txt文件中也意味着有恶意的人意图可以更容易地找到它们。最好不要打开这些页面的索引并将它们设置在登录表单后面，而不是将它们放在robots.txt文件中。

您可以在我们学习中心的robots.txt部分阅读有关此内容的更多详细信息。

在GSC中定义URL参数

一些网站（最常见于电子商务）通过将某些参数附加到URL来在多个不同的URL上提供相同的内容。如果您曾经在线购物，您可能会通过过滤器缩小搜索范围。例如，您可以在亚马逊上搜索“鞋子”，然后按大小，颜色和样式优化搜索。每次优化时，URL都会略有更改：

https://www.example.com/products/women/dresses/green.htmhttps://www.example.com/products/women?category=dresses&color=greenhttps://example.com/shopindex.php?product_id=32&highlight=green+dress＆cat_id=1＆sessionid=123$affid=43

Google如何知道服务于搜索者的URL版本？Google在自行确定代表性URL方面做得很好，但您可以使用Google搜索控制台中的URL参数功能告诉Google您想要他们如何处理页面。如果您使用此功能告诉Googlebot“使用__参数爬行无URL”，则实质上要求从Googlebot隐藏此内容，这可能会导致从搜索结果中删除这些页面。如果这些参数创建了重复的页面，这就是您想要的，但如果要对这些页面进行索引，则不理想。

爬行者能找到你所有的重要内容吗？

现在你知道了一些确保搜索引擎爬行者远离你不重要内容的策略，让我们来了解可以帮助Googlebot找到你重要页面的优化。

有时搜索引擎将能够通过爬行找到网站的一部分，但其他页面或部分可能由于某种原因而变得模糊。确保搜索引擎能够发现您想要索引的所有内容，而不仅仅是您的主页，这一点很重要。

问自己：机器人可以爬行通过你的网站，而不仅仅是它？

爬虫入门

您的内容是否隐藏在登录表单后面？

如果您要求用户在访问某些内容之前登录，填写表格或回答调查，则搜索引擎将看不到这些受保护的页面。爬行者绝对不会登录。

你依赖搜索表单吗？

机器人不能使用搜索表单。有些人认为，如果他们在网站上放置搜索框，搜索引擎将能够找到访问者搜索的所有内容。

文本是否隐藏在非文本内容中？

非文本媒体表单（图像，视频，GIF等）不应用于显示您希望被索引的文本。虽然搜索引擎在识别图像方面越来越擅长，但不能保证他们能够阅读和理解它。最好在网页的<HTML>标记内添加文本。

搜索引擎可以跟随您的网站导航吗？

正如爬行者需要通过其他网站的链接发现您的网站一样，它需要自己网站上的链接路径来指导它逐页。如果你有一个你想要搜索引擎找到的页面，但它没有链接到任何其他页面，它和隐形一样好。许多站点在以搜索引擎无法访问的方式构建导航时犯了严重错误，阻碍了它们在搜索结果中列出的能力。

链接的可见性-网站导航

常见的导航错误可能会阻止爬行者看到您的所有网站：

移动导航显示的结果与PC桌面导航不同
菜单项不在HTML中的任何类型的导航，例如启用JavaScript的导航。Google在爬行和理解Javascript方面取得了很大进展，但它仍然不是一个完美的过程。确保Google找到，理解和索引某些内容的更安全的方法是将其放在HTML中。
个性化，或者对特定类型的访问者和其他访问者显示独特的导航，可能似乎掩盖了搜索引擎爬行器
忘记通过导航链接到网站上的主页-请记住，链接是爬行者关注新页面的路径！
这就是为什么您的网站必须有清晰的导航和有用的URL文件夹结构。

您是否有干净的信息体系结构？

信息体系结构是在网站上组织和标记内容以提高用户效率和可查找性的做法。最好的信息体系结构是直观的，这意味着用户不必思考通过您的网站或找到什么东西。

你使用sitemaps吗？

sitemap的意思就是：网站上的URL列表，爬行者可以用来发现和索引您的内容。确保Google找到最高优先级页面的最简单方法之一是创建符合Google标准的文件，并通过Google搜索控制台提交。虽然提交站点地图并不能代替对良好站点导航的需求，但它肯定可以帮助爬行者遵循通往所有重要页面的路径。

确保您只包含搜索引擎索引的URL，并确保为爬行者提供一致的方向。例如，如果您已通过robots.txt阻止了该URL，或者在站点地图中包含重复的URL而不是首选的规范版本，则不要在站点地图中包含URL（我们将在第5章中提供有关规范化的更多信息！）。

如果您的网站没有任何其他网站链接到它，您仍然可以通过在Google搜索控制台中提交XML sitemap来对其进行索引。不能保证他们会在索引中包含提交的URL，但值得尝试！

爬虫在尝试访问URL时是否出错？

在您网站上爬行URL的过程中，爬行器可能会遇到错误。您可以访问Google搜索控制台的“爬行错误”报告以检测可能发生这种情况的URL-此报告将显示您服务器错误而未发现错误。服务器日志文件也可以向您展示这一点，以及爬行频率等其他信息的宝库，但由于访问和解剖服务器日志文件是一种更高级的策略，因此我们不会在入门指南中详细讨论它，尽管您可以在这里了解更多信息。

在您对爬行错误报告做出任何有意义的操作之前，了解服务器错误和“未找到”错误非常重要。

4xx代码：当搜索引擎爬行器由于客户端错误而无法访问您的内容时

4xx错误是客户端错误，这意味着请求的URL包含不好的语法或无法满足。最常见的4xx错误之一是“404–未找到”错误。这些可能是由于URL拼写错误，删除的页面或破坏的重定向而发生的，仅举几个例子。当搜索引擎达到404时，他们无法访问URL。当用户达到404时，他们会感到沮丧和离开。

5xx代码：当搜索引擎爬行器由于服务器错误而无法访问您的内容时

5xx错误是服务器错误，这意味着网页所在的服务器未能满足搜索者或搜索引擎访问该页面的请求。在Google搜索控制台的“爬行错误”报告中，有一个专用于这些错误的选项卡。这些通常是因为URL的请求超时，所以Googlebot放弃了请求。查看Google的文档以了解有关修复服务器连接问题的更多信息。

幸运的是，有一种方法可以告诉搜索者和搜索引擎你的页面已经移动了-301（永久）重定向。

301链接跳转

假设你从example.com/young-dogs/移动一页到example.com/puppies/。搜索引擎和用户需要一个桥梁来从旧URL过渡到新URL。该跳转的桥梁就是301重定向。

	使用301	不使用301
链接权重	将老URL的权重转移到新URL上	没有301老的网址.
索引	帮助搜索引擎发现该页面的新URL	出现404报错，影响搜索引擎友好表现，甚至导致被移出索引库，
用户体验	保证用户打开他们搜索到的内容。	用户打开的是404页面，而非目标页面，用户体验极其不友好。

301状态代码本身意味着页面已永久移动到新位置，因此请避免将URL重定向到不相关的页面-旧URL内容实际上不存在的URL。如果某个页面正在为某个查询进行排名，而您将其添加到具有不同内容的URL，则该页面的排名可能会下降，因为使其与该特定查询相关的内容不再存在。301功能强大-负责任地移动URL！

您还可以选择302重定向页面，但这应该保留用于临时移动和传递链接权zhong没有那么大问题的情况。302有点像绕道而行。你暂时通过某条路线吸引交通，但不会永远这样。

小心重定向链！

如果Googlebot必须通过多个重定向，那么它很难访问您的页面。谷歌称这些为“重定向链”，他们建议尽可能地限制它们。如果您将example.com/1重定向到example.com/2，然后再决定将其重定向到example.com/3，最好消除中间人，只需将example.com/1重定向到example.com/3即可。

一旦您确保您的站点针对可爬行性进行了优化，下一步的工作就是确保它可以被索引。

索引：搜索引擎如何解释和存储你的页面？

一旦你确保你的网站已经被爬网，下一步的工作就是确保它可以被索引。这是正确的-仅仅因为你的网站可以被搜索引擎发现和爬网并不一定意味着它会被存储在他们的索引中。在上一节中，我们讨论了搜索引擎如何发现您的网页。索引是存储查找到的页面的位置。爬虫找到页面后，搜索引擎会像浏览器一样呈现页面。在此过程中，搜索引擎会分析该页面的内容。所有这些信息都存储在其索引中。

网站网页索引

继续阅读，了解索引是如何工作的，以及如何确保您的站点能够进入这个至关重要的数据库。

我能看看谷歌机器人爬虫是怎么看我的网页的吗？

是的，页面的缓存版本将反映谷歌机器人上次爬网时的快照。

谷歌以不同的频率抓取和缓存网页。更成熟、更知名的网站，经常发布类似https://www.nytimes.com 将比Roger the Mozbot’s side hustle的知名度低得多的网站更频繁地被爬网，http://www.rogerlovescupcakes…. (要是它是真的就好了……）

通过单击SERP中URL旁边的下拉箭头并选择“缓存”或者“百度快照”，可以查看页面的缓存版本。

您还可以查看站点的纯文本版本，以确定是否有效地对重要内容进行了爬网和缓存。

是否从索引中删除过页面？

是的，可以从索引中删除页面！删除URL的一些主要原因包括：

URL返回“未找到”错误（4XX）或服务器错误（5XX）–这可能是偶然的（页面已移动且未设置301重定向）或故意的（页面已被删除并被404以将其从索引中删除）

URL添加了一个noindex meta标记–站点所有者可以添加该标记，以指示搜索引擎从其索引中省略页面。

该URL因违反搜索引擎网站管理员指南而受到人工处罚，因此从索引中删除。

该URL已被阻止爬行，并添加了访问者访问该页面前所需的密码。

如果您认为您的网站上以前在Google索引中的页面不再显示，您可以使用URL检查工具了解页面的状态，或者使用Fetch as Google，它具有“请求索引”功能，将单个URL提交到索引(额外好处：GSC的“获取”工具还有一个“呈现”选项，允许您查看Google如何解读您的页面是否存在任何问题）。

告诉搜索引擎如何为你的网站编制索引

机器人元指令Robots meta directives

元指令（或“元标记”）是您可以向搜索引擎提供的关于如何处理您的网页的指令。

您可以告诉搜索引擎爬虫“不要在搜索结果中为该页面编制索引”或“不要将任何链接权益传递给任何页面内链接”。这些指令通过HTML页面（最常用）的<head>中的Robots元标记或HTTP头中的X-Robots-Tag执行。

机器人元标签Robots meta tag

robots元标记可以在网页HTML的<head>中使用。它可以排除所有或特定的搜索引擎。以下是最常见的元指令，以及您可能在哪些情况下应用它们。

index/noindex告诉引擎是否应该对页面进行爬网并将其保存在搜索引擎的索引中以便检索。如果您选择使用“noindex”，那么您正在与爬虫程序通信，希望将页面从搜索结果中排除。默认情况下，搜索引擎假定它们可以为所有页面编制索引，因此不需要使用“index”值。

当您可能使用：如果您试图从Google的站点索引（例如：用户生成的配置文件页面）中删除薄页面，但您仍然希望访问者可以访问这些页面，那么您可能会选择将页面标记为“noindex”。

follow/nofollow告诉搜索引擎页面上的链接是否应该被跟踪。”“Follow”会导致机器人跟踪页面上的链接，并将链接权益传递到这些URL。或者，如果您选择使用“nofollow”，搜索引擎将不会跟踪或传递任何链接到页面上的链接。默认情况下，假定所有页面都具有“follow”属性。

当您试图阻止页面被索引以及阻止爬虫跟踪页面上的链接时，nofollow通常与noindex一起使用。

noarchive用于限制搜索引擎保存页面的缓存副本。默认情况下，搜索引擎将维护其索引的所有页面的可见副本，搜索者可通过搜索结果中的缓存链接访问这些页面。

当你可以使用的时候：如果你运行一个电子商务网站，你的价格会有规律的变化，你可能会考虑这个无标签的标签来防止搜索者看到过时的价格。

下面是meta robots noindex、nofollow标记的示例：

<!DOCTYPE html><html><head><meta name=“robots”content=“noindex，nofollow”/><head><body></body></html>

此示例排除了所有搜索引擎对页面进行索引和跟踪任何页面内链接的情况。如果你想排除多个爬虫，比如googlebot和bing，可以使用多个机器人排除标签。

X-机器人标签

x-robots标记在URL的HTTP头中使用，如果您想大规模阻止搜索引擎，则可以提供比元标记更大的灵活性和功能性，因为您可以使用正则表达式、阻止非HTML文件和应用站点范围的noindex标记。

例如，您可以轻松地排除整个文件夹或文件类型（如moz.com/no-bake/old recipes to noindex）：

<Files~“\/？no \-bake\/.*”>标题集X-Robots-Tag“noindex，nofollow”</Files>

robots元标记中使用的衍生工具也可以用于X-robots-tag。

或特定文件类型（如PDF）：

<Files~“\.pdf$”>标题集X-Robots-Tag“noindex，nofollow”</Files>

有关元机器人标签的更多信息，请浏览谷歌的机器人元标签规范。

WordPress提示：

在仪表板>设置>阅读中，确保未选中“搜索引擎可见性”框。这将阻止搜索引擎通过robots.txt文件访问您的站点！

了解影响爬网和索引的不同方式将有助于避免常见的陷阱，这些陷阱会阻止重要页面被发现。

排名：搜索引擎如何对URL进行排名？

搜索引擎如何确保当有人在搜索栏中键入查询时，他们会得到相关的结果？这一过程称为排名，或按与特定查询最相关到最不相关的顺序排列搜索结果。

搜索排名

为了确定相关性，搜索引擎使用算法，一种以有意义的方式检索和排序存储信息的过程或公式。为了提高搜索结果的质量，这些算法多年来经历了许多变化。例如，谷歌每天都会对算法进行调整——其中一些更新是轻微的质量调整，而另一些则是部署用于解决特定问题的核心/广泛算法更新，比如企鹅解决链接垃圾邮件。查看我们的谷歌算法更改历史，查看2000年谷歌已确认和未确认更新的列表。

为什么算法经常变化？谷歌只是想让我们保持警惕吗？虽然谷歌并不总是透露他们为什么这么做的细节，但我们知道谷歌调整算法的目的是提高整体搜索质量。这就是为什么在回答算法更新问题时，谷歌会用“我们一直在进行高质量的更新”这句话来回答。这表明，如果你的网站在算法调整后出现问题，请将其与谷歌的质量指南或搜索质量评分员指南进行比较，从搜索引擎的需求来看，两者都很有说服力。

搜索引擎想要什么？

搜索引擎一直想要的是同样的东西：以最有用的格式为搜索者的问题提供有用的答案。如果这是真的，那么为什么SEO现在看起来和过去几年不同呢？

从学习一门新语言的人的角度来考虑。

一开始，他们对语言的理解非常初级——“看现场直播”。随着时间的推移，他们的理解开始加深，他们学习语义学——语言背后的意义以及单词和短语之间的关系。最终，通过足够的练习，学生对语言的掌握程度足以理解细微差别，甚至能够回答模糊或不完整的问题。

当搜索引擎刚刚开始学习我们的语言时，通过使用与质量准则背道而驰的技巧和战术来游戏系统要容易得多。以关键字填充为例。如果你想为“搞笑笑话”等特定关键词排名，你可以在页面上多次添加“搞笑笑话”字样，并将其加粗，以期提高该术语的排名：

欢迎收看搞笑笑话！我们讲世界上最有趣的笑话。有趣的笑话既有趣又疯狂。你那有趣的笑话还在等着呢。坐下来读有趣的笑话，因为有趣的笑话可以让你快乐和有趣。一些有趣的笑话。

这一策略带来了糟糕的用户体验，人们并没有因为有趣的笑话而大笑，而是被讨厌的、难以阅读的文本轰炸。它可能在过去起作用，但这从来不是搜索引擎想要的。

链接在搜索引擎优化中的作用

当我们谈论链接时，我们可能意味着两件事。反向链接或“入站链接”是指其他网站指向您网站的链接，而内部链接是指您自己网站上指向其他页面（在同一网站上）的链接。

内链外链

链接历来在SEO中扮演着重要角色。很早以前，搜索引擎就需要帮助找出哪些URL比其他URL更可信，以帮助它们确定如何对搜索结果进行排名。计算指向任何给定站点的链接数有助于他们做到这一点。

反向链接的工作原理与现实生活中的口碑推荐非常相似。让我们以一家假设的咖啡店珍妮咖啡店为例：

来自他人的推荐=权威的良好迹象

如，许多不同的人都告诉过你，珍妮的咖啡是城里最好的

自我推荐=有偏见，因此不是权威的好迹象

如，珍妮声称珍妮的咖啡是镇上最好的

来自不相关或低质量来源的推荐=不是权威的好标志，甚至可能让你被标记为垃圾邮件

如，珍妮花钱请从未去过她的咖啡店的人告诉别人咖啡店有多好。

无转介=权限不清

如，珍妮的咖啡可能不错，但你找不到有意见的人，所以你不能确定。

这就是创建PageRank的原因。PageRank（谷歌核心算法的一部分）是一种链接分析算法，以谷歌创始人之一拉里·佩奇的名字命名。PageRank通过测量指向网页的链接的质量和数量来评估网页的重要性。我们的假设是，一个网页越相关、越重要、越值得信任，它所获得的链接就越多。

你从高权威（受信任）网站获得的自然反向链接越多，你在搜索结果中排名越高的几率就越大。

内容在搜索引擎优化中的作用

如果他们不把搜索者引导到某个地方，链接就没有意义了。那就是满足！内容不仅仅是文字；搜索者可以使用任何东西——有视频内容、图像内容，当然还有文本。如果搜索引擎是答案机器，那么内容就是引擎提供答案的手段。

每当有人执行搜索时，都会有数千个可能的结果，那么搜索引擎如何决定搜索者将找到哪些有价值的页面呢？确定页面在给定查询中的排名很大程度上取决于页面内容与查询意图的匹配程度。换句话说，此页面是否与搜索的单词匹配，并帮助完成搜索者试图完成的任务？

由于这种对用户满意度和任务完成的关注，对于内容的长度、包含关键字的次数或标题标签中的内容没有严格的基准。所有这些都会影响页面在搜索中的表现，但重点应该放在阅读内容的用户身上。

如今，排名靠前的三位已经保持了相当的一致性：网站链接（作为第三方信誉信号）、页面内容（满足搜索者意图的优质内容）和RankBrain。

什么是RankBrain？

RankBrain是谷歌核心算法的机器学习组件。机器学习是一种计算机程序，它通过新的观察和训练数据不断改进预测。换句话说，它总是在学习，因为它总是在学习，所以搜索结果应该不断改进。

例如，如果RankBrain注意到排名较低的URL比排名较高的URL为用户提供更好的结果，那么您可以打赌RankBrain会调整这些结果，将更相关的结果移到较高的位置，并将相关性较小的页面作为副产品降级。

排名大脑-谷歌

与搜索引擎的大多数功能一样，我们不知道RankBrain的确切组成部分，但显然，谷歌的员工也不知道。

这对SEO意味着什么？

由于谷歌将继续利用RankBrain来推广最相关、最有帮助的内容，我们需要比以往任何时候都更加专注于实现搜索者的意图。为可能登陆您页面的搜索者提供尽可能好的信息和体验，您已经迈出了在RankBrain世界中表现出色的第一大步。

参与指标：相关性、因果关系，还是两者兼而有之？

Engagement metrics

在谷歌排名中，参与度指标最有可能是部分相关性和部分因果关系。

当我们说参与度指标时，我们指的是代表搜索者如何通过搜索结果与您的站点交互的数据。这包括：

点击（来自搜索的访问）
页面时间（访客离开页面前在页面上花费的时间）
跳出率（用户仅查看一页的所有网站会话的百分比）
Pogo粘滞（点击一个自然搜索结果，然后快速返回SERP选择另一个结果）

谷歌怎么说

尽管谷歌从未使用过“直接排名信号”一词，但谷歌已经明确表示，他们绝对使用点击数据来修改特定查询的SERP。

根据谷歌前搜索质量主管Udi Manber的说法：

“排名本身受点击数据的影响。如果我们发现，对于一个特定的查询，80%的人点击#2，只有10%的人点击#1，过一段时间，我们发现#2可能是人们想要的，所以我们将切换它。”

前谷歌工程师Edmond Lau的另一评论证实了这一点：

“很明显，任何合理的搜索引擎都会使用自己搜索结果上的点击数据反馈到排名中，以提高搜索结果的质量。点击数据的实际使用机制通常是专有的，但谷歌很明显，它在排名调整内容项等系统上使用了带有专利的点击数据。”

由于谷歌需要维护和提高搜索质量，参与度指标似乎不可避免地比相关性更重要，但谷歌似乎没有将参与度指标称为“排名信号”，因为这些指标用于提高搜索质量，而单个URL的排名只是其副产品。

哪些测试证实了这一点

各种测试已经证实，谷歌将调整SERP顺序，以响应搜索者的参与：

兰德·菲什金（Rand Fishkin）2014年的测试结果是，在约200人点击SERP的URL后，7分的结果上升到1分。有趣的是，排名的提高似乎与访问链接的人的位置无关。在美国，许多参与者所在地的排名上升，而在谷歌加拿大、谷歌澳大利亚等地，排名仍然较低。
拉里·金（Larry Kim）对排名靠前的页面及其在RankBrain前后的平均停留时间进行的比较似乎表明，谷歌算法中的机器学习部分降低了人们花费较少时间的页面的排名。
Darren Shaw的测试也显示了用户行为对本地搜索和地图包结果的影响。

由于用户参与度指标明确用于调整SERP的质量，并将位置变化列为副产品，因此可以肯定地说SEO应该针对参与度进行优化。参与并不会改变网页的客观质量，而是相对于该查询的其他结果，你对搜索者的价值。这就是为什么，在你的页面或其反向链接没有改变后，如果搜索者的行为表明他们更喜欢其他页面，那么排名可能会下降。

就网页排名而言，参与度指标就像一个事实检查器。客观因素，如链接和内容，首先排名页面，然后参与度指标帮助谷歌调整，如果他们没有得到正确的。

搜索结果的演变

当搜索引擎缺乏今天的成熟度时，“10个蓝色链接”/10个自然搜索/10个自然排名，10 blue links一词被用来描述SERP的扁平结构。任何时候进行搜索，谷歌都会返回一个包含10个有机(自然搜索)结果的页面，每个结果的格式都相同。

谷歌自然排名

在这种搜索环境中，占据#1位置是搜索引擎优化的圣杯。但后来发生了一些事情。谷歌开始在搜索结果页面上添加新格式的结果，称为SERP功能。其中一些SERP功能包括：

付费广告
首条特色显示
用户还搜索了
本地（地图）包
相关搜索
站点链接

谷歌一直在增加新的搜索引擎。他们甚至尝试了“零结果SERP”，这是一种现象，即SERP上只显示知识图中的一个结果，除“查看更多结果”选项外，下面没有任何结果

由于两个主要原因，这些特性的增加引起了一些最初的恐慌。首先，这些特征中的许多导致了SERP上的有机结果被进一步向下推。另一个副产品是，由于SERP本身回答了更多的查询，点击有机结果的搜索者越来越少。

那么谷歌为什么要这么做呢？这一切都要追溯到搜索体验。用户行为表明，不同的内容格式可以更好地满足某些查询。注意不同类型的SERP特性如何匹配不同类型的查询意图。

搜索意图	可能的SERP触发
信息	精选摘要
含答案需求的信息	知识图谱/ 及时回答
本地信息	地图pack
交易	商店

我们将在第3章中更多地讨论意图，但现在，重要的是要知道答案可以以多种格式提供给搜索者，并且你如何构建你的内容会影响它在搜索中出现的格式。

本地化搜索

像谷歌这样的搜索引擎有自己的本地商业列表专有索引，并从中创建本地搜索结果。

如果您正在为客户可以访问的实体位置（例如：牙医）或前往拜访客户的企业（例如：水管工）执行本地搜索引擎优化工作，请确保您申请、验证并优化免费谷歌我的企业列表。

对于本地化搜索结果，谷歌使用三个主要因素来确定排名：

相关性
距离
知名度

距离

谷歌利用你的地理位置更好地为你提供本地搜索结果。本地搜索结果对邻近性非常敏感，邻近性指的是搜索者的位置和/或查询中指定的位置（如果搜索者包括一个）。

有机搜索结果对搜索者的位置很敏感，但很少像本地搜索结果那样清晰。

知名度

以卓越为因素，谷歌希望奖励在现实世界中知名的企业。除了企业在线下的突出地位外，谷歌还考虑一些在线因素来确定本地排名。

当地企业收到的谷歌评论的数量以及这些评论的情绪，对他们在当地结果中排名的能力有着显著的影响。

引证

“商业引文”或“商业清单”是指在本地化平台（Yelp、Acxiom、YP、Infogroup、Localeze等）上，对本地企业“NAP”（姓名、地址、电话号码）的基于网络的引用。

本地排名受本地商业引文数量和一致性的影响。谷歌从各种来源获取数据，不断编制本地商业指数。当谷歌发现一家企业的名称、位置和电话号码有多个一致的引用时，它就增强了谷歌对该数据有效性的“信任”。这就使得谷歌能够以更高的信心展示自己的业务。谷歌还使用网络上其他来源的信息，如链接和文章。

自然排名

SEO最佳实践也适用于本地SEO，因为谷歌在确定本地排名时也会考虑网站在有机搜索结果中的位置。

在下一章中，您将在页面上学习帮助谷歌和用户更好地理解您的内容的最佳实践。

[奖金！]当地参与

虽然谷歌没有将参与度列为本地排名因素，但随着时间的推移，参与度的作用只会越来越大。谷歌通过整合真实世界的数据，如热门访问时间和平均访问时间，继续丰富本地搜索结果。。。

受欢迎的次数

…甚至为搜索者提供了询问业务问题的能力！

A screenshot of the Questions & Answers result in local search.

毫无疑问，现在比以往任何时候都更受现实世界数据的影响。这种交互性是搜索者如何与当地企业互动并对其作出反应，而不是纯粹的静态（和可玩游戏的）信息，如链接和引用。

由于谷歌希望向搜索者提供最好、最相关的本地业务，因此他们使用实时参与度指标来确定质量和相关性是非常有意义的。

你不必知道谷歌算法的来龙去脉（这仍然是个谜！），但是到现在为止，您应该已经对搜索引擎如何查找、解释、存储和排列内容有了很好的基础知识。有了这些知识，让我们来学习如何在第3章（关键词研究）中选择您的内容所针对的关键词！