反垄断审判中暴露的 Google 搜索排名文件

老丁

2023-12-21 467阅读 0评论

美国司法部最近公开了几个之前调查Google反垄断的材料，包含排名相关的Google 内部资料。

排名相关的资料还是挺有价值，虽然是2016年的资料，Google的算法也更强大，不过可以理解大概的算法框架。

EPDXT~5NP_JVF6QGRLQ%O}E.png

第一个图是排名的 3 个支柱：

* 内容正文：网页本身的内容

* 锚文本：互联网上对网页的评价

* 用户交互：用户对网页的评价

对于用户交互，Google 有一段说明：在某些地方，Google 可能会用『点击』来代替『用户交互』。用户交互包括点击、关注结果、在轮播上滑动以及输入新查询。

E%7U]%L)TX%VLWU[RLN4HYG.png

第二张图是『用户交互信号』。

Google 展示了查询、搜索结果和用户交互的流程关系。

这里的用户交互有：阅读、点击、滚动、鼠标悬停hover。

可见，用户交互并不是单独靠点击，还有更多的用户行为。

注：前两张图来自第一份文件，是 Google 的埃里克·莱曼 (Eric Lehman) 整理而成，有大量遮挡，只露出少部分。

下面一些图是雷曼兄弟准备的 2016 年第四季度 Search All Hands 大型演示的一部分。

$__1{CTLR{0K]KG[Y3H~Z}BB.png$

第三张图，标题就是：Google 称“我们并不理解文档，我们只是假装理解”

“如今，我们直接理解文档的能力还是非常弱。

所以我们会观察人们对网页的反应，然后记住他们的反应。

让我们从一些背景开始。

每天有十亿次，人们要求我们查找与查询相关的网页。

疯狂的是，我们实际上并不理解网页。除了一些基本的东西之外，我们几乎不看文档。我们看人。

如果一份网页得到积极的反应，我们就认为它是好的。如果反应呈消极，则可能是坏的。

非常简单，这就是谷歌魔力的源泉。”

QWW8D16`CVF~@KFU8N~66DQ.png

第四张图，每个搜索者如何从过去用户的反应中受益，并贡献有利于未来用户的反应

“

搜索通过归纳持续运行。

在设计用户体验时，仅仅为用户服务是不够的。

我们必须设计能够让我们向用户学习的交互。

因为这就是我们如何为下一个用户服务的方式，保持持续滚动，维持假装理解的状态。

展望未来，我相信向用户学习也是真正理解语言的关键。”

在下一页，Google也说“当假装理解失败时，我们看起来很愚蠢。”

$HCMZTVG3APCI@7YA[}JAXS.png

第五张图搜索质量的 18 个因素：

相关性、网页质量、流行度、更新度、本地化、语言、中心行、话题多样、个性化

网络生态系统、移动友好、社会公平、可选择性、色情降级、垃圾内容、权威度、隐私、用户控制拼写更正

{@[@RR01`K9T%{TV%7TA5}D.jpg

第6~8张图是 Google 工作原理中的魔法

第六张图，Google 收到查询，评分系统发出数据，再接合用户体验，把SERP展示给用户。

这个是不完整的流程，因为无法很好工作，没有魔法。

][WX[3]$]~$~M9C`C6$Z{(R.jpg

第七张图，加入了用户的回流，这样才是完整流程。

关键就是用户反向的信息流。

当用户跟搜索交互时，他们的行为带给搜索引擎很多信息。

${V3ZGVVI_4}CFH4AWT{IA%G.jpg$

第八张图，就更完整了。

Google的魔法来源是跟用户的双向对话。

每一次查询，Google都会提供信息，然后从用户那里获取回报。

然后把魔法加入到下一次的信息中，并得到下一轮的回报。

这些加起来，经过几千亿轮之后，看起来就很聪明了。

这个不是唯一的学习方式，但确实最有效的。

（这个跟上面的用户数据的使用是吻合的；还有一张图是Google对用户交互log的记录，也是其中的实现方式）

还有一个pdf是搜索团队内部的一系列邮件，展示了他们如何确保广告团队不会影响 organic 自然排名。其中 Google 团队的 Danny Sullivan、Paul Haahr、Pandu Nayak都在其中。

pdf链接：https://www.justice.gov/d9/2023-10/417243.pdf

参考链接：

https://searchengineland.com/google-search-ranking-documents-434141

https://www.seroundtable.com/google-3-pillars-of-ranking-36340.html

https://twitter.com/CyrusShepard/status/1720159105917280559

文章来源：https://articles.zsxq.com/id_dgiwvpd6u1u7.html

CentOS 7.9 配置 Python3的 selenium环境

Google Search Console API 使用体验

相关阅读

反垄断审判中暴露的 Google 搜索排名文件

一周SEO资讯和分享：9月实用内容更新上线|Google工程师透露15个SEO要点

SEO做市场分析的3种方法

大型网站如何建立 SEO 体系

【又见更新】Google 9 月实用内容更新上线

一周SEO资讯和分享：8月核心算法上线完成 | 15个最常犯的SEO技术问题

一周SEO资讯和分享：8月核心算法影响不大|那些屏蔽GPTBot的热门网站

[突发]Google 发布8月份的核心算法更新|你会屏蔽GPTBot吗|AI内容会被重写

发表评论取消回复

评论列表（暂无评论，467人围观）

还没有评论，来说两句吧...