美国司法部最近公开了几个之前调查Google反垄断的材料,包含排名相关的Google 内部资料。
排名相关的资料还是挺有价值,虽然是2016年的资料,Google的算法也更强大,不过可以理解大概的算法框架。
第一个图是排名的 3 个支柱:
* 内容正文:网页本身的内容
* 锚文本:互联网上对网页的评价
* 用户交互:用户对网页的评价
对于用户交互,Google 有一段说明:在某些地方,Google 可能会用『点击』来代替『用户交互』。用户交互包括点击、关注结果、在轮播上滑动以及输入新查询。
第二张图是『用户交互信号』。
Google 展示了查询、搜索结果和用户交互的流程关系。
这里的用户交互有:阅读、点击、滚动、鼠标悬停hover。
可见,用户交互并不是单独靠点击,还有更多的用户行为。
注:前两张图来自第一份文件,是 Google 的埃里克·莱曼 (Eric Lehman) 整理而成,有大量遮挡,只露出少部分。
下面一些图是雷曼兄弟准备的 2016 年第四季度 Search All Hands 大型演示的一部分。
第三张图,标题就是:Google 称“我们并不理解文档,我们只是假装理解”
“如今,我们直接理解文档的能力还是非常弱。
所以我们会观察人们对网页的反应,然后记住他们的反应。
让我们从一些背景开始。
每天有十亿次,人们要求我们查找与查询相关的网页。
疯狂的是,我们实际上并不理解网页。除了一些基本的东西之外,我们几乎不看文档。我们看人。
如果一份网页得到积极的反应,我们就认为它是好的。如果反应呈消极,则可能是坏的。
非常简单,这就是谷歌魔力的源泉。”
第四张图,每个搜索者如何从过去用户的反应中受益,并贡献有利于未来用户的反应
“
搜索通过归纳持续运行。
在设计用户体验时,仅仅为用户服务是不够的。
我们必须设计能够让我们向用户学习的交互。
因为这就是我们如何为下一个用户服务的方式,保持持续滚动,维持假装理解的状态。
展望未来,我相信向用户学习也是真正理解语言的关键。”
在下一页,Google也说“当假装理解失败时,我们看起来很愚蠢。”
第五张图 搜索质量的 18 个因素:
相关性、网页质量、流行度、更新度、本地化、语言、中心行、话题多样、个性化
网络生态系统、移动友好、社会公平、可选择性、色情降级、垃圾内容、权威度、隐私、用户控制拼写更正
第6~8张图是 Google 工作原理中的魔法
第六张图,Google 收到查询,评分系统发出数据,再接合用户体验,把SERP展示给用户。
这个是不完整的流程,因为无法很好工作,没有魔法。
第七张图,加入了用户的回流,这样才是完整流程。
关键就是用户反向的信息流。
当用户跟搜索交互时,他们的行为带给搜索引擎很多信息。
第八张图,就更完整了。
Google的魔法来源是跟用户的双向对话。
每一次查询,Google都会提供信息,然后从用户那里获取回报。
然后把魔法加入到下一次的信息中,并得到下一轮的回报。
这些加起来,经过几千亿轮之后,看起来就很聪明了。
这个不是唯一的学习方式,但确实最有效的。
(这个跟上面的用户数据的使用是吻合的;还有一张图是Google对用户交互log的记录,也是其中的实现方式)
还有一个pdf是搜索团队内部的一系列邮件,展示了他们如何确保广告团队不会影响 organic 自然排名。其中 Google 团队的 Danny Sullivan、Paul Haahr、Pandu Nayak都在其中。
pdf链接:https://www.justice.gov/d9/2023-10/417243.pdf
参考链接:
https://searchengineland.com/google-search-ranking-documents-434141
https://www.seroundtable.com/google-3-pillars-of-ranking-36340.html
https://twitter.com/CyrusShepard/status/1720159105917280559
文章来源:https://articles.zsxq.com/id_dgiwvpd6u1u7.html
还没有评论,来说两句吧...