谷歌RankBrain:清除讹传和误解 这是近3年半以来谷歌首次宣布他们对RankBrain的使用 (2015年10月26日,其实它在2015年初已经开始以多种语言推出了)。 在这段时间里,关于G是什么或它是如何工作的细节几乎没有。 其结果是,许多SEOs已经站出来用他们自己的猜测和观点来填补这一空白,而这样做已经引起了各种各样的困惑。 这是我纠正和清理一些那种混乱的意图。 (如果想跳过冗长的文字:D,在底端有一个TL:DR。) RankBrain是做什么的? 虽然没有太多的公开资料,但我们所拥有的是相当具体的: “如果RankBrain看到一个自己不熟悉的单词或短语,它就能猜测出哪些单词或短语可能有类似的意思,并据此过滤结果,从而更有效地处理从未见过的搜索查询。” - Greg Corrado,来自彭博谷歌,将其利润丰厚的网络搜索业务转向人工智能 如果想要更简洁的; 。。。。。让我最后试一次:Rankbrain让我们更好地理解查询……” ---Gary Illyes (@methode),推特 谷歌每天都会收到相当一部分以前没有见过的查询: 上一次检查为15%。 这些可能包括拼写错误、打字错误、省略/遗漏、不寻常的短语/句法结构、使用了错误的单词、刚刚才发生的一些否定(“不是x”)等等。 RB接收这些怪异、奇妙的新的搜索,并企图识别可能适合搜索者查询的现有搜索和结果。 RankBrain是如何工作的? 再说一次,我们并没有得到G精确的指导,但有一些零碎的东西。 RankBrain使用人工智能将大量的书面语言嵌入到计算机能够理解的数学字符实体——向量中。如果RankBrain看到一个自己不熟悉的单词或短语,它就能猜测出哪些单词或短语可能具有类似的意思,并相应地过滤结果,从而更有效地处理从未见过的搜索查询……” -----Greg Corrado,来自彭博社:谷歌将其利润丰厚的网络搜索转向人工智能机器 因此,它不是查看单词并试图解析并理解它们的语义(传统的自然语言处理[NLP]),而是将它们转换成数字并绘制在图表上(具有多个维度,而不仅仅是X和Y)。 互相靠近的项目具有些种形式上的关系。这种关系的类型将反映在每个术语的位置和与相邻术语的距离上。 如果这听起来有点耳熟,那是因为它听起来很像Word2Vector。 因此,当G接收到一个它不能完全识别的查询时,可以找到语义上相关的部分,并查看结果。 但如果它是错的呢? 这就是Gary Illyes最近在Reddit AMA上对一个问题的回答: “… “……。” RankBrain是一个性能超好的机器学习等级元件,它使用了历史搜索数据来预测用户最有可能点击的东西来搜索一个以前从未见过的查询。这是一个非常出色的设计,无论何时传统的翻译诸如“oh look a “不是“在查询字符串之内,忽略不在内的词”,但它通常只是依赖(有时)几个月前的数据,即搜索结果页面本身发生了什么,而不是登陆页面。停留时间,点击率等等,这些通常都是废话。搜索比人们想象的要简单得多。 …” ……” 我已经加粗了字体,让关键部分引起你的注意。 G可能会追溯,查看不同的搜索都点击了什么,并检查它们的性能。这可以帮助系统了解哪些建议是合适的,哪些建议是失败的。 如果想要更多肉东西,你可能一直等待一些专利? 如果是这样,我很幸运地从比尔·斯劳斯基(Bill Slawski)那里得到了一些帮助。 在高维空间中计算单词的数值表示法,以及 使用概念作为查询项替换的上下文 第一项专利(计算数值……)是由格雷格·科拉多(Greg Corrado)完成的,他引用了彭博社之前的引用。 如果你不喜欢忍受阅读专利带来的痛苦,比尔有两个更好的后台智能传输服务,可以让你在不需要止痛药的情况下获得真知灼见: 引用谷歌Brain Word Vector方法,并调查谷歌RankBrain和查询词替换 研究谷歌RankBrain和查询术语替换 RankBrain的例子 我们来简单演示一下RB所做的事情怎么样? 查询:Nemee 2020 怎样? 谷歌接收到该查询,没有任何匹配项,也没有任何与上文有关的选项。 因此,需要做一些工作。 可以使用“how”来识别查询的类型。 可以在“2020年”之前确定一个时间因素。 或者可以识别出“nemee”的几种可能性,包括“meme”。 查询是向量化的,并且找到了这些向量的最相邻的元素。 结果中包含的向量表示: “How to” “如何” “how do I” “我怎样” “how do people”:“人们怎样” “create a meme” “创建一个meme” “pronounce meme” “meme发音” “say meme” “说meme” So we have two probable query types: 所以我们有两种可能的查询类型: A question of how to say … 一个如何说……的问题。 A question of how to make … 一个如何使……的问题。 但我们还有第三个因素,“2020”。当我们查看结果组时,几乎没有任何预先存在的查询或包含发音时间的结果,只有适量的“如何”查询和执行查询的结果。 RB决定最可能匹配此查询的结果是来自“如何生成”查询的结果,因此你将收到匹配的结果; “如何制作模因meme 2020”。 RankBrain使用用户体验信号吗? 这就是这篇文章所包含内容——清除一些人一直在推的“停留时间”、“点击率”和“反弹”等无意义的事。 RankBrain不使用来自页面的UX信号。 快速的确认; “……停留时间,点击率,……这些通常都是废话……” 以上是我引用的Gary对AMA的回应。 但在这一点上,你可以己运用一些常识。 问自己以下问题: 为什么一个试图概述文本字符串之间关系的系统方法会关注用户在一个页面上花费的时间,或者他们多久离开页面的? 当你停下来以这种方式查看它,并考虑上面的示例时,可以看到基于站点的UX信号与RankBrain没有关联。 我们所知道的他们可能使用的唯一此类度量标准是以SERP为基础的点击,以确定与该类型查询相关的结果类型。 你能优化RankBrain吗? 是的。 谷歌甚至告诉我们,我们可以 但如果稍微回滚一点,G实际上已经说明了如何优化RankBrain! “……如果RankBrain看到一个它不熟悉的单词或短语……” “……让它更有效地处理从未见过的搜索查询……” “……预测用户最可能点击什么来查询一个以前没有看到过的问题……” 你所要做的就是面对搜索引擎优化实践的标准,并以你通常会追求的——高搜索量完全相反为目标。 相反,查看所有的查询,然后生成列表中没有的变体积。 我知道,那更傻! (但是,说实话,你确实想知道:D) 但还有更多——尤其是那些处理与时间相关内容的网站;项目和事件。 由于这些都是“新”的,查询可能会过度(至少部分是)。为了在这方面获得优势,可以自己查看类似的搜索,并查看它们所具有的模式。一旦有了一些样本和相关的搜索量数据,就可以挑选出你认为最有利和相关的样本,然后把它们编入你的内容。 如果想对RB以及像关联规则学习(更深入地研究事物的计算方面)这样的事情有进一步深入了解,Dan Taylor之前的一篇文章可能会让你感兴趣:下面是RankBrain如何影响SEO(以及如何不影响SEO) RankBrain会影响排名吗? 不——这是一个包容的问题。 虽然谷歌表示RB是最具影响力的排名因素之一,但它并不是一个典型的SEO因素。 与标题或链接文本不同,它不是渐变或变量——它是布尔值。 要么你被认为是相关的,并包含在用于查询的SERPs中——要么不是。 因此你可以优化RankBrain——但这不是排名影响的问题,而是索引包含的问题。 RB是做什么的? 它企图通过查看以前的搜索数据和这些搜索中使用的术语之间的关系来回答未知的查询。 RB是怎么做到的? 通过将单词转换成数字并将它们绘制成向量空间。 接着,它可以将查询分解为多个部分,并在向量空间中寻找类似的术语,以尝试理解搜索的关系和潜在意图。 例子: 查询:“如何实现nemee 2020” 将查询转换为向量,找到最近的向量,尝试计算可能的匹配。 出现了两种不同的查询类型;“创造”和“讲述”。 “2020”与“创造”的联系比与“讲述”的联系更紧密。 RB将为“how to make a meme 2020”返回SERPs。 RB使用UX吗? 不。 它处理单词和向量。 不使用弹出率、长点击等。 你能优化RB吗? 是的。 通过自然写作并确保内容包含变化。 对于某些内容(事件/事件/新闻)的类型,或许可以检查类似的搜索并获胜。 RankBrain会影响排名吗? 不是传统意义上的SEO。它不是关于“位置”的,而是关于你是否显示该查询。 |
Archiver|手机版|小黑屋|WebHostingTalk中文站
GMT+8, 2024-4-26 21:45 , Processed in 0.048139 second(s), 15 queries .
Powered by Discuz! X3.4
Copyright © 2001-2024, Tencent Cloud.