谷歌搜索权重

概述:

Google供给了一个敞开的URL,你能够经过它\"ping\"一个XML站点地图,他们会获取并对其进行解析的,该文件能够包括一些索引指令。我发现,关于任何敞开重定向的网站(例如,LinkedIn,Facebook和其他1000多个电子商务网站),你能够ping一个你(进犯者)自己的站点,Google会把这个过错站点作为你要仿冒的闻名站点。

我在一个在新的网站经过hreflang指令将测验了这个bug(原本没有希望能有啥好的作用),没想到很快,就将它推到美国重金主题的谷歌查找成果的前几页中,使站点看起来像是归于一个大型英国电子商务网站。
现在谷歌现已修正这个问题,并奖赏我了1337美元的bug bounty。我信任这或许是第一次在他们在实践查找引擎中上给出的安全问题奖赏,由于这个bug直接影响到网站的排名。
作为我的日常研讨工作的一部分,我最近发现了一个问题,答应进犯者向Google提交一个XML站点地图,以查找未被谷歌录入的的站点。由于这些文件能够包括索引指令,如hreflang,因而进犯者能够运用这些指令协助自己的网站在Google查找成果中的排名。
为了测验,我仅仅花了12美元就完成了我测验环境的建立,将一个新注册的没有任何入站链接的域名,推在了谷歌查找成果的尖端收费查找主题的第一页排名。
XML 站点地图和Ping机制
Google答应经过提交XML网站地图,用于协助引擎爬虫自动发现URL,他还答应运用hreflang指令用于翻译一个页面国际化的各不同言语版别的内容(例如,\"hey Google, this is the US page, but I have a German page on this URL…\")。现在还不清楚Google是怎么运用解析和运用这些指令的(就像任何与Google查找算法相关的指令相同),但好像hreflang答应一个URL从另一个URL \"借用\"索引权重和将一个已有URL的索引权重用于另一个URL(比方大多数人链接到US.com版别,可是德国版的版别能够借用这个权重,以便在Google.de中取得更好的排名)。
你能够经过Google Search Console,在robots.txt中或经过特别的\"ping\"URL,为你的域名提交XML 站点地图。谷歌自己的文档好像有点对立。在页面的顶部,他们主张是经过ping机制提交站点地图,但在页面的底部又对此宣布正告:

可是,依据经历判别,你完全能够经过ping机制提交一个新的XML站点地图,Googlebot一般在ping后的10-15秒内获取文件。重要的是,Google在页面上也提到过几回,假如你经过ping机制提交站点地图,它将不会显现在你的查找Console中:

作为一个相关测验,我测验了是否能够经过XML站点地图增加其他已知的查找指令(比方noindex,rel-canonical),以及测验一堆XML进犯,但好像对Google并没有运用到。
Google Search Console(GSC)提交
假如你测验在GSC中提交XML站点地图,并且其间包括了你未被授权的其他域的URL,则GSC会回绝他们:

敞开重定向
许多网站运用URL参数来操控重定向:

在这个比如中,我将被重定向(登录后)到page.html。安全约束欠好的网站答应运用所谓的\"敞开重定向\",这些参数答应重定向到不同的域:

一般不需要任何交互(如登录),所以会当即将用户重定向:

敞开重定向十分遍及,一般认为不有什么危险;由于这些原因,Google也没有将他们归入到bug奖赏方案中。可是,在或许的状况下,企业应该会尽量避免这些状况发作,但你一般能够绕过他们的维护:

Tesco是一家英国零售商,收入超越500亿英镑,超越10亿英镑的收入来自其网站。我向特易购(Tesco)陈述了这个比如(还有在我的研讨中发现的其他公司),他们现已修正了这个问题。
经过翻开重定向Ping Sitemaps
现在,你或许现已猜到了我要测验的办法。事实证明,当你ping一个XML站点地图时,假如你提交的URL是一个重定向,谷歌将跟着他重定向,即使跨域了。并且,它好像还将该XML站点地图与进行重定向到域进行相关,并将重定向后发现的站点地图视为该域的授权。例如:

本例中,evil.xml站点地图保管在blue.com上,但Google会将其相关为green.com的所有权并为其授权。运用此功用,你能够为没有权限的网站提交XML站点地图,并发送Google查找指令。
试验:运用hreflang指令免费\"盗取\"权重排名
现在我了知道了各个细节部分,可是还没有证明谷歌会真的信任跨域重定向的XML站点地图,所以我做了一个试验来测验它。我还做了许多更小的测验来了解了解(或许能各种绝路)各部分,但并没有盼望这个试验能够像预期的那样行得通。
我为一家没有在美国运营的英国零售公司创建了一个虚伪域名,并且在AWS服务器上创建了一个仿照该网站(主要是经过搜集合法内容并对其进行从头规划,例如修正钱银/地址等)。为了维护他们,在此我藏匿公司名(和职业),咱们权且称他为victim.com。
我在evil.com上创建了一个虚伪的站点地图,只包括victim.com的URL。这些URL包括hreflang条目指向evil.com上等效URL,标明victim.com的美国版别。现在,我用Google的ping机制经过victim.com上的敞开重定向URL提交了网站地图。
在48小时内,该网站开端有了少数来自于查找引擎为长尾拜访(SEMRush屏幕截图):

再过两天,能够有相关主题的成果第一页上开端呈现,同页上有如亚马逊和沃尔玛等。

此外,evil.com的Google Search Console也显现victim.com正在链接到evil.com,但实践上这显着是不对的:

一起,我还发现我也能在evil.com的GSC中为victim.com提交XML站点地图:

Google好像已将这些网站链接起来,在evil.com的GSC现在有些功用能够影响victim.com的设置。我现在也能够盯梢我提交的站点地图的索引(你能够看到我现在有数千页索引)。
Searchmetrics显现了流量的增加和其价值:

此站点的GSC显现经过Google有超越100万的查找,展现次数和超越10,000次点击次数;但是,除了提交XML站点地图,我什么都没做!
注意到,我并没有对这个evil站点做任何展现,假如想要运用他来诈骗人们点击的话,应该能够赚许多钱。或许经过设置广告,乃至还能够想办法把这种流量变现。在我看来,这给Google拜访者带来了严峻的危险,一起也给依靠Google查找流量的公司带来了危险。拜访量还在增加,但我封闭了我的试验站,并抛弃了后续试验,由于惧怕形成损害。这是一个真实黑客应该具有的职业道德,点赞。
评论
关于victim.com来说,这种办法完全无法检测,XML站点地图不会显现在他们的终端,假如有人做了想我做事情的,并且用它获取经济利益的话,那么也没有啥办法监控的到。除了你的竞争对手会对你的站点排名感到不行思意外。(如上面比如中的亚马逊,沃尔玛和塔吉特等的查找成果,他们可都是花了重金才拿到那个方位的)。
就黑帽SEO而言,这是一个清晰的用法,并且这使我意识到对算法缝隙的完全运用第一个比如,而不是操作其他排名因子。这个问题的潜在财政影响的也并非微乎其微,幻想一下以特易购或相似网站为方针的潜在赢利(假如有时机我会做更多的测验以便搜集信息,但会严厉约束在没有任何潜在的损害的状况下)。
Google现已为此奖赏了1337美元的奖金,自始自终,于Google团队打交道十分高兴,感谢他们。
发表时间表
•2017年9月23日,我提交开始的bug陈述。
•2017年9月25日,谷歌回应 - 他们调整了bug并正在研讨它。
•2017年10月2日,我发送了更多细节。
•10月9日到11月6日,一些来回状况更新。
•2017年11月6日 - 谷歌表明:\"本陈述难以断定能够采纳哪些办法来避免此类行为及其对查找成果的影响。我已与团队联络以取得终究决议。正对你的陈述,他们一向在对数据进行挑选,以断定你描绘的行为有多遍及,以及这是否应该当即采纳相应办法。\"
2017年11月6日,我回复说,他们没有遵从针对ping的站点地图的跨域重定向,没有什么好的理由,它或许仅仅GSC的仅有功用。
2018年1月3日,我要求更新状况。
2018年1月15日,谷歌查找回复道:\"关于延期抱愧,我不想过早完毕这份陈述,由于咱们还无法做出清晰的决议,是否能够用重定向链处理这种行为而不会损坏许多合法用例。我现已回到团队检查这份陈述以得到终究答案,我现已回到团队检查这份陈述以取得终究答案,并会在本周回复你。\"

您可能还会对下面的文章感兴趣: