谷歌熊猫算法为什么这么厉害
了解关于谷歌熊猫你需要知道的一切。看看它为什么被推出,我们知道的算法和一个完整的时间表。
谷歌熊猫2011年2月首次推出,作为谷歌寻求消除黑帽SEO策略和网络垃圾邮件的一部分。
当时,用户抱怨“内容农场”的影响力越来越大。
随后出现了熊猫算法,用于给页面分配质量分类,在内部使用并模仿人类质量评级,作为排名因素。
快进到2021年,你现在可以看到这是多么重要,作为谷歌的第一步重点关注质量和用户体验。
这里是你需要知道的关于谷歌熊猫的一切——关于它为什么推出的更多信息,你需要知道的关于算法的更多信息,以及一个完整的时间表。
为什么谷歌创造了熊猫
2010年,谷歌搜索结果质量的下降和“内容农场”商业模式的兴起成为反复流传的话题。
正如谷歌的阿密特·辛格哈尔后来所说有线的在TED,“咖啡因”更新在2009年末,它极大地提高了谷歌快速索引内容的能力,也将“一些不太好的”内容引入了他们的索引。
谷歌的马特·卡茨告诉《连线》杂志,这个新的内容问题并不是真正的垃圾邮件问题,而是一个“我能做的最起码的事情不是垃圾邮件吗?”
读写网指出:
“到[2009]年底,其中两个内容农场——Demand Media[eHow infamy]和Answers.com——根据comScore的测量,已经在美国前20大网站中站稳了脚跟。Demand Media是内容农场的缩影,也是迄今为止最大的内容农场,每天生产7000条内容……该公司的运营基于一个简单的公式:创建大量针对搜索引擎的小众、大多缺乏创意的内容,然后通过社交软件传播,并通过广告赚很多钱。”
2011年1月,商业内幕发表了一个标题这说明了一切:谷歌的搜索算法已经被毁了,是时候回归监管了。
在…里另一篇文章,他们指出:
“Demand(Media)正在利用谷歌生态系统进行一次大规模套利,这是最聪明的伎俩。Demand与成千上万的自由职业者签订合同,生产成千上万的低质量内容,这些内容的主题是根据它们的搜索价值选择的,其中大多数是由谷歌驱动的。因为谷歌的算法将多产和稳定的内容置于高质量内容之上,所以谷歌的算法将需求内容放在搜索引擎结果页面的较高位置。
毫无疑问,类似这样的标题极大地影响了谷歌,谷歌通过开发熊猫算法做出了回应。
谷歌熊猫更新发布
熊猫于2011年2月23日首次推出。
2月24日,谷歌发布了一份关于更新的博客帖子,并表示他们“对我们的排名进行了相当大的算法改进——这一变化显著影响了我们11.8%的查询。”
更新的明确目的如下:
“此次更新旨在降低低质量网站的排名,这些网站对用户来说价值低,从其他网站或不太有用的网站复制内容。同时,它将为高质量的网站提供更好的排名——这些网站拥有原创内容和信息,如研究、深度报告、深思熟虑的分析等。”
搜索引擎土地创始人丹尼·沙利文最初将其称为“农民”更新。然而,谷歌后来透露,它在内部被称为“熊猫”,这是提出主要算法突破的工程师的名字。
SearchMetrics和SISTRIX(以及其他公司)对“赢家和输家”的分析发现,受打击最严重的网站对当时从事SEO行业的人来说都很熟悉。
这些地点包括wisegeek.com、ezinearticles.com、suite101.com、hubpages.com、buzzle.com、articlebase.com等等。
值得注意的是,内容农场eHow和wikiHow在更新后做得更好。随后的更新也会伤害这些更“可接受”的内容农场,导致需求媒体的流失640万美元在2012年第四季度。
SEO行业最明显的变化是它对“文章营销”的严重打击,SEO从业者过去常常在ezinearticles.com这样的网站上发布低质量的文章,作为一种链接建设的形式。
同样明显的是,点击量最大的网站设计不太吸引人,广告侵入性更强,字数过多,编辑标准低,措辞重复,研究有缺陷,总体上看不出有帮助或值得信赖。
我们对熊猫算法的了解
当谷歌与Wired讨论算法的开发时,Singhal说,他们首先向人类质量评估员发送测试文档,他们被问及类似“你愿意给这个网站提供你的信用卡吗?你会放心把这个网站开的药给你的孩子吗?”
卡茨说,这位工程师提出了“一系列严格的问题,从。你认为这个网站是权威的吗?如果这是在杂志上可以吗?这个网站有过多的广告吗?"
根据采访,他们然后通过将各种排名信号与人类素质排名进行比较来开发算法。
Singhal将其描述为在超空间中找到一个平面,将好的网站与坏的网站分开。
Singhal后来发布了以下内容23个问题作为指导性问题,该算法基于:
你会相信这篇文章中的信息吗?
这篇文章是深谙题目的专家或爱好者写的,还是本质上比较浅薄?
该网站是否有相同或相似主题的重复、重叠或多余的文章,但关键词略有不同?
你愿意把你的信用卡信息提供给这个网站吗?
这篇文章有拼写、文体或事实错误吗?
主题是由网站读者的真正兴趣驱动的,还是网站通过试图猜测哪些内容在搜索引擎中排名较好来生成内容?
文章是否提供了原创内容或信息、原创报道、原创研究或原创分析?
与搜索结果中的其他页面相比,该页面是否提供了实质性的价值?
内容上做了多少质量控制?
这篇文章描述了一个故事的两面吗?
该网站在其主题方面是公认的权威吗?
内容是由大量创作者批量生产或外包给大量创作者,还是在大型网站网络中传播,以至于单个页面或网站没有得到同样多的关注或照顾?
这篇文章编辑得好吗,还是显得草率或仓促?
对于与健康相关的查询,您会信任来自该网站的信息吗?
当提到这个网站的名字时,你会认为它是一个权威的来源吗?
这篇文章提供了完整或全面的主题描述吗?
这篇文章包含深刻的分析或有趣的信息吗?
这是你想要收藏、与朋友分享或推荐的那种页面吗?
这篇文章是否有过多的分散或干扰主要内容的广告?
你希望在印刷杂志、百科全书或书中看到这篇文章吗?
文章是否简短、空洞,或者缺乏有用的细节?
页面制作时是否非常注意细节,而不是不太注意细节?
当用户看到这个网站的页面时,他们会抱怨吗?
考虑一下谷歌的人类素质评分员被要求考虑什么也是一个好主意。这句关于低质量内容的话很有意义:
考虑这个例子:大多数学生必须为高中或大学写论文。许多学生通过以下一种或多种方式走捷径来节省时间和精力:
在网上购买论文或让别人代写。
捏造事实。
快速写作,无需草稿或编辑。
用大图片或其他分散注意力的内容填充报告。
从百科全书中复制整份报告,或者通过改变单词或句子结构来解释内容。
利用众所周知的事实,例如,“阿根廷是一个国家。人们住在阿根廷。阿根廷有边界。”
使用大量的单词来传达基本的想法或事实,例如,“熊猫吃竹子。熊猫吃很多竹子。竹子是熊猫最好的食物。”
2011年3月,海边的SEO辨认Biswanath Panda可能是该算法背后的同名工程师。
在一个纸,Biswanath帮助作者详细描述了如何使用机器学习算法对登录页面上的用户行为进行准确分类。
虽然这篇论文不是关于熊猫算法的,但作者通过其同名的参与和主题,表明熊猫也是一种机器学习算法。
SEO行业的大多数人已经得出结论,熊猫通过使用机器学习来准确预测人类将如何评价内容的质量。不太清楚的是,什么信号会被纳入机器学习算法,以确定哪些网站质量低,哪些不是。
熊猫和谷歌E-A-T:
2014年,谷歌在其搜索质量指南中引入了E-A-T原则,专注于专业知识、权威和可信度。
自2018年以来,这些原则越来越成为营销人员的关注点。
像熊猫一样,随之而来的更新和核心算法的变化关注于内容的质量和用户体验。
和熊猫一样,重点是避免:
单薄和无信息的内容。
缺乏权威来源。
不可信的内容和有问题的链接。
谷歌熊猫恢复
从熊猫中恢复过来的道路既简单又充满挑战。
由于Panda提高了被它归类为高质量内容的网站的性能,解决方案是提高内容的质量和独特性。
虽然说起来容易做起来难,但事实反复证明,这正是恢复所需要的。
艾伦·布莱维斯通过帮助网站重写内容来帮助网站恢复整整100页。
WiredSEO通过以下方式帮助一个网站从Panda中恢复改变他们的用户生成内容指南鼓励更具体、独特的bios,而不是从其他网站复制的BIOS。该网站的用户以前使用过其他网站的bios。尽管如此,WiredSEO鼓励他们修改简历以询问特定的问题,从而产生不重复的独特简历。
谷歌熊猫神话
熊猫不是重复的内容
最普遍的关于熊猫的神话它是关于重复的内容。约翰·穆勒已经澄清,重复的内容自主的熊猫的。谷歌员工强调熊猫鼓励独一无二的内容,但这不仅仅是避免重复。熊猫寻找的是真正独特的信息,为用户提供卓越的价值。
穆勒同样告诉一位博客作者,删除技术重复实际上是一个非常低的优先级,他们应该这样做代替"想想是什么让你的网站与你所在领域的顶级网站相比有所不同."
2021年,谷歌的标签解释了重复内容不是负面排名因素。
您应该删除内容来解决熊猫问题吗?
2017年,谷歌的加里·伊利耶斯在推特上说:“我们不建议删除熊猫的一般内容,而是添加更多高质量的内容。”
约翰·穆勒也这么说在YouTube上:
“总的来说,网站的质量应该得到显著提高,这样我们才能信任其内容。有时,我们在这样的网站上看到的会有很多单薄的内容,可能有你从其他来源聚集的内容,可能有用户生成的内容,人们提交的文章质量很低,这些都是你可能想看看并问我能做什么的事情;一方面,如果我想保留这些文章,可能会阻止这些文章出现在搜索中。也许可以为这些东西使用noindex标签。”
谷歌的回应一直是要么不索引,要么改进内容——从不完全删除,除非这样做是为了品牌。
总的来说,删除内容应该是你网站整体品牌的一个考虑因素,而不是一个取消熊猫惩罚的举动。
熊猫&用户生成的内容
Panda并不专门针对用户生成的内容。虽然熊猫能针对用户生成的内容,它往往会影响产生低质量内容的网站,如垃圾客座博文或充满垃圾邮件的论坛。
不要移除您的用户生成的内容,无论是论坛,博客评论,还是文章投稿,仅仅因为你听说它是“坏的”或作为“熊猫证明”的解决方案进行营销。而是从质量的角度来看。
许多排名靠前的网站依赖用户生成的内容–许多网站仅仅因为删除了这类内容,就会失去大量的流量和排名。甚至在博客帖子上发表的评论也能让它排名,甚至得到一个特色片段。
字数不是一个因素
字数是SEO专业人士经常误解的Panda的另一个方面。许多网站犯了拒绝发布任何内容的错误,除非内容超过一定的字数,250个单词和350个单词经常被引用。相反,谷歌建议你考虑一下,对用户来说,内容需要多少单词才算成功。
例如,有很多页面只有很少的主要内容,但是Google认为这个页面质量足够好,它已经为查询赢得了特色片段。在一个案例中,主要内容只有63个单词,许多人很难以非垃圾邮件的方式写下350多个单词的主题。所以你只需要足够的单词来回答这个问题。
附属链接和广告不是直接针对的
联属网站和“为AdSense制作”网站经常比其他网站更容易被Panda攻击,但这并不是因为它专门针对它们。谷歌发言人告诉《邮报》
“一个极端的例子是,当一个网站的主要功能是通过广告或附属链接将用户引导到其他网站时,这些内容在互联网上随处可见,或者是仓促制作的,并被明确构建为吸引搜索引擎的访问者。”
穆勒说,类似地:
“但与此同时,我们也看到许多联盟成员基本上都是些懒人,他们复制并粘贴他们获得的信息,然后发布在自己的网站上。而这种质量较低的内容,单薄的内容,是我们很难在搜索中展现的东西。”
换句话说,这些网站正因为同样的原因而受到冲击:它们无法提供引人注目的、独特的、引人入胜的内容。
时间表
几乎可以肯定的是,熊猫拥有最广泛的相关更新的公开日期的公开记录。部分原因是Panda是在谷歌核心算法之外运行的,因此,内容评分只在Panda更新的当天或附近受到影响。
这种情况一直持续到2013年6月11日,当时卡茨在SMX高级研究中心表示,虽然熊猫没有直接纳入谷歌的核心算法,但它的数据每月都会更新,并在一个月内慢慢推出,从而结束了与熊猫更新相关的突然的全行业影响。
因此熊猫提到在2017年后消失。
编号惯例有些混乱。
人们可能会认为Panda算法的核心更新对应于1.0、2.0、3.0和4.0,但没有更新被称为3.0,回想起来,3.1也不是Panda的核心更新。
数据刷新更新了搜索结果,但没有更新Panda算法本身,通常会按照您对软件更新的预期进行编号(3.2、3.4、3.5等等)。然而,该算法的版本3有如此多的数据刷新,以至于有一段时间,这种命名惯例被放弃了,业界简单地用Panda更新(刷新和核心更新)的总数来指代它们。
不管怎样,熊猫更新的时间表至少是众所周知的,如下所示:
1.0:2011年2月23日。推出了当时尚未命名的算法更新的第一次迭代(12%的查询受到影响),震惊了搜索引擎优化行业和许多大公司,并有效地结束了当时存在的“内容农场”商业模式。
2.0 (#2):2011年4月11日。核心熊猫算法的首次更新。这次更新包含了额外的信号,比如谷歌用户屏蔽的网站。
2.1 (#3):2011年5月9日。业界首次将此称为熊猫3.0,但谷歌澄清说,这只是一次数据刷新,即将到来的2.x更新也是如此。
2.2 (#4):2011年6月21日
2.3 (#5):2011年7月23日
2.4 (#6)国际:2011年8月12日。Panda在除日本、中国和韩国之外的所有英语国家和非英语国家推出。
2.5 (#7)和熊猫相关的焊剂:2011年9月28日。在这次更新之后,2011年10月5日,卡茨宣布“预计在接下来的几周内会有一些与熊猫相关的流量。”确认的日期是10月3日和10月13日。
3.0 (#8):2011年10月19日谷歌在熊猫算法中加入了一些新信号,并重新计算了该算法对网站的影响。
3.1 (#9):2011年11月18日谷歌宣布了一个小的更新,影响不到1%的搜索。
3.2 (#10):2012年1月18日。谷歌证实在这一天发生了数据刷新。
3.3 (#11):2012年2月23日。数据刷新。
3.4 (#12):2012年3月23日
3.5 (#13):2012年4月19日
3.6 (#14):2012年4月27日
3.7 (#15):2012年6月8日。排名工具显示的数据更新比其他最近的更新更具冲击力。
3.8 (#16):2012年6月25日
3.9 (#17):2012年7月24日
3.9.1 (#18):2012年8月20日。一个相对较小的更新,标志着行业
指定的新命名约定的开始。
3.9.2 (#19):2012年9月18日
#20:2012年9月27日。一个相对较大的熊猫更新也标志着另一个命名惯例的开始。业界认识到9.x.x命名约定的尴尬,并认识到他们所谓的熊猫3.0的更新可能会持续很长时间。
#21:2012年11月5日
#22:2012年11月21日
#23:2012年12月21日。稍微更有影响力的数据刷新。
#24:2013年1月22日
#25:2013年3月14日。这个更新是预先宣布的,工具显示它大约在这一天发生。卡茨似乎暗示,这将是熊猫被直接纳入谷歌算法之前的最后一次更新。然而,后来很清楚,这并不是正在发生的事情。
“舞蹈”:2013年6月11日。这不是更新日期。尽管如此,卡茨当天澄清说,熊猫不会被直接纳入算法,而是会以慢得多的速度每月更新一次,而不是像过去那样突然刷新数据。
“恢复”:2013年7月18日。这次更新似乎是为了纠正一些过于苛刻的熊猫活动。
4.0 (#26):2014年5月19日。一个重要的熊猫更新(影响7.5%的查询)发生在此日期。大多数业内人士认为,这是对熊猫算法的更新,而不仅仅是数据更新,特别是考虑到Cutts关于缓慢推出的声明。
4.1 (#27):2014年9月23日。另一个主要更新(影响3%到5%的查询)包括对Panda算法的一些更改。由于推出缓慢,具体日期还不清楚,但公告是在9月25日。
4.2 (#28):2015年7月17日。谷歌宣布了熊猫更新,这将需要几个月的时间来推出。由于推出的缓慢性,还不清楚这种影响有多大,也不清楚它是何时发生的。这是最后确认的熊猫更新。
核心算法合并:2016年1月11日。谷歌证实熊猫已经被纳入谷歌的核心算法,显然是2015年7月17日缓慢推出的一部分。换句话说,
2022年,你要把熊猫的核心概念放在第一位。
避免黑帽战术和垃圾链接,专注于高质量的内容用户及其体验。谷歌对机器学习和技术的使用继续坚持这些原则。
熊猫这个名字可能不会出现,但熊猫原则今天仍然适用。