当前位置:首页 > SEO知识 > 正文内容

如何解决搜索引擎爬虫重复抓取问题

admin3年前 (2023-03-09)SEO知识403

针对每一位SEO从业者而言,爬虫每天来我们的网站进行网页的抓取,是十分宝贵的资源。

但在这中间由于爬虫无序的抓取,势必会浪费一些爬虫的抓取资源。

这中间我们就需要解决搜索引擎爬虫对我们的网页重复抓取的问题,下面赵彦刚与你一起来聊一下如何解决这个问题。

在聊这个问题之前,我们需要理解一个概念。首先爬虫本身是无序的抓取,他不知道先抓什么再抓什么,只知道看到了什么,且计算后认为有价值就进行抓取。

而对于我们而言,抓取的整个过程中,我们最要解决是如下几类:

●新产生的页面,没有被抓取过的

●产生了一段时间,迟迟不被抓取的

●产生了一段时间,却一直没收录的

●产生很久的页面,但最近更新了

●包含内容更多的聚合页面,如首页、列表页

如上几类,按照顺序我们定义哪一类最需要被爬虫抓取。

针对大型网站,搜索引擎爬虫抓取资源过剩,而针对小网站,抓取资源稀缺。所以在这里我们强调一下,我们不是要解决搜索引起爬虫重复抓取的问题,而是要解决搜索引擎爬虫最快的抓取我们希望抓取的页面。要把这个思路纠正!

下面,我们聊一下怎么让搜索引擎爬虫最快的抓取我们希望被抓取的页面。

爬虫是抓取到一个网页,从这个网页在找到更多的链接,周而复始的过程,那么这个时候我们就要知道要想被爬虫更大概率抓取,就要给更多的链接,让搜索引擎爬虫发现我们希望被抓取的网页。这里我拿上述的第一种情况举例说明一下:

新产生的页面,没有被抓取过的

这类一般都会是文章页,针对于这类我们的网站每天都会大量产生,所以我们就要在更多的网页给予这部分链接。例如首页、频道页、栏目/列表页、专题聚合页、甚至文章页本身,都需要具备一个最新文章板块,以此等待爬虫抓取到我们的任何网页时,都能发现最新的文章。

同时,试想一下,这么多页面都有新文章的链接,连接传递权重,那这新文章,既被抓取了,权重也不低。被收录的速度会明显提升。

那针对那些长时间不收录的,也可以考虑是不是权重太低了,我多给一些内链支持,传递一些权重。应该会有收录的可能。当然也有可能不收录,那你就要靠内容本身的质量了。之前有一篇文章是专门说内容质量的也欢迎大家阅读:什么内容容易被百度判断为优质内容?。

所以,我们为了解决搜索引擎爬虫重复抓取问题不是我们最终要解决的。因为本质上搜索引擎爬虫是无序的,我们只能通过针对网站的架构、推荐算法、运营策略等进行干预。使爬虫给予我们更理想的抓取效果。如果你不会根据爬虫的自身抓取效果进行优化网站,也可以联系我。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://laosuseo.com/?id=21006

分享给朋友:

“如何解决搜索引擎爬虫重复抓取问题” 的相关文章

想要做好SEO优化必须注意的五点

想要做好SEO优化必须注意的五点

想要做好网站推广,如果是选择利用SEO优化的方式,那么下面这些方面是你必须要考虑的。一:选好域名和空间我们做SEO优化都应该知道,要想做一个网站,我们就要有域名和空间,域名的选择尽可能选简短易记的,和自己所做的行业相关的,切勿选取中文域名,目前搜索引擎对于中文的域名还是不能识别的;空间的选择尽可能选...

SEO技术可以自学么?SEO老司机告诉你!

SEO技术可以自学么?SEO老司机告诉你!

经常有一些想学习SEO同学来问我,SEO技术能自学得会吗?我的答案是:可以。但为什么大多数同学的网站还是优化不上来?原因又是什么?下面为大家详细讲一讲。1,SEO自学前提是需要站长自己本身就具有一定的SEO基础,而且具有很强的自学能力和抵制诱惑的能力。今天可能坚持一天,明天小明来找你出去打LOL,后...

SEO网站优化的常规策略你知道几个

SEO网站优化的常规策略你知道几个

在对站点执行SEO优化之初,拟定一个详细完整、科学合理的优化策略,是一种不可或缺的工作。在执行操作过程中,优化策略可以当做开展工作的参考和根据。如此一来,可以为实现引擎搜索优化工作奠定较好的根本。归纳网站seo的对策,首要有以下几个方面。1.关键词策略让引擎搜索可以爬取的网站域名、标题标签、meta...

沙盒期大概时间多久

沙盒期大概时间多久

1、什么是网站沙盒期?沙盒期大概时间多久seo中的沙盒是指一个新站建立后搜索引擎会对其进行一个类似资格评价的阶段,我们将这个阶段称为沙盒,在沙盒里面的这段时间,我们将其称为沙盒期,沙盒期一般都是2-6个月。在沙盒期这段时间内,我们仍需要经常更新文章,不过不应该过多的改网站结构,修改文章标题,在此期间...

SEO学习之站内如何优化?

SEO学习之站内如何优化?

多说两句,上一堂课白杨SEO第1课:SEO是什么与关键词分析里面有写到为什么要做这个付费分享,以及准备做多久。这里 还想补充一点是,想让SEO喜欢的人有一个互相交流的群,有一个公众号可以了解 一些基础知识,少走一点弯路。言归正传。第1课里,文字内容比较基础和简单,就算是一个外行也...

SEO如何做才能实现网站流量增长

SEO如何做才能实现网站流量增长

搜索引擎优化是如何做到的?为了实现网站流量的增长。 通过搜索引擎关键词优化,挖掘互联网流量的蓝海,通过周期沉淀,实现企业网络推广和营销价值,为在线客户获取奠定基础,实现整个优化过程的转型。 如何让网站从无到有?这是一个问题。这并不意味着SEO可以解决流...