当前位置：首页 > SEO知识 > 正文内容

搜索引擎蜘蛛对独立网站页面的爬行规律

admin3年前 (2023-03-14)SEO知识630

当网站有蜘蛛访问时，你的网站页面有可能被收录，百度蜘蛛会抓取我们网站的html代码，然后将数据拆分成标题、摘要、页眉、正文等结构化数据。

带回百度的服务器，过滤后放入数据库，然后在网站页面分享百度蜘蛛的抓取规则。

目前网站数以百亿计算，每个页面都有快照备份是不现实的，所以百度蜘蛛会优胜劣汰，就像有探路、有主力、有功能的开拓者一样。事实上，高权重和低权重没有区别。

百度蜘蛛在网站内页的爬行规律；

百度蜘蛛主要由两种蜘蛛组成，即收录蜘蛛和快照蜘蛛。通常，123IP从包含的蜘蛛开始，220IP从快照蜘蛛开始。通过这两种蜘蛛的日志访问量，我们基本可以确定这个网站在百度看来是否是优质网站。

1.有优质内容的页面：新文章发表后，通常是123开头的蜘蛛先走，然后220开头的蜘蛛再回去，然后快照会在同一天或者每1-2天更新一次。

2.404页面的抓取规则：当网站删除几个收录页面，访问变成404时，123开头的蜘蛛抓取时，一般会发现百度蜘蛛两次404后都不会来。

3.文章内容差页：如果是文章生成器生成的拼凑文章，排版凌乱不可读，123开头的蜘蛛来过一次就再也没有来过。

那么百度蜘蛛爬行的真正逻辑应该是：123年初，蜘蛛为了减少不必要的服务器资源浪费，对网页内容进行收费和筛选；20岁开始的蜘蛛通常在123只蜘蛛被筛选后进入。如果网页的内容真的很劣质，220开头的蜘蛛是不会访问的。

对于已经包含快照的页面，直接访问从220开始。

最终结论如下：

1、IP开头的123指的是包含蜘蛛。所谓收录蜘蛛，是指百度蜘蛛访问后，百度后端会通过反作弊处理、原创性检测等一系列判断手段，决定是否可以收录，是否可以拖百度快照蜘蛛访问。

2、220开头的IP是快照蜘蛛。当快速包含蜘蛛检测到网页已经通过包含标准时，快照蜘蛛生成结构化数据并进入倒排索引。此时，网页在被用户搜索之前有一个快照。

因此，在每次快照更新之前，包含蜘蛛和快照蜘蛛都会访问，并且包含蜘蛛和快照蜘蛛之间的访问比率一般不超过2，333，601。如果收录蜘蛛的数量远远大于快照蜘蛛，说明网页的内容不够。

以上就是【搜索引擎蜘蛛对独立网站页面的爬行规律】的全部内容，仅供站长朋友们互动学习。SEO优化是一个需要坚持的过程。希望大家一起进步。

扫描二维码推送至手机访问。

本文链接：https://laosuseo.com/?id=23440

标签: 搜索引擎网站页面

分享给朋友：

返回列表

上一篇：浅析网站设置301重定向跳转有什么用途？

下一篇：如何正确的做SEM竞价推广投放

“搜索引擎蜘蛛对独立网站页面的爬行规律” 的相关文章

从子域名切换到子目录是否可以改善SEO

自搜索引擎出现以来，有关子域名与子目录的问题就一直存在。人们问自己一个或另一个是否会影响SEO。普遍认为，从根域的子域切换到子目录将有助于提高网站的整体排名。但这是真的吗？其实这取决于您网站的状况。但是，如果您问自己应该使用哪一种，并且想要在采取任何行动之前我们建议您对本文进行认真阅读。我们努力收集...

不一样的竞价推广和SEO优化，确实不一样

有问题，找百度，相信很多人都是因为这句顺口溜而记住了百度搜索引擎。在中国互联上网上，仅百度这一个搜索引擎，就占有了85%的以上的搜索引擎份额。由此可知，百度的影响力是很大的。而正是因为看到了百度庞大的流量，许多企业都纷纷跑去做搜...

企业面对竞价和SEO要如何取舍？还是两者都做？

在互联网快速发展的情况下，企业想要提高营销效果、提升企业自身的搜索引擎排名，是做SEO还是做竞价呢？同时又有哪些要注意的地方呢，今天我们就来一起探讨下：一、两者的区别1、什么是竞价推广竞价推广是把企业的产品、服务等以关键词的形式在搜索引擎平台上作推广，通过优化推广账户可以在搜索结果中取得较高的排名，...

如何学习SEO，自学SEO应该注意的几点步骤

原标题：如何学习SEO，自学SEO应该注意的几点步骤：如何学习SEO，怎么自学SEO，这个问题是我们很多小白刚接触SEO时想了解的问题，当我们刚开始学习SEO时，我们可能会不知所措。诚然，我们可以通过网上很多资料或视频学习相关知识或是通过在线课程进行学习，但我们在决定...

SEO网站优化的常规策略你知道几个

在对站点执行SEO优化之初，拟定一个详细完整、科学合理的优化策略，是一种不可或缺的工作。在执行操作过程中，优化策略可以当做开展工作的参考和根据。如此一来，可以为实现引擎搜索优化工作奠定较好的根本。归纳网站seo的对策，首要有以下几个方面。1.关键词策略让引擎搜索可以爬取的网站域名、标题标签、meta...