为什么网站页面不收录?看大神分析百度蜘蛛Spider抓取篇
百度蜘蛛抓取策略中最主要方式有两种,一种是百度蜘蛛主动抓取发现新url,另外一种是站长通过资源平台主动提交链接,其中主动提交的数据最受百度算法青睐,对于普通网站运营来说,如果长时间不收录,建议 通过资源平台的API提交、普通提交让蜘蛛更快的发现数据。
那么从抓取环境来看,很多同学也做了提交,为什么还是看不到页面被收录呢?其实页面不被收录的因素很多,在抓取这个环节中,影响线上收录的因素有这几个:
1、robots封禁2、质量甄别3、抓取失败
很多CMS自带的都有robots.txt设置,一般情况下,用CMS自带的即可,由于项目的原因,很多人在线上运营之前都会选择禁用蜘蛛爬取,比如之前我们给客户做的网站中,上线后网站并没有完成,所以暂时封禁了蜘蛛,所以就用了以下这个代码:
User-agent: *Disallow: /
如果线上正式运营后,很多人忘记了更改回来,所以就导致了不被蜘蛛抓取,建议大家养成一个好习惯,不定期的检查robots设置,优化最合适的设置。
百度算法更新这几年,算法对低质量内容识别越来越精准,尤其是时效性内容,从抓取层面就进行质量评估,过滤掉低质内容,如果文章质量自己都看不下去,就不要再埋怨为什么不收录了。
百度蜘蛛抓取失败很多,其中最主要的原因还是服务器的问题,作为网站运营者时刻要关注服务器稳定情况,如果遇到打不开网站或者502错误,建议去服务器排查问题,增加防火墙设置等以保证网站稳定性。
以上3个方面是从百度蜘蛛角度去阐述网站页面不收录的原因,根据迅步的经验总结,最多的原因在于服务器不稳定导致的抓取失败,希望大家可以从这方面入手,加强服务器的稳定性。
最后,如果你对网站收录还有疑问的话,请看下一篇:为什么网站页面不收录?看大神分析文章内容质量篇!
“为什么网站页面不收录?看大神分析百度蜘蛛Spider抓取篇” 的相关文章
原标题:企业一大未解之谜,抖音搜索seo优化怎么做?企业经常弄混的两种营销模式,分别是抖音搜索seo和百度seo。接下来让我们拆解抖音搜索seo和百度seo的区别。关键词搜索企业抖音搜索seo的核心是关键词搜索。因此在撰写文案之前应该收集更多的关键词,比如一条短视频必须包括标题、主题和内容的主题。再...
做响应式网站的时候,我们经常看到什么HTML5黑科技,独特的meta标签独得搜索引擎喜爱,收录快之类的宣传语,不少用户都是云里雾里。其实这个HTML5中的meta标签到底是何方神圣,为什么直接影响网站优化?今天给大家解答一下。Meta标签的解释Meta标签用来描述一个HTML网页文档的属性,例如作者...
meta 标签系系列共 4 篇:HTML meta 标签详解将 Twitter Card 和 Open Graph 社交元数据添加到你的网页8 个必知的 SEO 优化重要元标签移动端浏览器常用的 meta 标签汇总meta标签定义了关于 HTML 文档的元数据(metadata)。 它可以用于向搜索...
大家都知道网站的发展离不开流量,现在随时搜索引擎的发展单单靠网站核心目标关键词带来的流量以及远远不够,并且现在对核心网站关键词的优化推广竞争越来越激烈,成本也越来越高。所以我们就需要通过大量的长尾来扩充流量,有时如果在长尾关键词领域获得了优势,那么网站的盈利空间就会被充分的打开。今天,就跟大家分享一...
seo网页优化,重点就是让搜索引擎更容易抓取并索引网站的内容。一般来说,seo网页优化所专注的范围包括网站读取速度,稳定性,爬虫指令,网站架构,代码结构,设计,兼容性和安全性。seo网页优化的主要目的,就是让搜索引擎更容易明白网站上每个页面的内容,从而在跟内容相关的搜索查询中提升页面的排名。通常的做...
想要做好谷歌SEO,先了解下什么叫谷歌seo,它的英文全称是Google Search Engine Optimization,翻译过来就是谷歌搜索引擎优化。那么今天就讲讲怎么做好SEO。一、写好网页标题网页标题既是搜索引擎判断网站内容的首要元素,亦是能够让用户快速了解网站主题的重要元素。对于网页标...