当前位置:首页 > SEO知识 > 正文内容

怎么屏蔽百度蜘蛛(Baiduspider)抓取网站

admin2年前 (2023-03-09)SEO知识106

百度蜘蛛抓取我们的网站是希望将我们的网页收录到它的搜索引擎里,未来当用户搜索时,能为我们带来一定的SEO流量。当然我们并不是希望搜索引擎什么都抓取。

所以,这时我们只希望我们希望在搜索引擎被搜索到的内容进行抓取。像用户隐私、后台信息等都不希望搜索引擎被抓取和收录。解决这样的问题最好的方式有两种,如下:

robots协议文件屏蔽百度蜘蛛抓取

robots协议是一个放在网站根目录下协议文件,可以通过URL地址:http://你的域名/robots.txt进行访问。当百度蜘蛛抓取我们网站时,会先访问这个文件。因为里面告诉了蜘蛛哪些可以抓取,哪些不可以抓取。

robots协议文件的设置比较简单,可以通过User-Agent、Disallow、Allow这三个参数进行设置。

●User-Agent:对不同搜索引擎的声明;

●Disallow:不允许抓取的目录或页面;

●Allow:允许抓取的目录或页面,一般可以省略不写,因为你不写什么是不可以抓的那就都是可以抓的;

下面我们来看一个示例,场景是我不希望百度抓取我网站所有的css文件,data目录、seo-tag.html页面

User-Agent: Baidusppider

Disallow: /*.css

Disallow: /data/

Disallow: /seo/seo-tag.html

如上,user-agent声明的蜘蛛名称,这个意思也就是说,针对百度蜘蛛。下面不能抓取”/*.css”,首先前面的/指的是根目录,也就是你的域名。*是通配符,代表任意内容。其意思就是所有文件,以.css结尾的都不能抓取。下面两个你自己体会吧。逻辑是一样的。

如果你想检测自己最后设置的robots文件对不对,可以访问这篇文章《检查robots是否正确的工具介绍》,有详细的工具能够检测你的设置。

通过403状态码,限制内容输出,屏蔽蜘蛛抓取。

403状态码,是http协议中一个网页返回状态码。当搜索引擎碰到403状态码时,就知道这类页面是又权限限制的。我是不能访问的。例如需要登录才能查看的内容,搜索引擎本身是不会登录的,那么你返回403的同时,他也知道了这都是权限设置页面,无法读取内容。自然也就不会收录。

返回403状态码的同时,应该有一个类似404页面的页面。提示用户或者蜘蛛这类页面想要做什么才能访问。两者缺一不可。你只有提示页面,状态码返回200,那对于百度蜘蛛就是大量的重复页面了。有403状态码但返回不同的内容。这也不是很友好。

最后针对robot协议,还想再补充一点:“现在搜索引擎会通过你网页的排版、布局来识别你网页的体验友好度,如果屏蔽了css文件、布局相关的js文件的抓取,那么搜索引擎就不知道你的网页布局是好是坏了。所以不建议屏蔽这些内容不让蜘蛛抓取”。

好了,今天的分享就到这里,希望能够对你有所帮助,当然如上的两个设置除了针对百度蜘蛛外,对所有的蜘蛛都有效果的。设置时请谨慎。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://laosuseo.com/?id=21009

分享给朋友:

“怎么屏蔽百度蜘蛛(Baiduspider)抓取网站” 的相关文章

SEO网站推广费用几何?SEO收费贵是有原因的

SEO网站推广费用几何?SEO收费贵是有原因的

SEO网站推广费用到底如何计算的,为什么有的Seo费用很贵?你今天我们就这个话题,就重点聊一聊seo推广费用到底有多少?首先我们来了解一下seo费用包含哪几方面?我们都知道 seo对一个企业来说是一个主流的获客渠道,所以很多企业都会在网站推广这一块付出一定的精力和资源,所以我们都应该明白seo对企业...

网站标题关键词用什么符号分隔开好些?

网站标题关键词用什么符号分隔开好些?

当你对网站标题关键字用什么符号分隔开好些的时候。你可以到互联网上查看一下不同行业排名网站靠前的网站看看。看看他们用逗号“,” 顿号“、” 下划线“_” 中横线“-” 竖线“|”等,那到底用哪个好呢?下面跟大家介绍一下网站标题关键字用什么符号分隔对优化效果好些:基本上我们在看同行的朋友对网站标题优化时...

查看Google自然搜索热度的办法,第2个细节亮了!

查看Google自然搜索热度的办法,第2个细节亮了!

市场动态瞬息万变,很难掌握用户需求的发展势态。如何实时地了解用户搜索和关注哪些关键词,就需要借助到我们今天的主角——Google Trends(谷歌趋势:https://trends.google.com)。 了解受众群体所关注方面的搜索趋势和热度范围等,可以及时调整如谷歌广告系列吸引潜在...

百度搜索算法规范讲解

百度搜索算法规范讲解

百度最新线上公开课讲解搜索算法规范:从页面内容质量、用户需求满足、浏览体验友好这三个纬度调整。1、内容质量 第一点:内容质量会引用飓风算法3.0打击站群问题、恶劣采集等问题; 第二点:内容质量会引用细雨算法2.0打击软文信息页面出现空短、商品信息有误、穿插收益信息等问题;&nbs...

谷歌SEO算法变化及应对策略:如何应对搜索引擎的更新

谷歌SEO算法变化及应对策略:如何应对搜索引擎的更新

随着时间的推移,谷歌的搜索引擎算法一直在不断更新和变化,这对于网站的SEO优化来说,是一个不可忽视的挑战。本文将介绍一些谷歌SEO算法的变化,以及相应的应对策略。 移动友好性 谷歌的移动友好性算法已经于2015年4月推出。这一算法的目的是确保网站在移动设备上的用户体验。这意味着网...

新手怎么做SEO?有什么窍门吗?

新手怎么做SEO?有什么窍门吗?

作为一个新手该怎么做SEO呢?有什么快速学习的窍门吗?其实吧,SEO是一项需要你稳扎稳打的技能,并没有什么窍门也没有什么捷径可以走。作为SEO的过来人,下面就来传授一下我的个人经验,希望对新手朋友们有所帮助。1、学习建站SEO和网站建设本就是相辅相成,所以一定要学会网站建设,做网站建设会涉及到相关的...