当前位置:首页 > SEO知识 > 正文内容

怎么屏蔽百度蜘蛛(Baiduspider)抓取网站

admin2年前 (2023-03-09)SEO知识284

百度蜘蛛抓取我们的网站是希望将我们的网页收录到它的搜索引擎里,未来当用户搜索时,能为我们带来一定的SEO流量。当然我们并不是希望搜索引擎什么都抓取。

所以,这时我们只希望我们希望在搜索引擎被搜索到的内容进行抓取。像用户隐私、后台信息等都不希望搜索引擎被抓取和收录。解决这样的问题最好的方式有两种,如下:

robots协议文件屏蔽百度蜘蛛抓取

robots协议是一个放在网站根目录下协议文件,可以通过URL地址:http://你的域名/robots.txt进行访问。当百度蜘蛛抓取我们网站时,会先访问这个文件。因为里面告诉了蜘蛛哪些可以抓取,哪些不可以抓取。

robots协议文件的设置比较简单,可以通过User-Agent、Disallow、Allow这三个参数进行设置。

●User-Agent:对不同搜索引擎的声明;

●Disallow:不允许抓取的目录或页面;

●Allow:允许抓取的目录或页面,一般可以省略不写,因为你不写什么是不可以抓的那就都是可以抓的;

下面我们来看一个示例,场景是我不希望百度抓取我网站所有的css文件,data目录、seo-tag.html页面

User-Agent: Baidusppider

Disallow: /*.css

Disallow: /data/

Disallow: /seo/seo-tag.html

如上,user-agent声明的蜘蛛名称,这个意思也就是说,针对百度蜘蛛。下面不能抓取”/*.css”,首先前面的/指的是根目录,也就是你的域名。*是通配符,代表任意内容。其意思就是所有文件,以.css结尾的都不能抓取。下面两个你自己体会吧。逻辑是一样的。

如果你想检测自己最后设置的robots文件对不对,可以访问这篇文章《检查robots是否正确的工具介绍》,有详细的工具能够检测你的设置。

通过403状态码,限制内容输出,屏蔽蜘蛛抓取。

403状态码,是http协议中一个网页返回状态码。当搜索引擎碰到403状态码时,就知道这类页面是又权限限制的。我是不能访问的。例如需要登录才能查看的内容,搜索引擎本身是不会登录的,那么你返回403的同时,他也知道了这都是权限设置页面,无法读取内容。自然也就不会收录。

返回403状态码的同时,应该有一个类似404页面的页面。提示用户或者蜘蛛这类页面想要做什么才能访问。两者缺一不可。你只有提示页面,状态码返回200,那对于百度蜘蛛就是大量的重复页面了。有403状态码但返回不同的内容。这也不是很友好。

最后针对robot协议,还想再补充一点:“现在搜索引擎会通过你网页的排版、布局来识别你网页的体验友好度,如果屏蔽了css文件、布局相关的js文件的抓取,那么搜索引擎就不知道你的网页布局是好是坏了。所以不建议屏蔽这些内容不让蜘蛛抓取”。

好了,今天的分享就到这里,希望能够对你有所帮助,当然如上的两个设置除了针对百度蜘蛛外,对所有的蜘蛛都有效果的。设置时请谨慎。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://laosuseo.com/?id=21009

分享给朋友:

“怎么屏蔽百度蜘蛛(Baiduspider)抓取网站” 的相关文章

修改网站标题时应该注意哪些事项

修改网站标题时应该注意哪些事项

很多时候我们无法保证网站一成不变,或是网站关键词竞争太大,或是关键词不符合网站主题的定位,或是站长们要对网站进行新的定位,我们都需要或多或少的修改网站标题。很多朋友认为网站标题一旦修改后,关键词排名下降甚至没有,权重直接降低,那么,搜索引擎是不是如此的不人性化,网站标题到底能不能修改,是不是有一种办...

竞价与SEO哪个更烧钱

竞价与SEO哪个更烧钱

如今的百度,想做个seo啥的,似乎已经没有那么简单了,并不是seo的技术变难了,而是百度的竞价广告已经横行遍野,让免费的搜索引擎几乎无处容身。这几天听一个在竞价公司的朋友说有一些专门搞百度竞价的小公司纷纷关门歇业了,至于原因肯定有很多种,广泛上来说,今年经济低迷,很多产品公司盈利不好,自然也就很少烧...

网站地图有什么作用

网站地图有什么作用

建设网站已经是比较常见的事情了,已经过了新鲜的时代,有的人已经加入网络大家庭,而有的人仍在靠着单一的线下宣传。当我们在进行逛网站的时候,不知道大家是否发现了一件事,那便是大多数的网站都有着网站地图,个别网站还没有网站地图,它对于seo优化来说有着怎样的作用呢?关于企业网站是否需要做网站地图的问题,我...

新手该怎么做SEO?SEO基础教程

新手该怎么做SEO?SEO基础教程

SEO作为一种获取搜索引擎流量手段,一度受到很多人的追捧,如果做好的话,效果是不错的。但是基础的入门知识也很重要的,只有掌握基础入门知识,才可以取得不错的效果。百度快速排名、360快速排名、搜狗快速排名、谷歌快速排名之战神快排系统发布。学会做用户数据分析做SEO首先必须要懂的如何去分析数据,单一的只...

SEO技术可以自学么?SEO老司机告诉你!

SEO技术可以自学么?SEO老司机告诉你!

经常有一些想学习SEO同学来问我,SEO技术能自学得会吗?我的答案是:可以。但为什么大多数同学的网站还是优化不上来?原因又是什么?下面为大家详细讲一讲。1,SEO自学前提是需要站长自己本身就具有一定的SEO基础,而且具有很强的自学能力和抵制诱惑的能力。今天可能坚持一天,明天小明来找你出去打LOL,后...

有什么办法提升网站的流量

有什么办法提升网站的流量

提升网站总流量,也就是提升网站pv量,梳理以下几个方面有利于提升网站总体pv量。SEO学习培训提升网站pv量具体方法:1、SEO百度搜索引擎优化SEO网站优化,是完全免费提升网站总体pv的最好方法,根据网站网站内部外站SEO优化实际操作,搞好关键字精准定位及长尾关键词扩展合理布局优化,提升网站关键字...