当前位置:首页 > SEO知识 > 正文内容

怎么屏蔽百度蜘蛛(Baiduspider)抓取网站

admin3年前 (2023-03-09)SEO知识479

百度蜘蛛抓取我们的网站是希望将我们的网页收录到它的搜索引擎里,未来当用户搜索时,能为我们带来一定的SEO流量。当然我们并不是希望搜索引擎什么都抓取。

所以,这时我们只希望我们希望在搜索引擎被搜索到的内容进行抓取。像用户隐私、后台信息等都不希望搜索引擎被抓取和收录。解决这样的问题最好的方式有两种,如下:

robots协议文件屏蔽百度蜘蛛抓取

robots协议是一个放在网站根目录下协议文件,可以通过URL地址:http://你的域名/robots.txt进行访问。当百度蜘蛛抓取我们网站时,会先访问这个文件。因为里面告诉了蜘蛛哪些可以抓取,哪些不可以抓取。

robots协议文件的设置比较简单,可以通过User-Agent、Disallow、Allow这三个参数进行设置。

●User-Agent:对不同搜索引擎的声明;

●Disallow:不允许抓取的目录或页面;

●Allow:允许抓取的目录或页面,一般可以省略不写,因为你不写什么是不可以抓的那就都是可以抓的;

下面我们来看一个示例,场景是我不希望百度抓取我网站所有的css文件,data目录、seo-tag.html页面

User-Agent: Baidusppider

Disallow: /*.css

Disallow: /data/

Disallow: /seo/seo-tag.html

如上,user-agent声明的蜘蛛名称,这个意思也就是说,针对百度蜘蛛。下面不能抓取”/*.css”,首先前面的/指的是根目录,也就是你的域名。*是通配符,代表任意内容。其意思就是所有文件,以.css结尾的都不能抓取。下面两个你自己体会吧。逻辑是一样的。

如果你想检测自己最后设置的robots文件对不对,可以访问这篇文章《检查robots是否正确的工具介绍》,有详细的工具能够检测你的设置。

通过403状态码,限制内容输出,屏蔽蜘蛛抓取。

403状态码,是http协议中一个网页返回状态码。当搜索引擎碰到403状态码时,就知道这类页面是又权限限制的。我是不能访问的。例如需要登录才能查看的内容,搜索引擎本身是不会登录的,那么你返回403的同时,他也知道了这都是权限设置页面,无法读取内容。自然也就不会收录。

返回403状态码的同时,应该有一个类似404页面的页面。提示用户或者蜘蛛这类页面想要做什么才能访问。两者缺一不可。你只有提示页面,状态码返回200,那对于百度蜘蛛就是大量的重复页面了。有403状态码但返回不同的内容。这也不是很友好。

最后针对robot协议,还想再补充一点:“现在搜索引擎会通过你网页的排版、布局来识别你网页的体验友好度,如果屏蔽了css文件、布局相关的js文件的抓取,那么搜索引擎就不知道你的网页布局是好是坏了。所以不建议屏蔽这些内容不让蜘蛛抓取”。

好了,今天的分享就到这里,希望能够对你有所帮助,当然如上的两个设置除了针对百度蜘蛛外,对所有的蜘蛛都有效果的。设置时请谨慎。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://laosuseo.com/?id=21009

分享给朋友:

“怎么屏蔽百度蜘蛛(Baiduspider)抓取网站” 的相关文章

SEO能赚钱吗?SEO赚钱的8种方式让你月入破6位数!

SEO能赚钱吗?SEO赚钱的8种方式让你月入破6位数!

SEO 赚钱应该怎么赚?能靠SEO 赚钱的一切前提是,你对于「 SEO 搜寻引擎优化」的理解足够到位,如果你对于SEO 懂得不够多,就算知道SEO 可以让你赚钱也没什么用,如果你想靠SEO 赚钱,你应该将SEO 领域里面大部分的知识都学好,这样就有机会靠SEO 赚取一些收入。SEO 是一门...

SEO和SEM的区别是什么?

SEO和SEM的区别是什么?

这是第39篇原创文章,主要分享一下SEO和SEM的区别具体有哪些,希望对大家有一点点帮助。关于SEO和SEM的区别我们可以从以下6个方面进行对比和区分,即定义、效果、价格、难度、展现、转化。第一点、在定义方面的区别(或者说范围)1、SEO指的是搜索引擎优化,更倾向于技术方面;2、SEM指的是搜索引擎...

个人做SEO需要会什么技术?

个人做SEO需要会什么技术?

做SEO必须会哪些?做seo必须会的物品愈多愈好,seo技术自身要会,搜索引擎原理能够会,数据库查询有关专业知识能够会,建网站及其前端代码能够会,一些普遍的互联网营销方式能够会,有关的数据统计分析方式及其手机软件能够会,与seo关联的哪些的都是会,做seo更会游刃有余。做seo不会太难,搞好seo则...

如何做好网站首页的设计和优化

如何做好网站首页的设计和优化

大家都知道网站首页对一个网站的重要作用,设计一个高度大气上档次的网站首页可以为网站增色不少。尤其是网站的首页作为引导用户浏览网站的其他页面在网站优化过程中及其重要,首页是我们整个网站的门面,是用户访问的第一个页面,做好首页的优化能极大的提高用户体验,所以做好网站首页的设计和优化就显得十分重要。第一、...

自学SEO和付费学SEO的区别?

自学SEO和付费学SEO的区别?

自学SEO和付费学SEO是两种不同的学习方式,它们有以下几个方面的区别: 1、时间成本: 自学SEO意味着你将付出更高的时间成本。付费学SEO则通常能在较短的时间内掌握SEO技巧,具体时间取决于学习者的基础和学习能力。 2、纠错成本:...

独立站如何做SEO?快来用这个超好用的谷歌工具

独立站如何做SEO?快来用这个超好用的谷歌工具

Google Autocomplete(谷歌自动联想)是最早出现在谷歌开发功能之一,之前称Google Suggest(谷歌建议),在多年前,该功能就对用户的搜索过程产生了巨大影响,SEO营销专家们也一直将其用作免费的关键词研究工具。...