当前位置:首页 > SEO知识 > 正文内容

怎么屏蔽百度蜘蛛(Baiduspider)抓取网站

admin3年前 (2023-03-09)SEO知识321

百度蜘蛛抓取我们的网站是希望将我们的网页收录到它的搜索引擎里,未来当用户搜索时,能为我们带来一定的SEO流量。当然我们并不是希望搜索引擎什么都抓取。

所以,这时我们只希望我们希望在搜索引擎被搜索到的内容进行抓取。像用户隐私、后台信息等都不希望搜索引擎被抓取和收录。解决这样的问题最好的方式有两种,如下:

robots协议文件屏蔽百度蜘蛛抓取

robots协议是一个放在网站根目录下协议文件,可以通过URL地址:http://你的域名/robots.txt进行访问。当百度蜘蛛抓取我们网站时,会先访问这个文件。因为里面告诉了蜘蛛哪些可以抓取,哪些不可以抓取。

robots协议文件的设置比较简单,可以通过User-Agent、Disallow、Allow这三个参数进行设置。

●User-Agent:对不同搜索引擎的声明;

●Disallow:不允许抓取的目录或页面;

●Allow:允许抓取的目录或页面,一般可以省略不写,因为你不写什么是不可以抓的那就都是可以抓的;

下面我们来看一个示例,场景是我不希望百度抓取我网站所有的css文件,data目录、seo-tag.html页面

User-Agent: Baidusppider

Disallow: /*.css

Disallow: /data/

Disallow: /seo/seo-tag.html

如上,user-agent声明的蜘蛛名称,这个意思也就是说,针对百度蜘蛛。下面不能抓取”/*.css”,首先前面的/指的是根目录,也就是你的域名。*是通配符,代表任意内容。其意思就是所有文件,以.css结尾的都不能抓取。下面两个你自己体会吧。逻辑是一样的。

如果你想检测自己最后设置的robots文件对不对,可以访问这篇文章《检查robots是否正确的工具介绍》,有详细的工具能够检测你的设置。

通过403状态码,限制内容输出,屏蔽蜘蛛抓取。

403状态码,是http协议中一个网页返回状态码。当搜索引擎碰到403状态码时,就知道这类页面是又权限限制的。我是不能访问的。例如需要登录才能查看的内容,搜索引擎本身是不会登录的,那么你返回403的同时,他也知道了这都是权限设置页面,无法读取内容。自然也就不会收录。

返回403状态码的同时,应该有一个类似404页面的页面。提示用户或者蜘蛛这类页面想要做什么才能访问。两者缺一不可。你只有提示页面,状态码返回200,那对于百度蜘蛛就是大量的重复页面了。有403状态码但返回不同的内容。这也不是很友好。

最后针对robot协议,还想再补充一点:“现在搜索引擎会通过你网页的排版、布局来识别你网页的体验友好度,如果屏蔽了css文件、布局相关的js文件的抓取,那么搜索引擎就不知道你的网页布局是好是坏了。所以不建议屏蔽这些内容不让蜘蛛抓取”。

好了,今天的分享就到这里,希望能够对你有所帮助,当然如上的两个设置除了针对百度蜘蛛外,对所有的蜘蛛都有效果的。设置时请谨慎。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://laosuseo.com/?id=21009

分享给朋友:

“怎么屏蔽百度蜘蛛(Baiduspider)抓取网站” 的相关文章

网站优化怎么收费?网站优化排名价格多少?

网站优化怎么收费?网站优化排名价格多少?

网站优化怎么收费?网站优化排名价格多少?通常情况下,网站优化收费有按天按词、按月和按年收费,三种收费不同效果也不同,接下来迅步来详细介绍一下这三种方式区别,有助于甲方客户来针对自己详细情况来具体选择哪种方式。一、按天按词收费关键词是做好网站SEO的核心,而一个关键词优化难度则决定了我们网站优化成本高...

Google近期将推出演算法更新,以打击非原创、低品质文章在搜寻结果当中的排名

Google近期将推出演算法更新,以打击非原创、低品质文章在搜寻结果当中的排名

Google 在8/18 号于部落格当中表示,将在未来几周内推出新的搜寻引擎演算法更新。此次更新的目的是为了让使用者能够搜寻到更高品质的内容,而这个新的SEO 演算法则有助于减少目前在搜寻结果页面中排名靠前,但其内容却是低品质或是非原创的网站。这次的演算法更新,其目的似乎是针对内容农场而来的,像是常...

小白三分钟学会网站seo工作,不要再被割韭菜了

小白三分钟学会网站seo工作,不要再被割韭菜了

根据调研市场发现很多的传统公司都没有SEO人员打理一个网站,网站建设后一直没什么流量和排名怎么办? 没流量的网站相当于没用。小白怎么三分钟学会SEO工作? 一、 分析同行的网站 通过SEO工具输入site:同行的域名,分析同的SEO行...

教你通过SEO优化保持网站排名稳定

教你通过SEO优化保持网站排名稳定

HI,小伙伴们你们好,今天比较忙,抽个时间来说下关于手把手教你通过SEO优化保持网站排名稳定,以及关于seo优化,网站排名稳定等等各种干货,其实这篇文章主要还是为新手朋友整理的,总的来说思路还是很重要!对于长期从事SEO优化的员工来说,我们经常面临的挑战之一就是通过良好的网络营销策略,使网站的排名长...

站内优化从三处下手

站内优化从三处下手

SEO有句老话,内容为王,外链为皇,我们可以理解为SEO需要做两个方面的事情,一个是站内的优化,一个是站外的优化,那么在站内我们应该如何去优化,或者说我们应该从哪下手去做站内优化呢?(自身从内部改变,才能让网站SEO排名更佳)内链内链不是随意建设的,最好的内链便是自然推荐那些与本文密切相关的页面,这...

谷歌SEO优化定制推获客WS不封号引流时代做全渠道的营销

谷歌SEO优化定制推获客WS不封号引流时代做全渠道的营销

原标题:谷歌SEO优化 定制推获客WS不封号引流时代做全渠道的营销知道谷歌搜索引擎优化的朋友都知道,如果一个外贸企业想要推广自己的品牌和服务和服务,获得更多的客户资源,那么占据全球搜索引擎市场90%的谷歌是最好的渠道,如果他们想以最低的成本达到最高的投资回报率,那么谷歌搜索引擎优化是一种必要的推广方...