当前位置:首页 > SEO培训 > 正文内容

教你如何正确设置使用robots.txt文件

admin3年前 (2022-07-22)SEO培训524

各位站长朋友都知道网站Robots.txt文件,所谓的Robots.txt文件就是网站根目录下面的纯文本文件,是蜘蛛索引网站时第一个要读取的文件,它用于指定spider在您网站上的抓取范围,当网站中有不需要被蜘蛛抓取的内容时,可以使用robots.txt文件加入屏蔽,以免增加网站蜘蛛的抓取难度。

所以,正确设置使用robots.txt文件方面可以做网站安全的防护,更重要的是用来做优化,减少无效页面的收录,提升站点的排名效果。

今天就跟大家分享一下如何正确设置使用robots.txt文件?

第一:如何正确书写robots.txt文件,robots.txt文件的书写格式是什么?

要想正确的书写robots文件,首页要对文件的基本函数进行了解:

User-agent:在后面加上* 意思是允许任何搜索引擎对网站进行抓取;User-agent: Baiduspider意思是允许百度搜索引擎对网站进行抓取,如果网站中只写了这个属性,那就表明此网站只接受百度蜘蛛的抓取,其他蜘蛛不可以索引。

Disallow:这个函数的意思是静止蜘蛛访问函数后面的网站目录,如果网站所有的都允许那就写:如果都允许收录: Disallow:,像淘宝网的文件中写到,禁止百度蜘蛛的抓取,网站任何位置都不允许抓取。

Allow:该项的值用于描述希望被访问的一组URL,与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL 是允许robot访问的。例如"Allow:/hibaidu"允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。

使用"*"and"$":Baiduspider支持使用通配符"*"和"$"来模糊匹配url。

"*" 匹配0或多个任意字符

"$" 匹配行结束符。

第二:设置Robots.txt文件时应注意哪些事项?

1、作为搜索引擎最先访问的目录,过长的robots文件也会影响蜘蛛的爬取速度,所以对于禁止搜索引擎的网页,可以适度的去使用noffollow标记,使其不对该网站传递权重。

2、在robots设置当中关于Disallow当中/和//的区别。举例:Disallow; /a 与Disallow: /a/的区别,很多站长都见过这样的问题,为什么有的协议后加斜杠,有的不加斜杠呢?笔者今天要说的是:如果不加斜杠,屏蔽的是以a字母开头的所有目录和页面,而后者代表的是屏蔽当前目录的所有页面和子目录的抓取。

通常来讲,我们往往选择后者更多一些,因为定义范围越大,容易造成“误杀”。

3、对于Disallow和Allow的设置是有先后顺序之分的,搜索引擎会根据第一个匹配成功的Allow与Disallow来确定首先访问那个url地址。

4、已经删除的目录屏蔽不建议使用Robots.txt文件屏蔽。很多站长往往删除一些目录后,怕出现404问题,而进行了屏蔽,禁止搜索引擎再抓取这样的链接。事实上,这样做真的好吗?即使你屏蔽掉了,如果之前的目录存在问题,那么没有被蜘蛛从库中剔除,同样会影响到网站。

   建议最佳的方式是:将对应的主要错误页面整理出来,做死链接提交,以及自定义404页面的处理,彻底的解决问题,而不是逃避问题。

5、在robots设置当中“*”和“$”的设置,其中”$” 匹配行结束符。”*” 匹配0或多个任意字符。

   最后,笔者要说robots文件的发展已经有10年之余,很多搜索引擎已经对文件进行认可,正确的文件使用可更好的帮助站长们优化网站,否则使用不当便会造成很大的影响。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://laosuseo.com/?id=1575

标签: robots.txt
分享给朋友:

“教你如何正确设置使用robots.txt文件” 的相关文章

哪些因素影响着网站的收录量

哪些因素影响着网站的收录量

在我们做网站推广时对网站的收录都是非常重视的,因为网站的收录对网站的关键词排名以及网站的流量都有很大的影响。但是随着搜索引擎算法的调整,很多站长朋友都反映自己网站收录忽高忽低,非常不稳定。那么我们如何才能稳定网站收录,稳步增加网站收录量呢?今天笔者就跟大家分享一下哪些因素影响着网站的收录量,希望对大...

网站建设过程中有助于网站SEO优化的基础设施

网站建设过程中有助于网站SEO优化的基础设施

网站建设过程中有助于网站SEO优化的基础设施SEO是指通过对网站进行站内优化和修复(网站Web结构调整、网站内容建设、网站代码优化和编码等)和站外优化,从而提高网站的网站关键词排名以及公司产品的曝光度,上海建设网站建设过程中都在潜意识中运用了SEO优化知识。最早的搜索引擎是靠网站而活的,所以在搜索规...

老域名做新站多久收录?

老域名做新站多久收录?

对于网站SEO这个行业,很多老SEO人都知道,老域名有很大的优势,因为以前的建站历史,域名自身拥有一定的权重,很多做新网站的公司就都想要购买老域名做站,因为一旦使用老域名做新网站,搜索引擎可能会更加更快信任新站点,从而加快收录和排名情况,但是,最近客户咨询,我明明特意买了老域名,网站做好都个把月了,...

网站排名下降,算法调整,该如何xoooo

网站排名下降,算法调整,该如何xoooo

原标题:网站排名下降,算法调整,该如何调整SEO推广策略?在这个互联网时代,想要快速变现那么就不得不借助网站+百家号的运营方式,而平台对企业而言,它的优势就在于能够快速提升账号的排名,扩大品牌知名度。前几日,我有个朋友就问过我,如果一段时间排名变了是不是搜索引擎就要有大动作了?的确是这样,我这几天观...

睢阳区农技推广网络激发产业兴农xooo

睢阳区农技推广网络激发产业兴农xooo

6月28日,一场大雨过后,睢阳区高辛镇金庄村大豆玉米带状复合种植基地里,尺把高的玉米苗随风摆动,拃把高的大豆苗青翠欲滴。远远望去,一眼望不到头的基地里绿意盎然、生机勃发。多亏了农技区域站站长庞德斗在品种选择、模式选择、播种方法上提供的指导和服务。基地负责人胡群山说,今年,他通过抗旱播种的200亩大豆...

干货分享!外贸网站推广谷歌SEO优化新手入门教程

干货分享!外贸网站推广谷歌SEO优化新手入门教程

如果你对英文SEO优化感兴趣,这篇文章绝对可以作为你自学的入门手册,本文接近1万字,看过的人都觉得很赞,支持优易化的话就请收藏吧,让更 多人知道。 这篇文章介绍了什么是SEO,外贸网站为什么要做SEO,网站SEO优化的方法和步骤(包括站内优化、站外优化和技术优化),常用的SEO工具...