有效防止网站内容被采集的方法有哪些
在百度算法不断更新的情况下,搜索引擎越来越重视网站内容的质量。
不少站长为此不断坚持撰写原创文章,原创文章对于新站的意义非常重大,虽然原创的文章会消耗掉不少的时间与精力,但百度对原创内容非常喜欢。
但是,当自己网站中大量的内容被别人采集,特别是被一些权重较高的站采集转载后,自己辛辛苦苦的原创却成了别人的嫁衣,所以,防止采集并不仅仅是保护网站的内容,更是保护站长的劳动成果,保持站长工作的积极性。
今天笔者整理了以下几个有效防止网站内容被采集的方法,我觉得还是有一定的作用的,现在分享给大家!
方法一:为网站内容图片加水印
当你的文章中带有图片时候,记得给文章中的图片加上水印,这样就留下了你的版权,对方要采集你的文章后,不可能一张一张去PS的,这样也算是变相地帮助我们宣传网站。
方法二:屏蔽相关IP
通过数据分析,筛选出可疑的IP然后屏蔽掉,这样做当然不够保险,如果采集打游击根本没有那么多精力应对。
方法三:文章内隐藏的锚文本链接
不少站长的写作习惯都会在原创文章的末尾放上版权信息,其实这样的信息并没有什么真正的意义,如果被抄袭或者是采集,自然不会管这些信息。当然在文章末尾放上这样的链接或者锚文本并不是一个好习惯,只有才文章的中间自然的出现关键词或者锚文本链接,当别人采集到这篇文章的时候,能够带上链接,这样损失也不大,全当做是外链了,避免被删掉,如何隐藏好链接才是关键。在文章结尾加链接那是一眼就能看到的,其实可以在文章中加链接,锚文本的颜色也可以设置成普通文章的颜色。不少站长都不会仔细的检查,其实这也是治标不治本。
方法四:穿插信息
写文章的时候,尽量随机的去穿插一些你网站名字,链接,作者之类的信息,只要能够读的通顺就尽力多加一点。对方要采集你的文章的话,他也要花大量的时间去处理,久而久之,便不会愿意采集我们的文章了。同时对于马虎的采集者来说,就留下了你的信息。
方法五:简单的变换模板
采集一般只是采集具体的内容,它就要从代码里面找到内容开始和结束的关键代码,如果网站带有随机模板就好办多了,但是一般站长没有随机的模板,怎么办呢。我建议可以小小的改动一下内容开始或结束处的代码,我觉得改结束部分的代码比较稳妥,因为搜索引擎读代码是从前往后读的,这样小的改动并不会让搜索引擎觉得网站改版了。
方法六:将更新网站内容的URL提交
我们最担心的是百度不收录自己网站的内容,将更新网站内容的URL直接提交给百度,ping一下是不会有坏处的,虽然这些URL不会马上被收录,但是ping和外链都是吸引蜘蛛能够快点过来,在之前百度推出的原创星火计划,这套完善的原创内容识别系统,目的是鼓励原创内容,打击采集、抄袭的行为,让原创内容能够最快的收录。
虽说这原创星火计划目前还是处在初期试验阶段,但在新站上还没什么好的体现。以上方法虽然能杜绝内容被盗用,却不能从根本上决绝这个问题。