当前位置:首页 > SEO知识 > 正文内容

3种网站被镜像、采集的最佳解决方法

admin3年前 (2023-03-28)SEO知识548

今天上网发现搜索引擎中出现了一个和自己网站一模一样的网站,自己发了一篇文章,他就能自动跟进采集,并且文章排名比自己的还高,排在我网站的前面,FUCK啊,这是网站被恶意镜像了。

什么是网站镜像

网站镜像,就是通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为,这也是为什么有的网站注明禁止未授权不得做网站镜像的原因了,两个网站的内容完全一样,相似度过高必然会导致自己的网站受到影响。

网站镜像就是网站的复制版本。

如果是别人把自己的站原样做一份放在网上,网站的主人肯定是不能容忍的,可以用搜索引擎找到这样的站, 现在这样搞的人已经比较少了,以前我们经常会发现有人这样照抄别人的网站。所以,那时候很多网站都加了一句严禁建立镜像。

网站被镜像的3种解决方法

方法1:找到镜像网站的主机Ip,通过禁止Ip来解决

具体方法,大家百度解决,不多说。注意ping 域名的话不一定是真实IP,现在很多网站都隐藏真实IP了。

找到镜像网站的IP后,就可以禁止IP来阻止镜像网站复制你的站点了。这招对采集站也有效哦!

在网站主机提供商的网站后台控制面板里有设置IP访问黑名单,如果没有请联系服务器提供商。

如果你是wordpress站点,也可在.htaccess文件里添加如下代码:

#添加IP黑名单
Order Deny,Allow
Deny from 162.158.72.179

这个时候你再刷新一下镜像站点,是不是已经403报错了呢?

此方法的缺点就是如果镜像网站更换了ip,那我们的屏蔽就失败了

方法2:在中加入JS来防护

<script type=”text/javascript”>
if (document.location.host != www.laosuseo.com) {
location.href = location.href.replace(document.location.host,’www.laosuseo.com’);
}
</script>

或加上以下的JS代码

<script type=”text/javascript”>
rthost = window.location.host;
if (rthost != “www.laosuseo.com”) {
top.location.href = “http://www.laosuseo.com”;
}
</script>

将上面代码中的www.******.com改为你网站的首页主地址,如果上面填写的不是网站的主地址 www.******.com,而是 mobile***.com的话,就会导致网站一直刷新!

注:经过本站测试,如果镜像站屏蔽了JS,则该方法失效。所以,最好把方法2和方法3结合使用!

方法3:Js被屏蔽后防止镜像的方法

将以下代码加到网站的header.php中

<div style=”display:none;”>
<script>proxy2025 = false;</script>
<img src=”” onerror=’setTimeout(function(){if(typeof(proxy2025)==”undefined”){window.location.host=”www.laosuseo.com”;}},3000);’>
</div>

 <script>proxy2025 = false;</script>

img的onerror设置超时时间3000毫秒,将运行函数部分,检测是否还存在proxy2025字符,如果没有找到就会将主机的URL改为www.laosuseo.com;

经过测试,此代码在Chrome、IE11和360极速浏览器上均有效,会跳转到源站的原文章页!在Firefox上则无效果,镜像的文章页并不会跳转到原站…… 将代码中img标签的src引用地址改为空格或无效的图片地址后,在Firefox上也起作用了!

WordPress适用版

将下面的代码贴到 functions.php 中的最后一个 ?>之前即可:

/**
* 网站被恶意镜像怎么办
*/
//防止恶意HTTP_USER_AGENT采集
add_action('wp_head', 'lxtx_deny_mirrored_request', 0);
function lxtx_deny_mirrored_request()
{
$ua = $_SERVER['HTTP_USER_AGENT'];
$now_ua = array('FeedDemon ','BOT/0.1 (BOT for JCE)','CrawlDaddy ','Java','Feedly','UniversalFeedParser','ApacheBench','Swiftbot','ZmEu','Indy Library','oBot','jaunty','YandexBot','AhrefsBot','MJ12bot','WinHttp','EasouSpider','HttpClient','Microsoft URL Control','YYSpider','jaunty','Python-urllib','lightDeckReports Bot','PHP');
if(!$ua) {
header("Content-type: text/html; charset=utf-8");
wp_die('请勿采集本站,采集者木有小JJ!请正常访问,并认准【125建站网】官方网址!');
}else{
   foreach($now_ua as $value )
   if(eregi($value,$ua)) {
   header("Content-type: text/html; charset=utf-8");
   wp_die('请勿采集本站,采集者木有小JJ!请正常访问,并认准【125建站网】官方网址!');
   }
}
}
经过测试,在functions.php中加入此代码后,打开镜像站后显示“Internal Server Error”,强制刷新后显示我们设置好的提示文字“请勿采集本站,采集者木有小JJ!

另为保护JS安全,使用JS方法禁止网站被镜像的站长,在编写好JS代码后,最好使用站长网的JS代码混淆工具后,再放到网站上。

扫描二维码推送至手机访问。

版权声明:本文由老苏SEO转载并发布,如侵权可联系删除。

本文链接:https://laosuseo.com/?id=23868

标签: 网站采集
分享给朋友:

“3种网站被镜像、采集的最佳解决方法” 的相关文章

SEO是什么职业?SEO到底是做什么的?

SEO是什么职业?SEO到底是做什么的?

SEO到底是做什么的?SEO的工作内容是什么?这些问题中有很多是那些对SEO不太了解的人。他们经常听到SEO是SEO。SEO是什么职业?SEO到底是做什么的?他们认为这既神奇又好奇。其他人对SEO知之甚少,而且可能有传言说SEO是一份没有技术内容的工作,比如每天写文章和发送链。是的,作为SEO,你并...

如何做网站SEO站内优化,快速实现网站排名

如何做网站SEO站内优化,快速实现网站排名

在一些优化群里面,常常会看到一些才做优化的人说。百度优化排名不就是发发外链么。要知道现在的优化早已经不是五六年前的优化了,百度的算法一次次更新,对网站的要求越来越高。现在的百度更喜欢网站漂亮的,对用户友好的。无论是网站的打开速度、还是网站url的长度,以及文章的字体大小、间距,都是百度给予权重的考核...

如何学习SEO,自学SEO应该注意的几点步骤

如何学习SEO,自学SEO应该注意的几点步骤

原标题:如何学习SEO,自学SEO应该注意的几点步骤: 如何学习SEO,怎么自学SEO,这个问题是我们很多小白刚接触SEO时想了解的问题,当我们刚开始学习SEO时,我们可能会不知所措。诚然,我们可以通过网上很多资料或视频学习相关知识或是通过在线课程进行学习,但我们在决定...

新手该怎么做SEO?SEO基础教程

新手该怎么做SEO?SEO基础教程

SEO作为一种获取搜索引擎流量手段,一度受到很多人的追捧,如果做好的话,效果是不错的。但是基础的入门知识也很重要的,只有掌握基础入门知识,才可以取得不错的效果。百度快速排名、360快速排名、搜狗快速排名、谷歌快速排名之战神快排系统发布。学会做用户数据分析做SEO首先必须要懂的如何去分析数据,单一的只...

SEO优化服务这么“昂贵”的道理在哪里?

SEO优化服务这么“昂贵”的道理在哪里?

真实触及SEO后,您会发觉真实高效的SEO服务项目并不低廉。SEO也许变的价格昂贵的最普遍缘故是:市场竞争网站关键词全国排名的期望(与当地排名相对性)广泛性的研究分析和内容编写非常少或都没有SEO的新的网站创建品牌的成本费用SEO也许不价格昂贵的最普遍缘故是:不太受大家喜爱的商品或服务项目之前恰当管...

站内SEO优化具体要做什么?站内操作总汇

站内SEO优化具体要做什么?站内操作总汇

站内SEO优化有很多的,下面将会全面的给大家讲讲:网站内部SEO优化指的是什么,具体又有哪些工作要做?1、网站标题不论是网站主标题(也就是网站名称),还是网站内容页的内容标题,其中最主要的两者都尽可能的出现关键词,就说网站标题,大家都知道在网站标题中添加关键词可以让关键词得到更好的排名,但是站长需要...