推广

seo中网站镜像有什么影响。

iseeyu3年前 (2023-12-27)推广134

网站镜像是什么?如何判断?

镜像网站指的是别人将你的网站数据进行的同步,网站的界面及内容基本上都和你的网站保持一致,如果不是两个网站的主域不同站长自己都会认为是一个网站,两个网站之间就像镜子成像一样因此称为镜像网站。

网站被恶意镜像后有哪些危害?

那么到底什么是镜像呢?恶意镜像又被称为恶意解析,也被称作为恶意克隆。一般是别人用一些特殊的技术手段将我们的网站完全复制一个出来。除了域名不同,网站的内容完全和我们的网站相同。这些镜像网站的工作原理一般是当用户访问镜像的网站的时候,这个网站的程序就会自动来原网站来调取数据,然后修改相关的链接之后展现给用户,这种实际上系统资源还是利用的原来的站点的。这样用户和搜索引擎无法分辨哪个是真正的站点,哪个是镜像出来的站点。所以就会有可能导致正版网站有可能被搜索引擎停止收录,甚至删除已经被收录过的页面。并且,如果他的这个域名有不健康的内容那么有可能我们的站点也会受到相应的污染,严重者会被拦截报毒或者 K 站的情况。

那么我们应该怎么处理网站镜像呢?

1.通过屏蔽 IP 来防护网站被镜像

我们知道网站镜像的原理就是别人采集复制我们的网站,或者直接解析我们的网站内容进行展现,所以我们只需要屏蔽掉对方网站主机的 IP 即可。下面就以 wordpress 程序为例,其他程序的请自己测试。

我们首先要获取对方服务器的 IP,这个 IP 有可能是对方域名所绑定的 IP,也有可能不是,这个我们可以通过网站日志查看下哪些 IP 访问异常。如果对方是解析我们网站的话,我们可以通过下面的方法来获取对方的 IP。首先复制下面的代码,新建一个 php 文件,然后命名成“ip.php”上传到你的网站根目录。

<?php$file = "ip.txt"; //保存的文件名$ip = $_SERVER['REMOTE_ADDR'];$handle = fopen($file, 'a';fwrite($handle, "IP Address:";fwrite($handle, "$ip";fwrite($handle, "
";fclose($handele);?>

然后访问镜像了你网站的站点,在地址后面加上…/ip.php 这段代码,然后你的网站根目录会出现 ip.txt 文件,我们打开这个文件之后就会看到一个 IP 地址。IP 获取之后我们就需要屏蔽对方的 IP,以 wordpress 为例,我们找到网站的根目录的.htaccess 文件。我们编辑下这个文件,我们添加如下的代码(代码里的 IP 修改成我们从 ip.txt 里面复制的 IP):

#添加 IP 黑名单Order Deny,AllowDeny from 162.158.72.179

如果你的网站采用的 CDN 加速的话,我们可以直接在 CDN 后台添加 IP 黑名单。此时如果你刷新下镜像的网站,如果对方网站是 403 报错的话,就说明我们已经处理完毕了,剩下的就交给蜘蛛来处理了。

2.通过 js 来防护网站被镜像

在网站的头部(也被称作为页眉或者 head)

<head></head>

标签里面添加以下代码:

<script type="text/javascript">if (document.location.host != "www.seokuaipai.cn" {location.href = location.href.replace(document.location.host,'www.seokuaipai.cn';}</script>

或者加上以下 js 代码

<script type="text/javascript">rthost = window.location.host;if (rthost != "www.seokuaipai.cn" {top.location.href = "https://www.seokuaipai.cn";}</script>

需要注意的是,代码中的 www.seokuaipai.cn 域名要换成你的主域名,如果填写错误的话,会导致网站一直在刷新的状态。但是这个也是有缺点的,如果对方的镜像网站屏蔽了 js 的话这个方法是不能用的,所以方法 1 和方法 2 结合使用效果更佳。

3.如果对方屏蔽了 js,应该如何防止被镜像?

找到网站的页眉,也就是 header.php 文件,我们编辑这个文件添加如下代码:

<div style="display:none;"><script>proxy2016 = false;</script><img src="" onerror='setTimeout(function(){if(typeof(proxy2016)=="undefined"{window.location.host="www.seokuaipai.cn";}},3000);'></div>

有些网站是屏蔽 js 代码比如下面的这个:

<script>…</script>

所以

<script>proxy2016 = false;</script>

代码将被过滤掉,img 的 onerror 设置超时时间 3000 毫秒,将运行函数部分,检测是否还存在 proxy2016 字符,如果没有找到就会将主机的 URL 改为 www.seokuaipai.cn;为了安全起见,将 js 部分可以使用 js 代码混淆,可以使用站长工具进行代码混淆《代码混淆工具》比如本站的混淆结果如下:

<div style="display:none;"><script>proxy2016 = false;</script><img src=" " onerror='setTimeout(function(){if(typeof(proxy2016)=="x75x6ex64x65x66x69x6ex65x64"{window["x6cx6fx63x61x74x69x6fx6e"]["x68x6fx73x74"]="x77x77x77x2ex35x69x7ax7ax2ex63x6fx6d";}},3000);'></div>

经过测试,这代码在 Chrome、IE11、360 极速浏览器上都有效,并且会跳转到原来网站的文章页,如果需要火狐浏览器生效的话需要将代码里面的 img 标签的 src 地址修改成空或者无效图片地址就可以了。

4.借助 img 的 Onerror 事件来进行跳转防止镜像

此方法就是通过拆分域名与镜像站对比,然后用 img 标签 src 空值触发 onerror 来执行 js 比对,比对失败则跳转回源站。

①、WordPress 专用版

具体的代码如下,需要复制到 functions.php 最后一个?>之前:

add_action('wp_footer','lxtx_deny_mirrored_websites';function lxtx_deny_mirrored_websites(){ $currentDomain = 'www" + ".5izz." + "com'; // $currentDomain = '"zhangge." + "net"'; echo '<img style="display:none" src=" " onerror='this.onerror=null;var str1="'.$currentDomain.'";str2="docu"+"ment.loca"+"tion.host";str3=eval(str2);if( str1!=str3 && str3!="cache.baiducontent.com" && str3!="webcache.googleusercontent.com" && str3!="c.360webcache.com" && str3!="cncc.bingj.com" && str3!="snapshot.sogoucdn.com" ){ do_action = "loca" + "tion." + "href = loca" + "tion.href" + ".rep" + "lace(docu" +"ment"+".loca"+"tion.ho"+"st," + ""' . $currentDomain .'"" + "";eval(do_action) }' />';}

Ps:如果是丢到 wp_head,经过测试发现图片放到 head,浏览器会自动进行错误调整,导致一些本来在 head 的元素被丢到了 body 当中,比如 style.css,估计网页标准中 head 里面就不应该放置图片,所以移到了 footer 当中。

或者这段代码

add_action('wp_footer','lxtx_deny_mirrored_websites';function lxtx_deny_mirrored_websites(){ $currentDomain = "www' + '.5izz.' + 'com"; // $currentDomain = "zhangge' + '.' + 'net"; echo '<img style="display:none" src="nothing" onerror="this.onerror=null;var str1=''.$currentDomain.'';str2='docu'+'ment.loca'+'tion.host';str3=eval(str2);if( str1!=str3 ){ do_action = 'loca' + 'tion.' + 'href = loca' + 'tion.href' + '.rep' + 'lace(docu' +'ment'+'.loca'+'tion.ho'+'st,' + '\\'' . $currentDomain .'\\'' + '';eval(do_action) }" />';}

或者这段代码

add_action('wp_footer','lxtx_kimsom_reverse_proxy_defense', 99);function lxtx_kimsom_reverse_proxy_defense(){ $currentDomain = '"www." + "5izz" + ".com"'; echo '<img id="inlojv-rpd" style="display: none;" src="nothing" data-url="'.home_url().'" />';}

②、HTML 通用版

既然是利用 js 代码,那么就能用到如何 html 页面当中了。要不是为了可以放到 wp 的 functions.php,都没必要写成 php 的模式,直接用 html 代码即可:

<img style="display:none" src=" " onerror='this.onerror=null;var currentDomain="www." + "ilxtx" + ".com"; var str1=currentDomain; str2="docu"+"ment.loca"+"tion.host"; str3=eval(str2) ;if( str1!=str3 && str3!="cache.baiducontent.com" && str3!="webcache.googleusercontent.com" && str3!="c.360webcache.com" && str3!="cncc.bingj.com" && str3!="snapshot.sogoucdn.com" ){ do_action = "loca" + "tion." + "href = loca" + "tion.href" + ".rep" + "lace(docu" +"ment"+".loca"+"tion.ho"+"st," + "currentDomain" + "";eval(do_action) }' />

将以上代码中的: var currentDomain="www." + "5izz" + ".com"; 自行拆分成自己的域名,避免被镜像代码替换掉,比如: var currentDomain="jszseo." + "com";

然后将代码添加到网站的之后即可(不建议放置到里面,具体原因上文已说明),这个版本适合任何网页。

5:通过禁止某些 User Agent 特征来防止镜像

①、php 通用版:

把下面的代码放在 index.php 中的第一个 如果使用上面的 php 版本,WordPress 每次更新就会需要操作 index.php,比较麻烦,因此弄个专版。

将下面的代码贴到 functions.php 中的最后一个?>之前即可:

add_action('wp_head', 'lxtx_deny_mirrored_request', 0);function lxtx_deny_mirrored_request(){$ua = $_SERVER['HTTP_USER_AGENT'];$now_ua = array('FeedDemon ','BOT/0.1 (BOT for JCE)','CrawlDaddy ','Java','Feedly','UniversalFeedParser','ApacheBench','Swiftbot','ZmEu','Indy Library','oBot','jaunty','YandexBot','AhrefsBot','MJ12bot','WinHttp','EasouSpider','HttpClient','Microsoft URL Control','YYSpider','jaunty','Python-urllib','lightDeckReports Bot','PHP'; if(!$ua) {header("Content-type: text/html; charset=utf-8";wp_die('请勿采集本站,否则会娶不到老婆喝凉水都塞牙!请正常访问,并认准【快排科技】官方网址!';}else{ foreach($now_ua as $value ) if(eregi($value,$ua)) { header("Content-type: text/html; charset=utf-8"; wp_die('请勿采集本站,否则会娶不到老婆喝凉水都塞牙!请正常访问,并认准【快排科技】官方网址!'; }}}

经过测试,在 functions.php 中加入此代码后,打开镜像站后显示“Internal Server Error”,强制刷新后显示我们设置好的提示文字“请勿采集本站,否则会娶不到老婆喝凉水都塞牙!

扫描二维码推送至手机访问。

版权声明:本文由西安泽虎代运营发布,如需转载请注明出处。

转载请注明出处https://www.0291.com.cn/post/110936.html

相关文章

外链为什么为消失阻止外部链接消失的四个步骤。

外链为什么为消失阻止外部链接消失的四个步骤。

如果你从事SEO行业有一段时间了,你会发现很多SEO专家都习惯统计自己的外链结构,如果你没有独立的软件记录这部分内容,那么我想你一定会有一个Excel表格,随着你运营网站时间的延长,你在做定期外链诊断的时候,经常会发现一些外链丢失,不乏一些高质量外链。 为什么外部链接会消失,该如何阻止? 我们知...

2019安卓App上架方法流程!

2019安卓App上架方法流程!

  自从出现移动互联网以来,越来越多的APP投入应用市场,并被广大社会群众所使用,如何做安卓市场的App上架呢?以下为您讲解2019年最新APP上架方法流程! 市场开放平台官网 应用宝http://open.qq.com/ 百度手机助手http://app.baidu.c...

小白想要做好软文营销推广,这3个关键因素需掌握

随着互联网的不断发展,不管在哪个平台都可以看到软文,由此我们不难看出已经成为互联网营销中缺一不可的营销方式了。但是不是所有自媒体人都能很好的掌握这种方式,大部分新人的软文营销效果都比较差,这是为什么呢?主要原因在于没有掌握软文营销的关键。那具体有哪些关键的技巧呢,下面我就跟...

关键词优化怎么收费。

关键词优化怎么收费。

公司网站找了几家公司做优化,结果做的关键词是一样的,但是价格完全不一样,高的特别贵,让人无法接受,低的又感觉不靠谱,请教懂行的人,或者专业的优化团队介绍一下现在的优化收费,谢谢! 网站优化的价格在各个优化公司或个人给出的价格不一,主要原因是各自的优化服务有区别。一般来说,优化收费由按天按关键词...

请问五脏六腑供给大脑的能量是什么?

请问五脏六腑供给大脑的能量是什么?

大脑的能量主要来自细胞,还有线粒体,神经生物电,等他的能量不单一,目前我觉得他的能量是无法从食物中摄入的,因为它是由dna基因组组成的结构和功能食物中的一切合成的都不能让他修复,更多的是化学能,生物电能好问题兄弟。...

中共中央新闻发布会:完善分配制度,规范财富积累机制

中共中央新闻发布会:完善分配制度,规范财富积累机制

中国青年报客户端北京10月24日电(中青报·中青网记者 张国)在今天中共中央举行的新闻发布会上,中共中央政策研究室主任江金权说,中国一直在探索共同富裕道路。他解释说,改革开放以来,我们鼓励一部分地区、一部分人先富起来,鼓励先富带后富。“齐步走”的办法解决不了贫困问题,我们目...

现在,非常期待与您的又一次邂逅

我们努力让每一部企业宣传片和抖音短视频成为商业大片