防止采bai集第一种方法:在文章的头尾加上随机不固定的代码。网站采集者内在采集时,通常都是指定一个开容始位置和一个结束位置,截取中间的内容。
比如你的文章内容是"有讯软件信息网",则随机内容的加入方法:
<div id="xxx">随机内容1+博虎网络+随机内容2</div>
注:随机内容1和随机内容2每篇文章只要随机显示一个就可以了.
防止采集第二种方法:在文章正文页面插入重复特征头尾代码的注释。
文章列表加随机不同的链接标签,比如<a href="" class="xxx"><a class="xxx" href=''>,当然,这个可以用正则去掉,但足于对付通用的CMS采集系统了.
<!--<div id="xxx_文章ID">-->
其它标题或内容...
<!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">
随机内容1欢迎博虎网络建站随机内容2
<--</div>--></div><--</div>-->
即:正文头尾或列表头尾添加<!--重复特征代码-->
防采集第三种方法:加在文章列表的随便链接样式。目的是让采集的人无法抓到列表链接规律,无法批量进行采集.
如果是防止直接网页复制的方法:
使用原生js禁止鼠标右键