目前网络上使用CMS的太多了,文章等所涉及的版权问题泛滥成灾。
我也想了好久,发觉自己的技术还是不够
所以在网上搜索了一下,有如下一些办法可以防止,
但却都不怎么理想!
防止采集,但有不拒绝搜索引擎的收录,所以不能加密源码,全部输出为图片之类的!
几种办法:
1、多做几个列表和内容模板,随机使用,对目前大多数cms来说,这种方法很容易实现,但是比较费时。但这也不是绝对有效的方法,对那些采集高手来说,加些模板判断又可以采了,
2、替换关键词,把文章里常见的关键词替换成自己的连接,连接最好不要有规律,这种方法只能对付一般的采集新手
3、在文章里加广告,这个目前只能对付很简单的采集程序。
4、图片防盗链,这个只对有图片的内容有效,不管是他保存到本地还是远程连接都可以防止,但对高手来说,加些欺骗功能又可以采了。
5、图片加水印,这个不是防止采集,只能让那些采集你网站的人顺便给为你做做广告。
6、把所有的内容全部生成图片然后加水印,这个最BT但最有效,不过搜索引擎就搜不到你的站了。
7、在文章里随机加一些与背景色相同的文字,有的人甚至把所有换行符<br>都替换成自己的一些文字,而且这些文字是随机的,这个方法比较有效,但对于那些真正喜欢你的内容想复制使用的人来说带来了困难,而且会让搜索引擎认为你在作弊。
二、
1、使用asp代码判断当前用户是否是机器人///
代码如下: <%
user_agent=Request.ServerVariables("HTTP_USER_AGENT")
http_reffer=Request.ServerVariables("HTTP_REFERER")
server_name=Request.ServerVariables("SERVER_NAME")
'检查当前用户是否是蜘蛛人
function check(user_agent)
allow_agent=split("Baiduspider,Scooter,ia_archiver,Googlebot,FAST-WebCrawler,MSNBOT,Slurp",",")
check_agent=false
for agenti=lbound(allow_agent) to ubound(allow_agent)
if instr(user_agent,allow_agent(agenti))>0 then
check_agent=true
exit for
end if
next
check=check_agent
end function
if check(user_agent)=False then
if http_reffer="" or left(http_reffer,len("http://"&server_name)+1)<>"http://"&server_name&"/" then
%>
<html><body>
<form action='' name=checkrefer id=checkrefer method=post>
</form>
<script>
document.all.checkrefer.action=document.URL;
document.all.checkrefer.submit();
</script>
</body></html>
<%response.end
end if
end if
%>
2、将文章中的部分文字用图片代替。。 看看这个网页
http://www.ewen.cc/books/bkview.asp?bkid=92144&cid=246020
肆虐了一整天的“麦莎”7日离开申城,给在风雨中开场的2005上海书展“狠”添[ <img height="38" src="http://www.ewen.cc/books/textout.asp?w=16&h=17&fn=宋体&fs=12&txt=-15925" width="20" align="absMiddle" alt="" /> ](注:[]中为图片,不是文字)一把火。中午过后,书展的售票处开始出现去年那样[ <img height="42" src="http://www.ewen.cc/books/textout.asp?w=16&h=17&fn=宋体&fs=12&txt=-19004" width="28" align="absMiddle" alt="" /> ]长队就是在文字中间夹杂很多图片,呵呵,而在其他地址访问的话就不能显示正确的文字,而显示版权信息,具体自己去操作咯
3、使用多个文章模板,使用个随机
4、加入验证码,输入验证码之后才能正常阅读
5 将文章分块,分别用表格拼在一起,
6 用一些干扰代码,增加采集的难度
总之,道高一尺,魔高一丈 呵呵 :)
我就找到这么多,大家还有什么方法都说说,就目前的情况来看没有真正的防采集
我们能做到的只能是尽量加大别人采集的难度,让一些水平不高的人无法采集,对高手来说,想防止采集只能拔服务器网线了!