设为首页  
联系我们  
加入收藏  
网页制作 冲浪宝典 图形图像 操作系统 软件教学 编程开发 认证考试 安全技术 站长专区 文学驿站 娱乐天地 游戏天地 办公软件
文章搜索
您的位置: 首页 >> 文章首页 >> 站长专区 >> 建站经验杂谈 >> 如何防止robot骚扰你的网页
精品推荐
建站经验杂谈点击TOP10
·WIN+IIS+PHP配置过程
·网页特效:符合标准的随滚动条滚动的广告代码
·网站优化方法和SEO实例参考案例
·网友原创:域名劫持的终极解决之道
·超简单实用的网页中任意漂浮的广告代码
·什么是世界排名?PR是什么?
·个人网上创业难点分析及如何发展才能成功
·令你的网站获得任意google pr值的方法
·Google官方讲解NOINDEX、NOFOLLOW、NOARCHIVE及NOSNIPPET等Meta标签用法
·如何提高网站的PR值
站长专区点击TOP10
·IIS+PHP+MYSQL配置功略
·Windows Server 2003 系统 IIS6.0 下的配置php5+zend+mysql
·IIS6.0下ASP的新增功能
·PHP5安装笔记
·WIN+IIS+PHP配置过程
·WinXP + Apache +PHP5 + MySQL + phpMyAdmin安装全功略
·将雅虎1G邮箱当作网络硬盘使用
·流媒体服务器架设
·XP配置IIS+ASP详解(新手本机调试ASP必读)
·博客代码大全 新年汇总之前篇
精选专题

如何防止robot骚扰你的网页

作者: 来源:http://www.xgdown.com/ 时间:2006-11-29 12:00:23

如何防止robot骚扰你的网页(1)

今早在ASPalliance.com">www.aspalliance.com上看到一篇文章(Stopping Automated Web Robots Visiting ASP/ASP.NET Websites
http://aspalliance.com/1018_Stopping_Automated_Web_Robots_Visiting_ASPASPNET_Websites),
主要是讲了下如何采取一些措施,防止robot过度去抓你的网站。看了一下,有的东西还是值得探讨下的,现归纳如下:

1、辨认ROBOT的一些参考标准
    Large numbers of requests from a single IP address or a range of IP addresses within the same subnet (i.e. the first three numbers of the IP address are identical).
·         Large numbers of requests for database driven content compared to the rest of the website.

·         Many requests made from browsers that do not support ASP Sessions.

·         Lots of and increasing numbers of website visitors, but no corresponding increase in transactions (e.g. sales!).

·         Large numbers of spam or automated requests being generated from online forms.
2、到http://www.robotstxt.org/wc/norobots.html上,可以找到一个组织提出的防御robot的建议标准(可惜这个不是什么权威标准拉,没什么约束力),在这里有一些平常我们可以用到的例子和方法,主要是搞一个robot.txt文件,放在网站根目录下,比如
User-agent: *
Disallow: /
禁止所有robot


允许所有的robot访问:

User-agent: *
Disallow:

User-agent: *
Disallow: /cyberworld/map/      不允许robot探访/cyberworld/map目录下的文件


User-agent: cybermapper    允许cybermapper这个robot
Disallow:

User-agent: *
Disallow: /cyberworld/map/
Disallow: /tmp/
Disallow: /foo.html       不允许访问foo.html这个文件了

3、如果不方便设置robot.txt的话,还可以在meta里做手脚,比如用
<meta name="robots" content="noindex, nofollow">

共2页 9 7 [1] [28 :>

如何防止robot骚扰你的网页 相关文章:
如何防止robot骚扰你的网页 相关软件:
特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
转载请注明来源:http://www.xgdown.com