基于网页浏览行为的反爬虫研究

来源 :现代计算机 | 被引量 : 0次 | 上传用户:zch_kitty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据的背景下,数据的潜在价值被不断地挖掘出来。能够有效识别或阻挡爬取行为的反爬虫方法对于商业服务网站来说尤为重要。基于网页浏览行为,提出一种新的反爬虫方法。该方法通过对真实用户和网络爬虫浏览网页的行为进行特征提取,然后构造并使用决策树对一个用户是否属于爬虫进行预测。该方法对网络爬虫的敏感性高,并具有较低的假阴率。
其他文献
利用制革污泥堆肥后进行大田试验,对铬的化学行为进行了研究,为制革污泥再利用提供理论依据.研究表明,施肥时间距现在越近,铬的生物有效性越大.随着时间的延长,铬向深层的迁
2002年5月-2003年9月对渤海天津海域赤潮监控区进行了网采浮游植物的生态学调查,天津海域共发现浮游植物37属68种,其中硅藻为优势类群,共24属51种,占总种数的75.00%;甲藻7属11种;其他
0 引言黑龙江省处于东北亚经济圈中心.确定以东北亚信息中心为黑龙江省信息化发展的长期战略目标,以提高信息化水平,对于促进黑龙江省经济的发展具有极其重要的意义.文中从东
期刊
通过建筑质量综合评定系统的开发实例,介绍了在Delphi开发平台下调用Formula One组件进行通用表数据处理的方法.
介绍了在Visual C+ +基于MFC对一种数据采集卡PCL-812PG的编程操作方法,并给出了具体的编程步骤。