基于网页浏览行为的反爬虫研究

来源 :现代计算机 | 被引量 : 0次 | 上传用户：zch_kitty

【摘要】

：

在大数据的背景下,数据的潜在价值被不断地挖掘出来。能够有效识别或阻挡爬取行为的反爬虫方法对于商业服务网站来说尤为重要。基于网页浏览行为,提出一种新的反爬虫方法。该

【作者】

：

刘洋

【机构】

：

四川大学计算机学院

【出处】

：

现代计算机

【发表日期】

：

2019年7期

【关键词】

：

网络爬虫反爬虫方法用户浏览行为网站 Web Crawler Anti-Spider User Browsing Behavior Website

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在大数据的背景下,数据的潜在价值被不断地挖掘出来。能够有效识别或阻挡爬取行为的反爬虫方法对于商业服务网站来说尤为重要。基于网页浏览行为,提出一种新的反爬虫方法。该方法通过对真实用户和网络爬虫浏览网页的行为进行特征提取,然后构造并使用决策树对一个用户是否属于爬虫进行预测。该方法对网络爬虫的敏感性高,并具有较低的假阴率。

其他文献

含少量铬污泥用作农肥的可行性研究

利用制革污泥堆肥后进行大田试验,对铬的化学行为进行了研究,为制革污泥再利用提供理论依据.研究表明,施肥时间距现在越近,铬的生物有效性越大.随着时间的延长,铬向深层的迁

期刊

铬污泥堆肥可行性chrome sludge compose feasibility

渤海天津海域的网采浮游植物群落结构与赤潮植物的初步研究

2002年5月-2003年9月对渤海天津海域赤潮监控区进行了网采浮游植物的生态学调查，天津海域共发现浮游植物37属68种，其中硅藻为优势类群，共24属51种，占总种数的75．00％；甲藻7属11种；其他

期刊

浮游植物群落结构赤潮渤海phytoplankton community structure red tide Bohai Sea

东北亚信息中心可行性研究

0 引言黑龙江省处于东北亚经济圈中心.确定以东北亚信息中心为黑龙江省信息化发展的长期战略目标,以提高信息化水平,对于促进黑龙江省经济的发展具有极其重要的意义.文中从东

期刊