一种支持Ajax框架的网络爬虫的设计与实现

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:simyhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前传统爬虫无法爬取Ajax动态网站,为解决该问题,该文设计了一个支持Ajax的网络爬虫,提出了AjaxCrawler的体系结构,实现了浏览器、模拟器、控制器和自动机,并通过实验,进行了爬取结果的对比,证明了其效果。
其他文献
针对某系列导弹的测试需求,设计了基于“PXI总线+测试适配器”的通用检测系统。通过对不同型号的导弹装备设计相应的适配器来实现系统的通用性,软件采用基于功能接口的结构和“
视频客户端一直被视频网站遏制,只能在没有鲜花和掌声的角落中生存。现在,视频客户端已经不满自己的处境,试图联手掀起波澜从不缺乏热点的视频江湖再次风起云涌。日前,暴风影
特征选择和分类器设计是网络入侵分类的关键,为了提高网络入侵分类率,针对特征选择问题,提出一种蚁群算法优化SVM选择和加权特征的网络入侵分类方法.首先利用支持向量机的分
研究了文本数字水印在追溯涉密纸质文档中的重要意义,介绍了常见的文本数字水印技术,分析了Brassil经典行移编码文本数字水印技术,在算法的标记策略中引入检验编码,文本行分
随着计算机技术的不断发展,数字图像处理也越来越重要,原始的数字化图像包含很多信息,为了进行图像信息的进一步处理,往往需要对原始的数字图像进行后续处理。论文主要针对常见的BMP位图图像,基于拉普拉斯算法设计并实现了一套锐化处理机制,并把该机制应用到具体的社会实际应用中。从实际的实验结果可以得到锐化后的图像在对比度、清晰度以及灰度特征等方面都有明显的改善,非常适合后续的数字图像处理工作,有较强的社会应
【正】 过去若干年中,触犯刑律的党员和干部,有不少没有被绳之以法,一般的情况是按党纪处理,较严重的开除党籍,撤销职务。如果这一情况不改变,人们就会提出这样的责难:我国还
新的基于网络的计算模式(如网格计算,云计算,P2P计算)的共同特点是计算节点之间都是通过互连网络进行通信。对互连网络各个计算节点产生的工作负载进行平衡是提高计算系统性能