搜索引擎应对垃圾网页的技术研究

来源 :电脑知识与技术 | 被引量 : 1次 | 上传用户:binhuchen007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍了常见的垃圾网页作弊方式。并对垃圾网页的识别方式进行了详细分析,包括基于网页内容的垃圾网页识别技术、基于链接结构来识别垃圾网页的Trust Rank算法以及目前比较流行的用于垃圾页面识别的机器学习分类法。其中采用Trust Rank算法与机器学习分类法来识别垃圾网页具有一定的通用性且具有与作弊方式无关的特性。最后提出了一些基于用户行为模式来识别垃圾网页的新思路。
其他文献
随着教学改革浪潮的推进,越来越多的学校乘着这股改革洪流积极的进行着教学模式的改变和优化,高职院校作为我国一个重要的学校类型,其校内的信息管理教学也面临着改革的机遇
《大学计算机基础》是一门理论性和实践性都很强的课程,然而面对日新月异的计算机应用技术,很多学校都遇到了如何在有限的课时内,既能让学生跟上时代的步伐掌握新技术、新理
邯郸和邢台这两个冀南城市,若要在京津冀协同发展背景下赢得更多发展机会,就需要在进行行政区划调整的基础上,采取整合发展策略,探索邯北邢南区域的整合发展措施。沙河市+南和县+
工程设计问题本质上是一个约束满足问题,以往的研究集中在约束的求解上,忽略了对约束的检测和约束信息的可视化,随着工程规模的扩大和领域专家的需要,现代CAD系统与其约束自
【正】项目地点:北京市朝阳区设计单位:北京富润成照明系统工程有限公司主要完成人:朱宇巢勇强吕海鹏李银1、项目介绍居然之家北京北四环店为大型家居建材主题购物中心,南邻