基于用户访问模式的搜索引擎超链分析技术研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:helly986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
第三代搜索引擎有如下几个特点:索引数据库的规模继续增大,一般的商业搜索引擎都保持在几千万甚至几十亿个网页;由于搜索返回数据量过大,检索结果相关度评价成为研究的焦点.相关的研究又可以分为两类;一类是对超文本链的分析;另一类是用户信息的反馈.该文从将这两种途径结合的角度出发,在挖掘用户访问模式的基础上对超链分析的算法进行了改进,提出了基于频繁访问路径的PageRank算法.该文的主要工作是在分析现有的计算检索结果相关度算法的基础上,结合对用户反馈信息——用户访问模式的挖掘,提出了一种改进的检索结果排序算法:基于频繁访问路径的PageRank算法.论文还给出了实验结果,在实验对比的基础上说明了基于频繁访问路径的PageRank算法的排序结果与普通的PageRank算法有在排序结果上有了很大的改进.
其他文献
系统存在安全漏洞是导致网络入侵的根本原因.如何预先检测系统,找出系统存在的安全隐患,及时修补存在的安全漏洞,最大程度地降低系统安全的风险程度,己成为网络安全领域的一
国防隐身技术进步迫切要求发展高性能吸波材料,而高性能吸收剂研究是获得优良吸波材料的重要条件.针对当前吸波材料在微波低频段吸波性能较差的"瓶颈"问题,该文在综述国内外
该文针对中国教育科研网内蒙古地区网络的管理问题,提出了一个分布式网络管理的体系结构,采用总控中心下辖若干子控中心的结构,对主干网和园区网的责权进一步划分,按照数据和
多机器人协作是机器人研究领域的一个重要课题。本论文以多移动机器人协作完成“围捕”任务为背景,对多机器人协作问题中的系统体系结构、系统任务层的协作与协调、行为层的规
CAD系统的信息共享与CAX系统信息集成的需求不尽相同,为每一个需求都实现特定的方案并不现实,因此,使系统内在地支持信息的集成与共享,进而提高CAD系统的适用性已成为迫在眉
当前对IDS的研究大多集中在检测机制上,缺乏有效的响应机制来阻止已经发现的攻击行为,防范未来可能进一步发生的类似攻击事件.结合研究小组己有的研究结果,分析了一个基于被
在目前的计算环境中,如何有效的存储和管理日益增长的数据是我们面临的挑战.为了解决这个问题,存储区域网应运而生.在存储区域网分布式文件系统中,存储共享冲突问题是关键问
在对软件体系结构的概念进行了介绍之后,分析了常用的软件开发模型,在此基础上详细阐述了基于体系结构的软件开发模型,并提出了基于体系结构的软件复用方法和过程,而且用WRIG