搜索引擎的实现研究及相关优化

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:syameimaruda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎的实现有赖于几个关键模块的协同工作,包括爬行、本地网页存储、索引、排序搜索结果以及加速搜索性能的链接分析应用等.对搜索引擎的体系结构及实现原理进行了相关研究,介绍了每个组件的设计与实现技术. 网页更新是影响搜索引擎效果的关键技术,其算法的设计很大程度上影响了网页更新度.为了提高网页更新度,提出了一种优化算法即分类更新的网页爬行策略,此方法以网页的改变历史为基础来评估其改变频率,并以此作为分类网页的标准,然后基于平均值算法得出不同网页集合的更新速度,从而实现网页更新,达到均衡分配系统资源的目的. 元搜索引擎提供多个搜索引擎的集成环境,具有比传统引擎覆盖面大、可扩展性好以及结果相关性高等优点,其中排序各组成系统的返回结果是提高其效率的核心技术.在充分理解相关度概念的基础上,提出了一种基于权值的结果优化排序方法,综合考虑用户需求,包括兴趣权值、人数权值和位置权值,并采用固定容量的网页索取模式,实现了一个小型元搜索引擎的原型系统.
其他文献
网络脆弱性评估技术是网络安全领域的一个新兴分支,通过模拟攻击者的攻击行为,它可以及时发现网络系统中的安全隐患,然后分析出现这些安全问题的原因,如何预防,以及在整体上进行何
人脸检测指在图像或图像序列中找出单个或多个人脸的位置和大小,是人脸识别、人脸跟踪、姿势估计以及表情识别等研究的第一步,在机器视觉和模拟识别领域具有重要意义.彩色图
工作流引擎是工作流管理系统中最重要的部分,它根据建模工具建立的过程模型来推进过程的执行,并按照每个人的角色合适地分配任务,从而达到提高工作效率的目的。 根据对WfMC和
信息时代的今天,信息技术(Information Technology,IT)产业已成为推动世界经济增长的主要动力之一。随着计算机硬件技术的不断成熟,产业竞争正逐渐转向软件开发领域。软件开发实
三维医学图像的可视化是计算机可视化技术在生物医学工程上的重要应用,为医疗诊断和医学研究提供了对人体组织进行三维观察和分析的手段,在医学临床与医学研究中具有重要意义。
学位
论文分析研究了现有的P2P系统结构以及搜索发现技术的特点之后,针对P2P网络中联网主机性能不一的特点,为充分发挥其各自效力,将其根据性能高低划分为两类,由性能较高的主机担
多序列同步比对法是属于一类精确序列比对算法.它的完备算法对求解二维(两条序列的比对)或三维的问题非常有效,但是对于维数稍高的问题却很难应用.通过对序列比对的完备算法:
本文着重讨论了基于简单对象访问协议SOAP的知识系统的应用程序集成模型。SOAP是WEB服务的核心协议,它为应用之间的无缝互联提供了一种简单通用的通信机制。Web服务的缺点是缺