【摘 要】
:
随着互联网信息的快速增长,如何快速准确的找到所需信息成为亟待解决的问题。第二代搜索引擎主要依靠向量空间模型和词匹配模型,虽然能够在短时间内检索到大量结果,但其中包
论文部分内容阅读
随着互联网信息的快速增长,如何快速准确的找到所需信息成为亟待解决的问题。第二代搜索引擎主要依靠向量空间模型和词匹配模型,虽然能够在短时间内检索到大量结果,但其中包含很多不相关的内容,导致用户仍需花费较多时间去过滤结果。因此人们迫切需要一种更精准、更有效的新一代搜索引擎,第三代搜索引擎的出现顺应了这一需求。第三代搜索引擎主要在匹配方式、检索结果和排序方式上与前两代搜索引擎有着显著不同。在匹配方式上,从基于关键字和词的匹配转换为语义匹配,即能够在一定程度上理解检索词的含义,从而匹配出检索词的近义概念、相似概念、包含概念、从属概念等,提高查全率,对于多义词能够设定概念领域,缩小范围,提高查准率;在检索结果上,从返回网页链接转换为直接返回相关内容;在排序方式上由向量空间模型结合链接分析转换为基于用户力量推荐排序,以及由通用排序转换为个性化排序。经过几年的理论研究和实践探索,第三代搜索引擎已初具规模,这些搜索引擎在搜索体验和结果相关性上均取得了很大进步,但由于用户使用习惯等问题,它们的使用率却不高,而且也缺乏比较系统的研究。本文通过直接调查法、统计分析法、案例分析法等方法,对第三代搜索引擎的相关理论、现状、未来趋势等作以全面分析,以期勾勒第三代搜索引擎全貌。本文首先给出第三代搜索引擎的概念、产生必要性、特点等,其次根据评判标准,从两百多个基础样本中选出具有代表性的第三代搜索引擎,对比分析它们的各项性能,得出调查结果,并以Wolfram Alpha为例进行实证分析,最后对第三代搜索引擎的发展趋势作以展望。
其他文献
无线传感器网络因不同应用而被广泛部署于各种场合,通常被视为分布式数据库.可以通过向该类数据库发布查询请求来获取事件相关的响应信息.一些具有实时需求的应用对查询时延
针对剪力墙结构设计中边缘约束构件和构造边缘构件的一些常见问题 ,指出了现行规范中约束边缘构件的设置条件规定不够严格、箍筋形式未作具体规定等问题 ,文章阐述了看法和观
本文描述了1990年以来京津冀地区在人口迁移的活跃程度和空间分布的新特征。通过建立计量模型,对1990年和2000年影响京津冀地区人口迁移的综合因素进行了比较分析。结论显示:
以宜兴阳羡茶文化博览园为例,采用层次分析法构建茶文化旅游资源综合评价的模型,从茶文化旅游资源特征,环境特征和开发条件3个方面筛选出茶文化历史价值、教育科研功能、美学
乡村公共文化具有知识性、规范性和价值性,三者共同形塑出乡村公共文化的面孔。改革开放以来,乡村社会面临伦理与治理双重危机,不可逆地蔓延开来的消费主义,形塑出异化的社会
入侵检测技术在保证信息安全方面具有重要作用,本文简述了入侵检测技术及其发展历史。在对电力信息网络结构及其安全分区进行分析的基础上,针对电力信息网络存在的入侵攻击问
电视是现代社会人们重要的休闲娱乐工具,而电视剧以其超强的覆盖率和广大的受众群体昭示着它强大的渗透性和影响力。电视剧的文化內涵与美学品格的高低,关系到国民整体素质的
文章利用常生成函数来解决不定方程解的计数问题,从而为一些组合问题的计数提供了方便。
随着我国国民经济的快速发展,我国电信市场最终确定了中国电信、中国移动和中国联通三家通信运营商。电信重组的最终目的是“支持形成三家拥有全国性网络资源、实力与规模相
本文以辽宁省辽阳市为例讨论了在新农村建设的框架中区域人口发展战略的抉择问题。本文的分析表明,辽阳市需要将公共资源更多地投向人口的开放和人力的开发上,这是新农村建设