文本检索综述

来源 :数字图书馆论坛 | 被引量 : 0次 | 上传用户:Wang_Sheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本检索是最早也是最重要的信息检索形式。本文从基于文字、基于结构、基于用户信息几个方面总结了信息检索中相关度计算的方法。对基于文字的信息检索,本文分别介绍了传统的布尔模型、向量空间模型、概率模型和近年以来兴起的统计语言IR模型。文本检索和其他学科逐渐融合构成当今文本检索的发展趋势,本文主要介绍自然语言处理、数据挖掘技术和文本检索的融合,并介绍了数字图书馆中的一些新的文本检索应用。
其他文献
四字格结构是一种特有的语言现象,其结构对仗工整,平仄相间,凝练深刻,极具表现力。四字格作为一种重要的修辞手法,在中国的文学作品中广为出现,但是在英语中却没有类似的表达
2018年的"雷声”尚未消散,2019年的“雷声”竟又响起。从康美药业、东阿阿胶、承兴国际控股再到近期的精功集团,大批企业被爆出财务造假、业绩亏损、债务违约等问题,可谓是振
本文通过对长沙市家政服务业的现状分析,着重阐明了家政服务业的发展趋势。
目的探讨人源性乳酸杆菌的生物学特征,并对分离的人源性乳酸杆菌进行优选。方法对43株产过氧化氢(H2O2)乳酸杆菌利用CH-50L细菌鉴定系统进行鉴定,测定其培养液的pH与H2O2浓度