基于词共现模型的常问问题集的自动问答系统研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:ray361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自动问答系统中引入基于Frequendy asked questions(FAQ)的辅助模块满足常见问题的回答是一种有效的手段,其中关键问题是用户提出的问句与FAQ中问句的相似度比较,找出FAQ中最相似的问句,并返回对应的答案。本文将词共现模型引入到问句的相似度匹配中,利用互信息构造共现词汇,同时,结合相关关键词个数及问句长度等信息计算问句之间的相似度。相关实验结果表明,结合词共现模型的FAQ自动问答系统具有较高的准确率和较快的响应速度。
其他文献
非相关文献知识发现是Swanson教授提出的一种情报学方法,用于挖掘隐藏在文献之间的隐秘联系。其知识发现过程包括两部分:开放式知识发现过程和闭合式知识发现过程。开发式知识
本文结合搜索引擎的特点,采用网上特尔菲法进行专家调查以确定搜索引擎评价的各项指标,并利用基于指数标度的层次分析法确定各项指标的权重,从而构建搜索引擎评价指标体系.在
Web用户聚类是指用聚类算法产生用户会话的聚类,是电子商务中的一个重要问题。该问题的难度在于有成千上万的会话需要聚类,而且每个会话都可描述为一个高维向量。此外,该问题就
在电子商务中,协同推荐技术能够帮助用户发现感兴趣的东西。在协同推荐中,通常采用最近邻居的方法来产生推荐。随着商品数量的增多,协同推荐所需要的数据集也越来越稀疏,可用
副猪嗜血杆菌病是由副猪嗜血杆菌(HPS)引起的严重接触性传染病。以多发性浆膜炎、关节炎和高死亡率为特征,严重危害仔猪和青年猪的健康。此菌有15个以上血清型,其中血清型5、4、1
颜色是一些Web资源的重要属性,颜色本体对基于颜色匹配的语义检索起着重要作用。为了实现汉语颜色知识的大范围共享与重用,本文结合语言学与本体理论构建汉语颜色词本体。通过
挖掘最大频繁项集的优势在于得到的项目数量较少。相比频繁项集和频繁闭合项集挖掘算法,此类算法具有较高的时间和空间效率。根据数据流的特点,结合滑动窗口,提出一种基于有
将同被引聚类方法描述的某一专题历史发展与专家综述所描写的历史发展相比较,探讨同被引聚类方法在表现学科历史发展时的可靠性.
区块链是近年来炙手可热的话题,综合应用数学、密码学、通信与计算机技术构成了一个去中心化、数据不可篡改、全程留痕、可以追溯、集体维护、公开透明的分布式共享账本。从
文章以国家社会科学基金项目、国家自然科学基金项目、情报学硕士生研究方向、情报学核心期刊论文为数据源,运用基于词频统计的内容分析法分别计量、界定、分析了四类数据源