自动问答系统的研究与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:shelllbw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的普及和互联网的快速发展,网上信息呈现几何式增长,如何在大量、复杂的信息中快速、准确地检索到有用的信息是我们迫切需要解决的问题。传统的搜索引擎取得了一定的成功,但返回的信息太繁琐,难以满足当代人快速、准确的需求。自动问答系统综合运用了网络通信、人工智能、信息检索和自然语言处理等技术,具有智能、准确、简洁等优点,有效地弥补了传统搜索引擎存在的缺陷。面向国家科技计划项目申报领域,本文深入研究了自动问答系统的关键技术,主要工作有以下几点:(1)提出了一种基于专业词词典和ICTCLAS的分词方法。首先根据领域知识建立专业词词典,然后采用基于词典的分词方法中的正向最大匹配算法进行句子切分,最后对词典中的未登录词,采用ICTCLAS分词工具进行分词并标注词性。实验结果表明,该方法具有较高的正确率和召回率,特别是对专业词汇的识别。(2)研究了基于《知网》的词语语义相似度算法。首先根据《知网》的义原距离求出各个概念的义原相似度,继而求出词语的概念相似度,最终得出词语语义相似度。(3)提出了一种多尺度多特征融合的句子相似度计算方法。首先对现有的基于向量空间模型的TF-IDF方法和基于语义的方法进行改进,然后从句子的句形、语义和句法结构三个方面出发,综合考虑句子的词频、语义、长度、词形、词序和距离六个特征,提出了一种多尺度多特征融合的句子相似度计算方法,最后采用遗传算法求取特征之间的最优权重组合。实验结果表明,该方法较现有的句子相似度计算方法在召回率和正确率方面都有显著的提高。(4)设计并实现了一个面向国家科技计划项目申报信息咨询的自动问答原型系统。该系统完成了常用问题库(Frequently Asked Question,FAQ)的建立、问题预处理、候选问题集的建立和句子相似度的计算,验证了本文提出方法的可行性和有效性。
其他文献
历史上的拉卜楞地区是安多藏区以拉卜楞寺为中心的藏传佛教文化区,它包括今天青海、四川的部分藏区和甘肃省甘南藏族自治州的大部分地区。进入民国以来,在复杂多变的背景下,
健康是关系到人力资本的关键问题,卫生费用融资与医疗服务供给对于健康具有关键性作用。卫生费用融资体系主要包括政府、社会和个人三者,其中基本医疗保险、商业健康保险与自
目的探讨术前新辅助化疗(NACT)Ⅰb2~Ⅱb期宫颈癌的近期疗效。方法选择34例术前宫颈癌,术前采用2个疗程的静脉化疗后手术,观察近期的疗效。结果治疗后有效率达85.3%(39/24)。无重
师生关系即教师和学生在教育、教学过程中结成的相互关系,包括彼此所处的地位、作用和相互对待的态度等。古人云:“亲其师,信其道,信则灵。”可见良好的师生关系在教育中的重要性
[摘 要] 为了适应经济一体化的全球发展趋势,各个企业与单位运用了内部审计的方式来降低内部存在的风险。文章先分析了教育内部审计风险的特征及成因,以此研究风险防范机制的构建措施,提出明确职能定位、发挥内部审计的独立性、建设内部控制体系、规范审计质量控制、建立审计队伍、轉变工作方式等措施。  [关键词] 教育管理;内部审计;风险防范  doi : 10 . 3969 / j . issn . 167
本文介绍了月饼模在天津的发展,归纳阐述了月饼模的造型特点、工艺和使用保存方式。引出它作为中秋文化的载体所体现出的工艺美术价值和思想文化价值,并针对月饼模的发展现状
目的:对比肺部超声与X线在早期诊断新生儿呼吸窘迫综合征中的应用价值。方法:选取2019年1月至2020年6月收治的197例疑似新生儿呼吸窘迫综合征患儿,均进行肺部超声和X线诊断,