本体构建及其在问答系统中的应用研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zz1976aa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体作为语义基础被广泛应用于信息检索、人工智能、语义网络和知识管理等领域。然而本体的构建和维护工作费时费力,影响了本体的广泛应用。因此,研究者们尝试利用机器学习、数据挖掘等技术辅助构建本体,提高本体构建的自动化程度,提出诸多本体自动、半自动构建的理论和方法。本文在总结现存本体自动构建方法的同时深入研究了基于FCA(Formal Concept Analysis)的本体半自动构建方法,构造具有语义支持能力的本体。用于支持急救知识问答系统,进行问题主题识别和概念的扩展。该方法主要包括:(1)基于PAT-Tree的统计分词。统计分词相对于其他分词方法的主要优点为能识别未登录词,这在形成本体的过程中起着重要作用;(2)领域特征选择。在文本分类聚类的任务中,如VSM模型,都需要文本的特征提取,如果文本的维度过大,会造成计算空间和存储空间的浪费,甚至无法计算,所以特征选择是必要的;本文在利用特征选择方法提取领域词汇的同时,通过人工选择出具有急救领域知识分类能力的主题词,将具有主题功能的特征词作为文本的属性,用于生成概念之间的结构。(3)基于问题答案集文本-主题词的形式背景生成,并用FCA构建本体。形式背景反映了文本和主题词之间的二元关系,FCA利用这种二元关系构造概念格,形成具有语义特征并有分类能力的本体。最后,该模型构造的本体通过急救知识问答系统进行测试,用准确率进行衡量,以验证本体构造方法的可靠性。实验结果表明,该方法能提高本体构造的自动化程度,构造的本体能提供语义支持,是可靠的研究方法。但同时构造过程中需要进行主题选择的人工裁剪和最终概念关系的人工修正以提高正确率。相对于人工构造的本体而言,机器学习方法构造的本体在局部具有相当的语义支持能力,但总体上略逊于人工本体。本文从应用的视角进行本体半自动构建的研究,为本体的自动构建提供了新的研究思路。
其他文献
随着市场竞争的加剧,技术创新己成为企业获得竞争优势的主要途径,越来越多的企业认识到进行技术创新的紧迫性和必要性,但许多企业由于组织结构和业务流程不能适应技术创新的要求
近年来西北地区的高速铁路建设发展迅速,而轨道工程对保障铁路项目顺利建成具有重要意义,是铁路运行安全和稳定性的保障,同时其施工行为也对西北地区生态资源环境有着一定的影响。高速铁路轨道工程施工中需使用大量的大型机械设备和造价不菲的施工材料,在环保、用水、用能、用料和占地上都有诸多可以实现绿色化施工的空间。因此,在安全和质量得到保障的前提下,如何针对轨道工程施工中主要的非绿色施工行为进行监督和改进,在实
介绍了一种虚拟仪器技术在电力变压器局部放电在线监测系统中的应用。分析了其硬件组成及各部分的功能,并利用虚拟仪器软件的控制功能及强大的数据处理功能,实现了对外围硬件
基于位置服务的需求不断提升,自主定位的研究刻不容缓。然而现如今国内外对室内定位研究都存在设计成本较高的问题,使得室内定位技术不能得到普及。本文以服务机器人为研究背
亘古至今 ,“悟”一直带有一层浓厚的神秘色彩。从“悟”的本质、功用、基础、要领、层次、程序等六个方面探索这一千古之谜作其结论为 :“悟”的本质是“接连先天即后天” ,
叶绿体是植物细胞中由双层膜包裹的一种细胞器,承担着影响植物生长和繁殖的重要生理功能。叶绿体通过分裂的方式进行增殖,分裂装置中有若干蛋白质以复合物的形式发挥功能。AR
互联网的泄露和泄密事件,对当事方和相关方大多都带来了负面的影响。它损害了当事者的隐私权、名誉权,损害了公司的经营业绩和信誉,损害了某些国家和军队的形象。消除网络泄
随着数字城市建设的逐渐深入,人们对数字城区乃至数字社区建设的兴趣和关注度也越来越高。数字城区作为高科技在城区建设中的使用、推广及普及,已成为现代化新型城区发展的必
目的:研究川麦冬酒制前后化学成分的变化,建立酒制川麦冬中甲基麦冬黄烷酮A的含量测定方法。方法:取川麦冬生品和酒制品,用水提取,将提取液进行高效液相色谱分析,Waters Symm
城市山地公园是场地内山体占一部分或大部分的一类城市综合性公园,其特点是可用于活动的场地少,园路、建筑设计受坡度限制,但自然资源丰富,富于变化的地形易于营造景观,大多