论文部分内容阅读
随着生活节奏的加快和老龄化社会的来临,健康成为人们日益关心的话题,人们对于医学相关知识的需求逐渐增加;另外,医疗人员也经常有着许多关于临床医疗上的问题需要一些额外的帮助。因此,研究医学问答系统回答医疗人员临床问题,以及使得人们更方便地获取医学知识具有重要的意义。然而,基于语义技术的医学问答系统研究还处于起步阶段。一些基于语义技术的医学问答系统对于用户问句的语义分析与处理还不够全面,信息检索精度有待提高。针对这些问题,本文提出了一种基于医学本体和多映射模板的医学问答系统,以自然语言形式回答医生提出的临床问题。该系统以SNOMED-CT医学本体中的语义网络作为知识库,采用基于描述逻辑的多映射问句模板将用户问句映射到SNOMED-CT中的多种语义关系,最大限度地满足用户对于问题相关信息的获取。此外,系统还采用文本蕴涵算法来匹配问句模板,并且运用Word Net词语相似度算法以及依存关系分析的语义技术对基于文本蕴涵的模板匹配算法进行改进,使得问句匹配的准确率、召回率、F1值都得到了提高。本文主要做了以下五个方面的工作:(1)根据医学本体SNOMED-CT的相关知识介绍,本文充分利用SNOMED-CT医学本体中的概念以及概念之间关系形成的语义网作为本文医学问答系统的知识库,来回答医疗人员以及普通用户以自然语言形式的提问,实现对医学领域相关知识的获取。(2)构建基于SNOMED-CT医学本体和模板逻辑的多映射结构的问句模板,使得问句模板可以映射到SNOMED-CT中的多种语义关系,从而实现推理规则的多元化。通过多元化的推理规则,使得问句模板所代表的语义更加接近用户的提问意图,从而系统可以最大限度地满足用户的提问预期。(3)设计模板逻辑系统来标记模板元素与定义模板结构,实现对于问句语义的精确表达,从而提高用户问句的处理效率,也为问句模板的精确匹配奠定了基础。该模板逻辑系统以医学本体元素为运算对象,是对问句模板进行语义标注与语义解释的一种特殊的描述逻辑。(4)提出基于语义的文本蕴涵算法实现问句模板的匹配。首先,采用基准的文本蕴涵算法进行问句模板匹配,然后分别加入本体元素、基于Word Net词语相似度以及依存关系对匹配算法进行改进。在进行算法改进的过程中,对不同匹配阈值所获得的F1值进行实验对比与分析,采用取得最佳F1值情况下的阈值进行问句模板匹配,进一步提高系统的灵活性与精确性。(5)设计了与问句模板绑定的推理函数。首先,通过对应推理规则获取得到用户问句中SNOMED-CT本体元素的相关信息作为参数,传入推理函数;然后,推理函数根据传入的本体元素信息,在SNOMED-CT本体中进行查询,并对本体元素相关的集合进行操作,从而实现答案推理。实验结果表明,系统在采用多映射问句模板以及提出的算法情况下,系统性能达到较高水平,可以作为实际环境下的生物医学问答系统。