基于医学领域本体的语义相似度算法研究

被引量 : 7次 | 上传用户:sxf_520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科学和计算机技术的发展,电子化医疗数据的迅速增加,电子病历和大量的医疗和科研文件已经成为临床研究重要的数据资源。然而这些数据大部分都是以未经处理或者以异构的文本格式来存储的。正确的理解文本数据的内容需要整合结构化和异构的临床资源、医疗记录和科技文献。概念之间的语义相似性评估是理解文本数据的重要组成部分,能够有效地促进了文本资源的加工、分类和结构化处理。理解文本信息最重要的就是如何决定词汇之间的语义相似性。语义相似性已经成功应用到了许多自然语言的处理当中,例如词义消歧、文档分类和聚类、词汇拼写错误的自动侦测和改正、本体学习和信息检索当中等。在医学领域,相似性计算可以提高对医疗资源的信息检索的准确度,并且可以有效地促进对异构临床数据的集成。语义相似度是计算词汇之间的相似性,即概念分类的接近程度。例如,支气管炎和流感具有相似性,那是因为它们都是由于呼吸系统紊乱造成的。然而,词汇间也可以以非分类的方式相关联,例如利尿剂有助于治疗高血压,即语义相关度。语义相似度和语义相关度都是基于对存在于本体或者领域语料库中语义实例的评估。根据所采用的领域知识,可分为:基于本体分类结构的语义相似度算法、基于概念的信息内容的语义相似度算法和基于上下文矢量的语义相关度算法。本文首先回顾和分析了常用的语义相似度和语义相关度算法,根据预期的准确性、计算复杂性、对知识资源的依赖性等关键参数,来分析每种算法的优势和局限性。其中,基于本体分类结构的语义相似性算法不依赖于对具体语料库和数据的人工预处理,然而它所呈现出的一些限制妨碍了其准确性。研究根据概念的信息内容来重新定义了基于本体分类结构的语义相似度算法,该算法克服了基于语料库信息内容(IC)计算模型的限制,并且保留了基于本体模型的有效性和扩展性,从而提高了评估的准确性。此外,重定义的相似度算法可以直接应用到语义环境下和医学领域当中。然后,研究提出了一种基于比较概念的所有分类知识的语义相似度算法。该算法保留了基于路径算法的简单性,并且尽可能地考虑到概念所有可用的分类实例。由于该算法仅是基于本体结构的,在不依赖于数据适用性和数据预处理的情况下,通过采用额外的语义实例,进而能提供概念之间准确的相似性评估结果。与此同时,保持了较低的计算复杂度和避免了基于路径算法的一些限制。实验通过使用SNOMED CT作为输入本体,根据一个医学术语的评估标准来评估和比较这些算法的准确性。研究过程中还试图通过分析一些其他基于本体知识的语义相似度算法,例如基于属性的语义相似度或相关度算法和混合式语义相似度和相关度算法。此外,本文中所提及的算法都是基于医学领域本体或者医学领域的语料库,这些算法有待在通用领域本体库或语料库中得到评估和应用。
其他文献
<正> 某型交流机作为某型飞机交流主电源与某型电台或雷达等用电设备配套使用时,变流机输出交流电压下降7伏多,满足不了使用要求。为了解决长期存在的这个问题,我们对原型变
<正>笔者在对机动车检验机构进行计量认证和资格许可评审中,注意到各检验机构在对机动车轮胎胎冠花纹深度测量时,使用的测量工具和测量操作方法不同,测量数据误差较大,影响轮
均分权值计算法是目前应用最为广泛的一种弹性参数法,但该方法在孔隙度变换范围比较大的地区存在适应差的问题,针对这一问题,通过研究提出一种基于孔隙度分级的弹性参数法。
在滑动电接触过程中,电极截面上的电流分布不均匀,接近电极接触表面的电流密度较大,而电极内部的电流密度相对较小。这种趋肤效应使滑动电极与固定电极的接触面局部位置过热,电极
身体概念是理解马克思的哲学革命的一个新视点,这一研究路径的提出得益于当代马克思主义哲学研究在生存论路向上的推进。本文立足于身体概念,力图揭示马克思哲学中感性、异化、
Hough变换是计算机视觉领域中经典算法之一,最初用于图像中直线、圆形等特定形状检测,为实现任意形状检测,Ballard提出广义Hough变换。近年来,Hough变换与分类器相结合的算法应用
掌纹和手形作为两种重要的生物特征,具有唯一性、终生不变性、不易丢失、防伪性能好等特点,在身份识别方面具有广阔的应用前景。已有掌纹和手形的研究只是利用了手的一部分特征
<正>难道就因为我一贫如洗,默默无闻,长相平庸,个子瘦小,就没有灵魂,没有心肠了——你想错了,我的心灵跟你一样丰富,我的心胸一样充实!——《简爱》夏洛蒂《简爱》是英国文学
二十世纪80年代以来,基于理性人假设的传统金融理论受到了市场“异象”的挑战,行为金融成为引人注目的研究热点。大量国外实证研究表明市场受投资者情绪的影响。在投资者存在认
在油田开采过程中,对油井及输油管道的各参数进行监测,及时有效的发现和解决油田生产故障和事故,是油田数字化进程中的关键研究方向,近年来网络技术和ZigBee无线传感器网络的迅速