基于显式语义分析的语义Web领域本体概念相似度研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:kunhodde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显式语义分析技术ESA,通过对知识库(如Wikipedia)的处理,构造出各个词到每个概念的倒排索引,并且计算出词到每个概念的权值,表示词与概念的相关度。因此,这个倒排索引可以看作是由词-概念组成的向量空间模型。通过计算词-概念向量之间夹角的余弦值,可以计算文本与文本的相关度,进而实现一词多义在文本中的消歧义功能等。  本文利用显式语义分析技术,计算OWL领域本体中的概念相似度。首先利用基于如今最大的知识库(维基百科)的显式语义分析建立倒排索引表,把表中词-概念的权值作为阈值,加入到本文提出的本体实体层、属性与数据类型的计算公式,再联合本文提出的结构层计算公式,更加客观、合理地计算OWL领域本体中的概念相似度。语义Web构建的基础是把各领域本体关联在一起,这样就需要领域本体之间的互操作。一些本体概念从字面意思上有区别,但是通过概念属性、概念关系的相似度计算能有效地进行区分。以往前人在计算本体概念相似度的方法中,存在着某些可调的阈值,这些阈值使计算出来的值,缺乏合理的依据。通过实验,计算DBpedia中建立的OWL本体,对比Lin、Yang等人提出的方法,本文对于领域本体概念相似度的计算更加合理。本文把基于维基百科的显式语义分析方法应用于本体概念相似度计算中,有助于语义Web的构建。
其他文献
随着社会经济的发展,人类活动的范围越来越大,面临突发事件和异常事件越来越多,视频监控的重要性与难度也越来越突出,传统的依靠人工来处理海量监控视频数据的方式已经无法满足目
本论文主要介绍了基于Linux的EAST分布式集群系统的设计与实现。随着EAST实验的不断深入,为了满足实验需求和用户对高性能计算的需要,几年来实验室不断购置服务器,新服务器日益
由于光刻对于光源的功率和线宽提出了很高的要求,传统的单腔结构准分子激光器很难在这两方面兼顾。MOPA结构的准分子激光器可以很好地解决激光功率和线宽的矛盾,这一结构的准分
中医知识库是集中医领域内相关医学医药理论知识、事实数据以及根据中医专家经验得到的启发式知识于一体的智能数据库。舌诊是观察舌头的色泽、形态的变化来辅助诊断及鉴别病
随着不断增长的信息化建设需求,提高软件开发的生产力并保证软件产品适应多变的客户需求成为信息化建设领域的两个核心问题。本文试图从软件过程改进和技术革新两个方向共同切
图作为离散对象之间关系的灵活抽象,被广泛应用于很多科学计算和一些新兴的应用领域包括基因组学、天体物理学、人工智能、数据挖掘等。图的宽度搜索算法是用于探索图中具有
计算机技术以及传感器网络的发展,深刻改变了传统的数据采集方法。尤其是生态学中的野外生态观测研究正逐渐朝着自动化、网络化、智能化、常态化的方向发展,是现代生态学科研信
随着互联网技术与移动通信技术的发展,各行各业都积极地将自身的业务与互联网平台相结合,形成“互联网+”的新局面。人们享受着互联网平台方便快捷的同时,也迷失在由它带来的海
蒸汽系统是钢铁石化等工业企业的重要组成部分,它消耗燃料,为整个生产过程提供蒸汽、电力、冷却水等公用工程。蒸汽系统的安全稳定运行是企业安全、稳定、长周期运行的基础。蒸
随着大数据和云计算的发展,分布式文件系统在众多的存储系统中扮演着越来越重要的角色。与此同时,数据仓库也经历了概念的提出、理论的逐步完善、初步建立仓库,到现在发展成熟等