本体映射中概念相似度计算方法的研究

来源 :武汉理工大学 | 被引量 : 2次 | 上传用户:xindongmei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体作为解决网络资源语义异构问题的重要途径,其构建方法没有统一规范和标准,人们在开发新本体同时,也带来了本体异构的问题。本体映射便是解决本体异构问题的手段之一,其关键过程就是计算概念之间的相似度,以此来衡量两个概念之间的相似程度,建立语义联系。目前已出现很多本体映射方法和概念相似度计算方法,这些方法存在一些问题,如计算量大、映射效果差等。围绕这些问题,本文的主要工作如下:首先,本文对本体映射相关技术及概念相似度算法进行了研究和介绍,在此基础上,针对常用相似度算法中影响因素考虑不全面、计算复杂等问题,介绍了一种基于语义距离、语义重合度和节点层次差的语义相似度计算方法,并分析了该算法中语义距离计算不精确的问题,提出了一种依据节点密度、节点深度和节点间边的类型分配权值的改进算法,提高相似度准确性。同时引入WordNet语义词典,提出了一种将异构本体两个概念在词典中定位的方法,并利用改进的语义相似度算法计算概念在WordNet中的相似度。随后,本文针对现有映射方法中存在的相似度计算概念特征考虑不全面、计算量大导致映射效率低以及通用性不高等问题,提出一种基于综合相似度计算的本体映射模型。该模型首先利用基于WordNet的改进的语义相似度算法而得出的名称相似度结果提取候选映射对,减少计算量,接着计算候选映射对基于属性、结构和实例的相似度,进行加权综合后输出最终映射对。最后,利用OAEI(Ontology Alignment Evaluation Initiative)组织提供的测试集,设计了实验系统,分别采用改进算法和未改进算法计算概念语义相似度,并对结果进行分析比较,同时对本文提出的映射模型得出的映射结果在查全率、查准率和F-measure值上与其他系统进行对比。从分析结果中可以看出,改进的算法准确性更高,能更好地区分概念间的细微差异;而本文提出的映射模型在大幅度减少计算量的同时,在一定程度上保证了映射结果的查全率和查准率,具有较好的性能。
其他文献
敦煌壁画已经出现了变色问题,因此壁画的数字化保护工作已经迫在眉睫,本文的研究是基于这种背景下进行,通过对敦煌壁画图像的显著性区域进行提取,对其中的不感兴趣的信息进行过滤
移动计算环境的日益普及,使人们可以随意地进行异地数据访问和操作,为不同地点用户之间的协同工作提供了基础性前提。在这种情况下,需要借助数据同步技术来保持网络上不同数据源
计算机技术、网络技术和多媒体技术的发展与结合,使得网络多媒体应用渗透到人们生活的各个方面。视频点播系统作为网络多媒体的应用之一,近几年也得到了很大的发展,应用规模从以
随着数据库技术的成熟和数据应用的普及,人类积累的数据量正在以指数的速度增长,人们面临着快速扩张的数据海洋,数据洪水正以扑面之势向人们滚滚涌来.与日趋成熟的数据管理技
本文将建立个人信用评估的量化模型。针对个人信用评估问题,我们探讨了模型建立与实现过程中的一些问题。模型建立前的数据预处理是提高模型效果必不可少的环节,通过计算各个评
密码技术是信息安全的核心技术。如今在计算机网络环境下信息的机密性、安全性、完整性、可用性等特性,都需要采用密码技术来解决。密码体制大体分为对称密码(又称为单钥或私
模糊神经网络系统作为模糊系统与神经网络的结合,一方面弥补了纯模糊逻辑在学习方面的缺陷,另一方面,使得神经网络这一“黑箱”问题走向透明化。由于汇聚了神经网络和模糊系
P2P(Peer to Peer)作为年轻而又古老的技术,在资源共享和协同协作方面有着崭新的应用,目前已经成为Internet一个新的发展起点。但是该技术在计算机网络安全尤其是在信任管理和
随着PTN技术在新一代骨干网络中的应用推广,对PTN网络的运行维护提出了更高的要求。PTN技术是面向连接的分组传送技术,而面向连接的特点意味着能够提供电信运营级的服务,要求有
面对快速发展的计算机通信技术和瞬息万变的市场需求现代IT企业希望开发的软件具有高伸缩性和灵活性可以根据市场的变化快速调整扩充现有软件功能适应市场需求以即时响应竞争