异构本体映射中的关键方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:ygp313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断发展,人类已经进入信息社会,万维网成为人们获取信息的重要途径,其规模以惊人的速度增长着。大部分信息是以人类可理解的格式来表示的,而作为智能程序的软件代理无法理解和处理这些信息,为了解决这个问题,发明万维网的T.Berners-Lee提出了语义网的概念,语义网是现有万维网的扩展和延伸,而本体是语义网的基础,但本体的构建没有统一的规范来约束,因而产生了本体异构问题。本体映射作为解决本体异构问题的关键,已成为一个重要的的研究课题。本文对本体映射问题进行了深入细致的研究,提出了三种本体映射方法。通过在常用数据集上进行实验评估,表明这三种方法的性能较好,取得了较好的实验结果。首先,提出了基于多策略的本体映射方法,主要考虑概念映射和属性映射。其中概念映射方法采用基于名称、属性和分类关系的概念相似度策略来计算概念相似度,不仅考虑概念本身的语义和词义,而且考虑概念的属性和上下文结构。属性映射方法对数据类型属性和对象类型属性采取不同的策略,对属性进行筛选后得到最相关的属性作为某个属性的候选属性集,对这个属性和候选属性集中的属性进行相似度计算。然后合并多策略的映射结果,选择最佳结果并对概念映射和属性映射进行优化,由于充分使用了本体中的多种信息,采用多种策略的方法映射效率和精度较高,通过实例验证该本体映射方法具有较高的查全率和查准率。其次,提出了基于候选概念集的本体映射方法。在计算概念相似度时,不仅考虑概念本身所包含的语义,还考虑概念的上下文结构和属性。对于某个本体中的一个概念,计算这个概念和另一个本体中所有概念之间的概念名称相似度,并且设定阈值,产生这个概念的候选概念集。然后只对这个概念与候选概念集中的概念计算基于结构和基于属性的概念相似度,并进行相似度的综合,以产生本体映射结果,通过实例验证该计算方法具有较高的查全率和查准率。由于使用了候选概念集,相似度的计算量减少,因而这种方法得到的映射效率较高。最后,针对大规模本体映射问题,提出了基于ROCK聚类的本体分块与映射方法。对两个大规模本体进行预处理,并提取概念对,之后计算基于语义、基于子串和基于分类关系的概念相似度,从而得到概念之间的链接。通过计算块内聚度和块之间的耦合度,在改进的ROCK聚类算法基础上,分别对两个本体进行分块,之后采取基于分类关系的块映射策略和基于参考点的块映射策略,得到块之间的相似度,最终得到块映射结果,实验结果表明本文采取的本体分块与映射方法具有较高的映射精度。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
受国际政治及能源供需格局变化的影响,石油价格一直维持在较低水平,各大石油公司纷纷裁员以应对低油价的挑战,从而导致石油行业就业形式日益严峻。在此大背景下,越来越多的石
由于含油污水处理难度比较大,工艺上也比较复杂,需找到有效的方法才能实现石油开采、提炼、储存过程中产生的含油污水达到回收标准。
近日,电商研究机构、产业互联网智库———中国电子商务研究中心发布《2016年度中国电子商务市场数据监测报告》。报告显示,2016年中国B2B电商行业共发生了171起投融资事件,
本文围绕"基础日语"课程考试方式的改革,探讨以"Can-do一览表"为基准,以文字、词汇、语法和读解为中心的笔试基础上,增加采访、研讨、协动学习等口头考试,用以综合测试学生Can-do
鲁迅的小说《祝福》揭示了祥林嫂的悲剧,这是一个很老的话题.祥林嫂悲剧的发生说也不少,其中最著名的是“四权”说:“在政、族、神、夫这封建四权的残酷蹂躏下,祥林嫂的苦难高
通过对遵义市各县市区进行调研,目前电子商务行业、企业紧缺电商运营、技术支持、综合性管理、销售推广等岗位人才,本着专业为区域行业服务,我院的电子商务专业以"产教融合,
裘克安先生将文化理解为物质生产成果(科学、技术等)、生产关系和各种社会制度(政治、经济、法律和宗教制度等)、各种有形的精神产品(建筑、绘画、学术和文学等)及各种无形的