基于知网的中文本体映射研究

被引量 : 15次 | 上传用户:echo_1978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体最初是哲学研究的一个分支,近十多年来,本体论的研究逐渐超出哲学范畴,被引入人工智能领域,其应用深入到了语义网、知识工程、自然语言处理、信息系统集成等方面。本体是对共享概念的形式化的清晰的描述,可以提供一组共享的词汇和概念,通过对概念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识体系。但现实中,由于种种原因,真正实现共享的本体并不多见,一个领域内往往会同时存在多个异构的本体。本体映射是解决本体异构的方式之一,它通过在异构本体间建立起语义上的映射关系,实现本体的共享、重用和互操作。本文以语义网络为背景,研究了语义网中本体映射的问题。语义网是对现有万维网的扩展,它是一种智能的网络。语义网之所以智能是因为语义网中的信息不仅能被人所理解,更重要的是它还可以被计算机所理解。由于计算机可以理解信息的含义,从而可以让计算机自动去搜集网上的一些信息,并对这些信息按照人们的要求进行组合,汇总成用户需要的有效信息,从而可以利用计算机对网络中的信息实现自动处理,减少人的工作量,将人类从繁重的搜索劳动中解放出来。中文资源是全球信息网络的重要组成部分,实现中文本体间以及中文与其它本体的映射是实现本体共享重用的一个重要组成部分。目前有很多学者在进行本体映射的研究,但对中文本体映射的研究并不多见。本文专注于中文本体映射的研究,提供了一种适合中文本体的映射方法。根据文献[1],本体映射技术可以分为元素层映射和结构层映射,本文既采用了元素层映射技术,也采用了结构层映射技术。由于中文本体与其它本体的主要区别在于它们所采用的语言不同,这属于元素层的区别,故本文主要论述了元素层映射的实现。对于元素层技术来说,词语的相似度计算是一个关键问题,本文利用中英文双语知识库——知网实现词语相似度的计算,在词语相似度的基础上实现本体元素层的映射。对于词语相似度的计算,本文在分析知网结构的基础上,利用义原的相似度实现词语相似度的计算,并提出在计算义原相似度时引入义原树深度及义原在义原树中所处的层次的因素。对于知网中没有收录的词语,本文先将词汇进行分解然后计算相似度。为了验证本文所述方法,本文设计了三个实验,对本方法进行了测试,实验证明本方法可以有效地实现中文本体及中英文本体映射。
其他文献
目的研制一套科学、客观的《护理专业学生自主学习能力测评量表》,同时使用该量表调查护理专业学生自主学习能力现状,提出培养护理专业学生自主学习能力的教学策略。方法本研究
传统的会计模式是将企业作为一个独立和封闭的经济实体,企业目标局限于“微观利益最大化”。这一企业目标主导下的生产经营模式引发了日益严重的社会问题。随着社会经济的发展
内部审计作为企业自我约束和监督机制的重要组成部分,是建立和发展现代企业制度的重要决定因素。我国企业内部审计经历了二十多年的发展,对加强企业管理、推动社会经济发展做出
近年来,公司治理水平的改善是人们最关心的话题之一,“公司治理”日益成为各界关注的焦点。亚洲金融危机爆发后,亚洲的公司治理状况与模式受到广泛质疑;然而不久,美国就爆发了安然
企业合并是企业发展的需要。在市场经济条件下,随着企业间竞争的日益激烈,发展对于企业已是生死攸关。企业寻求发展的有效途径之一便是进行企业间的联合。随着经济的发展,企业形
近年来,国内商业房地产方兴未艾,进入了发展的快车道。由于商业房地产具有“总价高、利润率及开发风险较高、投资回收期长”等特点,因此有能力全额购买商业房地产的投资者实在“
跨国公司(Transnational Corporation)是性质特殊的经济实体,它又称多国企业(Multinational Enterprises)、多国公司(Multinational Corporation)、全球公司(Global Enterpris
[目的]检测我省实验动物的寄生虫感染情况。[方法]按实验动物寄生虫学检测方法国家标准。[结果] 1995—2005年共检测我省9家单位的普通级动物(大鼠、小鼠、豚鼠、兔、犬和猴)
唱和词按照唱和对象的不同,可以分为同时唱和之作与异时追和之作两类。追和词具有多方面的研究价值。作为词史上一种特殊的接受现象,追和积极参与了词史构建的动态过程,是唐宋词
现代建筑利用工业技术为人类建造理想的生活环境,对解决工业革命后的城市爆炸、居住、失业等问题做出了巨大的贡献。但工业社会对资源的破坏性开发,在建筑行为上的后果也十分