一种基于经典领域本体构建方法的改进研究

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:yumenglu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文通过对现有经典领域本体构建方法的优点及缺点的分析,对本体构建方法做了一些积极的探索,并提出了一种新的本体构建模型。
  关键词:本体;构建方法;语义网
  中图分类号:TP301文献标识码:A文章编号:1007-9599 (2010) 06-0000-01
  Improvement Research Based on Classic Construction Method of Domain Ontology
  Chen Liang
  (School of Public Administration.SCU,Chengdu610064,China)
  Abstract:Based on the strengths and weaknesses analysis of the current classic domain ontology construction method ,this paper does some positive exploration,and presents a new model for ontology construction.
  Keywords:Ontology;Construction method;Semantic Web
  语义网是现在的热门研究课题,而组建语义网的基石是领域本体的构建。如果没有一个完善的本体,整个语义网的构建也只能是一座空中楼阁。所以本体构建在语义网研究中具有十分重要的地位。本体构建的探讨主要包括三个方面,即本体构建方法、本体描述语言、本体构建工具。其中本体构建方法对本体构建过程的实施具有指导性的意义,直接决定了本体对知识的表示和逻辑推理能力。如果没有一个好的构建方法的指导,就很难保证本体构建的规范化,进而对基于本体的后续应用也会产生巨大影响。
  一、经典本体构建方法分析
  国内外的研究小组根据各自的项目提出了很多本体构建方法,经典的本体构建方法有骨架法、评价法、METHONTOLOGY法、Berneras et al(KACTUS)方法等等。骨架法对构建框架和各阶段的指导方针有参考价值而且有本体评估的步骤,但是每一步却没有具体的方法和技术;评价法提出了本体获取的新方法,明确提出了需求的问题,但是没有文档化过程和步骤的说明;METH- ONTOLOGY法有本体评估步骤,详细描述了相关技术工具、知识来源,但是没有具体的本体评估方法;Berneras et al方法主要针对应用驱动的本体开发,但缺乏具体支持技术和本体评估、文档化过程,不适合从无到有的本体构建。
  二、本体构建方法的改进探索
  针对现有本体构建方法的缺点,一些学者做了一些有益探索。如宋佳等人在文献[1]中提出了一种基于层次关系的领域本体构建方法;疏剑,谢庆生在文献[2]中运用WordNet词典进行了制造业领域本体构建方法的探索研究;王梅文在文献[3]中利用《中国分类主题词表》、《中国图书分类法》和《中国药典》等主题词表进行了药学本体构建方法的探索;朱晓冰则在文献[4]中则提出了一种基于维基技术的本体构建设想。
  笔记在其他学者研究的基础上,结合自己的想法提出了一种新的本体构建方案,具体步骤如下:
  (一)领域本体需求分析。这个阶段主要是要明确领域本体构建和应用目的、
  领域与范围、表示方法、用途以及使用者等。
  (二)考虑本体复用。明确要开发的领域是否存在有现成的本体。如果不存
  在已有本体,则转入第(三)步;如果存在现成本体,则需要进一步分析已有本体是否满足需求,不满足项目需求则转入第(三)步,倘若满足需求则进入第(八)步。
  (三)分析本体结构,列出领域重要术语。这一阶段可以采用半自动的方法从主题词表、叙词表、领域文献库或者关系数据库中抽取关键术语和概念并加以整理,通过这一过程可以完成大部分的术语汇总,然后通过人工搜集或者本体的动态学习机制扩充完善术语。
  (四)领域专家的参与和协作。目前本体构建中公认的一点就是需要领域专家的参与和协作,还不能达到完全意义的自动本体构建。在领域术语的确定过程中需要领域专家参与评判并提出改进意见,尽量确保术语的权威性和专业性,尽可能全面而准确的涵盖整个领域。
  (五)定义类和类层次关系。这一步可以细分为两个小步骤即定义类和定义类层次关系。
  1.定义领域本体中的类。在步骤(三)中罗列出的大量的概念和术语处于一种混乱无组织并且彼此之间没有关联的状态,需要通过一定的逻辑规则对它们进行分类,形成不同的子领域。此外还需要对这些概念和术语的重要性进行评估,摒除那些超出领域范围的概念和术语,尽可能简洁和准确的表达出领域知识。
  2.定义类之间的层次关系。建立类之间的层次关系一般有自顶向下、自底向上、综合法等几种方式。自顶向下定义类层次即首先定义领域中综合性,概括性的类,然后逐步细化扩展自最细小的类。自底向上正好相反即先从最小类的定义开始,然后逐步向上级类定义。综合法是首先定义许多非常显而易见的概念,然后分别对它们进行恰当的归纳和细化,从一些顶层概念着手,将它们与一些中级概念关联起来。在具体的项目实施中可以根据实际情况采用合适的方法。
  (六)定义类的属性及约束条件。对于区分出的属性,应确定它们是描述哪些类的,并尽量将其定义到最通用的类上。属性值的约束条件则需要考虑到属性值的类型约束、属性值的范围限定以及属性值的计量单位等等。
  (七)创建类的实例。即根据实际情况选择类,填充属性值,生成类实例。
  (八)本体的检验和评价。由于领域知识的复杂性,领域边界的模糊性,不同领域之间往往存在着交叉,本体的构建很难一步到位。可以根据Gruber所提出的五条指导原则来检验和评价本体。如果不符合要求则返回第(三)步重新进行本体分析并加以适当的修正,直至达到要求为止。此过程需要迭代进行。
  (九)本体的存储。本体建设完成后,需要存储本体。本体的存储可以采用OWL文档形式或者存储为关系数据库形式。OWL格式存储比较简单,但是当文档数量比较大时用关系数据库存储本体就比较方便,可以根据实际情况进行选择。
  三、结束语
  随着语义网研究的深入,本体构建方法也将逐渐成熟。而从各个项目工程中总结出来的方法,并不能适合每个项目的要求,需要根据项目的情况加以修改。本文总结了一些主要的经典本体构建方法的特点,提出了一种迭代的具有本体进化特性的本体构建方案,同时也试图利用主题词表、叙词表、领域文献库等现有资源通过半自动的方式抽取专业术语及其等级关系,以减轻在没有本体复用情况下本体构建的工作量。下一步的研究将通过实践来检验这一模型,以期使这个本体构建模型更加完善化和相对通用化。
  参考文献:
  [1]宋佳,王盼卿.装备领域本体的构建方法研究.微计算机信息,2009,25,5-3:17-19
  [2]疏剑,谢庆生.制造业领域本体构建方法研究.机械与电子,2008,9:64-73
  [3]王梅文.药学本体构建实践.电脑知识与技术,2007:1520-1522
  [4]朱晓冰.基于维基技术的本体构建方法探讨.图书馆学研究,2009:54-56
  作者简介:陈亮(1985-),男,河南信阳人,硕士在读,四川大学公共管理学院情报学,研究方向:信息系统分析设计与开发。
其他文献
近年来,多媒体技术越来越多地出现在音乐教学课堂上。它突破了传统教学在时间、空间上的限制,极大地开拓了学生的眼界,激发了学生学习的积极性,引发他们的感情共鸣。本文从几个角
以槲皮素为模板,N,N-二甲基甲酰胺为致孔剂,偶氮二异丁腈为引发剂条件下,二烯丙基胺作为功能单体与苯乙烯骨架单体和交联剂二乙烯苯共聚合成了含有碱性功能基的分子印迹聚合物,并
本文是根据个人探究计算机技术与农村小学语文课程整合的几个细节问题。关注计算机技术与语文课程整合中出现的硬件问题;关注计算机技术与课程整合中学生的学习效率问题;关注语
研究了黑曲霉液体发酵产聚半乳糖醛酸酶的培养基优化.研究表明,最佳发酵培养基为(gm):麸皮40,鲜苹果渣20,(NH4)2SO420,NaCl1,MgSO4·7H2O6,KH2PO41.最佳初始pH3.5,接种量3%,装液量50mL,发酵
将家蝇蛹凝集素(MPL)分别按400μg/(kg·d)、800μg(kg·d)、1200μg(kg·d)连续给小鼠灌胃10d,于第8d和第9d给阴性对照组和3个剂量组小鼠腹腔注射环磷酰胺,造成小鼠免疫功
本文首先详细介绍基于分簇的无线Mesh网络体系结构,然后分析基于网络的移动性管理协议——代理移动IPv6的协议原理和工作机制,最后结合这两者的优势,设计一种新的无线Mesh网络移