论文部分内容阅读
语义Web(Semantic Web)是万维网之父Tim Berners-Lee倡导的下一代万维网,是对当前万维网的扩展。语义Web研究的主要目的就是增强Web资源的语义表示,以一种明确的、形式化的方式来表示信息资源,使语义得以显式地表达,来满足分布式主流计算环境下语义互操作性的需要。实现语义Web需要解决的关键问题是语义的表达,语义Web上的知识表示是整个语义Web实现的基石。本文对基于语义Web的知识表示进行了深入分析研究,整个工作主要集中在语义Web数据层和本体层。此外还研究了如何使用本体进行知识抽取和知识建模,通过本体将知识的本质特征和属性抽取出来,并对知识表示元素进行形式化的描述。数据层的知识表示语言的代表是RDF(S),本文以实例的形式介绍了RDF的语法和语义的应用。另外随着越来越多的元数据采用RDF形式进行表示,本文提出了一种有效的管理RDF数据的方法,即基于关系数据库的方法来管理RDF数据。本体层的研究主要集中在本体的描述语言OWL和本体建模、本体学习等方面。通过对本体描述语言OWL的研究,发现了OWL描述语言的一系列不足之处,如属性的约束能力不足、规则的表达能力很弱。在原有OWL语法的基础上本文对OWL进行扩展(OWL+),通过用户自定义操作符改变属性的约束能力;通过对谓词的扩充使OWL+能够表示规则。本体建模的研究集中在对特定领域的建模。通过一个简单的实例(电脑配件的本体构造)演示了采用Protégé建模工具进行领域本体构建的过程。针对本体建模费时费力的缺陷,引入了本体学习思想,其目的是开发能够实现本体自动构建的机器学习技术来协助知识工程构建本体。本章最后构建了一个本体学习框架,通过术语抽取、本体创建、本体修剪三大功能模块来自动创建领域本体。