论文部分内容阅读
在知识经济的时代,人们普遍利用网络来传播和获取各种知识。传统获取知识的方式是人们通过搜索引擎来查找互联网上的信息,查找到的信息通常是存放在Web服务器上。这种获取知识的方式存在很多弊端,首先这种属于集中式机制的系统普遍存在可伸缩性瓶颈和单点出错的局限性。其次是没有一个搜索引擎的索引能超过可索引网络的三分之一,这使得搜索引擎不能收集相关的信息并返回到用户的桌面上。此外,互联网上的信息通常缺乏语义,搜索引擎普遍以关键字匹配方式执行其搜索,大多数搜索返回许多不相关的结果,相对涉及原始搜索关键词的重要结果没有被提供。人们通常很难发现自己所需的信息,这就使得用户很容易埋没在信息海洋里。 随着Peer-to-Peer系统例如Napster、Freenet和Gnutella等的成功应用,为数据共享提供了高效便利的解决方案。尤其是其非结构化系统具有可伸缩性、灵活性和自治性等优良特性,较好地解决了在集中式机制系统中普遍存在的问题。尤其是P2P的搜索无须通过Web服务器,也可以不受信息文档格式和宿主设备的限制,可以达到传统目录式搜索引擎无可比拟的深度(理论上包括网络上所有开放的信息资源)。P2P为互联网的信息搜索提供了一个全新的解决之道。但当前P2P系统也存在仅支持弱语义(甚至缺乏语义)和粗粒度(文件水平)共享等局限性,用户通过文件的标识符进行查找,一方面很难找到自己所需的信息,另一方面许多标识符相近、语义不相干的内容被返回,造成了大量带宽和计算机资源的浪费,极大限制了P2P潜能的发挥。显然缺乏语义的共享既不能很好地满足用户的需求,也不能有效的利用系统的资源。 语义WEB的出现为解决P2P系统中因缺乏语义使得机器无法自动识别信息的问题指明了方向。语义Web构建在自定义标记的XML和表示灵活数据的RDF基础之上,其目标是应用有效的标准和技术使得计算机能够更多地理解网上的信息,从而进行知识发现,数据集成,信息导航等。其核心层为XML、RDF和本体。在语义Web中,本体是解决语义层次上数据资源共享和交换的基础。 本体是共享的概念模型的形式化的规范说明。它为某一领域的人和应用系统之间的交流提供一种通用的知识共享。本体能够辅助用户实现某种程度的知