论文部分内容阅读
随着万维网的普及和社会信息化程度的提高,人们所掌握的知识呈现爆炸性增长的趋势,各个应用领域所积累的信息资源在飞速增长。这些信息资源包括音频、视频、网页、文本等多种形式。它们的形式多样、描述方式不一,缺乏规范,这给信息之间的交换和信息资源管理带来了诸多挑战。元数据机制是解决这些问题的有效手段。然而,现在研发的网上数字资源元数据的结构也呈多元化。不同元数据的结构各有优点,在不同领域发挥着不同的重要作用,短期内无法相互取代。因此设计一种能适应不同结构的元数据存储检索系统就具有很强的现实意义和理论意义。在参与上海市科技攻关项目“基于元数据管理的世博知识共享系统研究”的基础上,本文以构建能适应于不同结构元数据的元数据存储检索系统MSR为出发点,基于Web服务(Web Service)技术,对元数据的存储和检索从系统设计到具体应用的进行了研究,设计与实现了一个原型系统。作者的主要工作和成果是:首先,在分析项目需求背景的基础上,提出了元数据存储检索系统MSR的系统架构和层次划分机制,并通过后来的实践证明该系统架构和层次划分机制具有良好的灵活性和应用扩展性。其次,提出了基于XOM和ORM工具的XML文件存储检索方法,利用XML文件是树状结构这一本质,实现了不依赖XML文件具体的结构构建元数据存储管理系统,并利用HQL语言和结构信息映射表实现了应用系统和元数据具体结构的隔离,使MSR系统适应于不同结构的元数据,具有良好的移植性。再次,基于编译原理相关技术,从Xquery的语法角度出发,利用HQL语言模拟Xquery的语义,并结合具体程序和XOM工具构建查询返回结果,建立了Xquery查询转换引擎。并将Xquery查询转换引擎组合到基于SOAP的元数据远程管理平台上去,使外界对MSR系统的查询利用更加方便和统一,便于让外界进行功能扩展和复用。最后,设计并实现了元数据的检索应用。通过对查询语句过滤和分组条件的分类,利用类型与关系符映射,矩阵类型匹配策略,使检索功能灵活性高并且多样化。针对定位资源的主题检索,将元数据主题检索和知识领域的本体结合了起来,提出了主题相关的权重比较算法,为实现智能知识化的主题检索提供了一个有益的参考和实现。本论文受上海市科技攻关项目-2006年度“登山行动计划”项目国际合作计划“基于元数据管理的世博知识共享系统研究”(编号:065107042)支持。