论文部分内容阅读
语义网为我们提供了应用智能手段处理网络数据的可能。而伴随着语义网的研究,关联数据逐渐成为语义网尝试中主要使用的数据类型,出现了以关联数据集为中心节点的语义网模型。然而随着关联数据集数量的增长,如何将从多来源关联数据集中检索得到的结果进行排序成为了值得关注的问题。要发挥关联数据的开放性和智能性优势,就必须解决来自多个关联数据集的检索结果排序的问题。本文首先较为详细的介绍了关联数据在语义网研究中所扮演的重要角色,阐述了其定义、应用情况、发布方式和检索方法,指出了当前多来源关联数据集检索存在的排序难题:即由于不同关联数据集所采用的RDF词表不同,难以采用统一标准对不同来源的关联数据进行分析和评价。随后引入粗糙集理论,提出了使用基于重要性的属性约简方法来约简最大集合词表,从而建立统一RDF词表的方法,并对方法中应用到的算法原理和步骤进行了表达。在此前提下,本文随后考量建立多来源关联数据排序的综合模型的方法,从建立原则,层次模型,评价值算法的三个层次对该模型进行了阐释。最后,展示了应用该思路对多来源关联数据进行评价排序的实验结果,表明通过建立统一RDF词表并在数据集层面,资源实体层面和匹配层面对关联数据资源进行评价的方法,能够使得多来源的关联数据资源在统一的标准下进行对比和排序,该模型对于多来源关联数据资源的排序结果符合预期,具备了在关联数据应用中实用的价值。应用粗糙集理论建立统一RDF词表并以此为基础建立多来源关联数据排序综合模型的方法,能够在多关联数据集环境下和比较关联数据资源的质量和可靠性。这一研究成果为面向数据集的关联数据的检索排序从单一数据集向多数据集环境的进步奠定了一定的基础,为涉及到从多关联数据集的不同SPARQL端点获取关联数据资源的关联数据应用提供了一个可行的问题解决方案。