论文部分内容阅读
语义Web被看成是当前Web的扩展,目前已经成为数据与知识工程领域的研究热点。语义Web的核心思想是,通过增加一些语义信息实现对Web上信息的表示及获取方式的改进,使得信息能够被机器所理解,从而高效准确地查找信息。在语义Web中,RDF/RDFS一般被用于描述资源,从而为资源提供语义信息,而SPARQL是一种RDF查询语言。随着互联网上越来越多的信息以RDF语言进行描述,对于RDF的查询成为了一个重要的研究课题。在RDF查询中,由于用户查询意图的模糊性,他们希望能够表达模糊的查询请求,为此,研究者已经展开了一些研究,并出现了一些对SPARQL进行模糊扩展的研究成果。随着这些模糊查询研究成果的出现,随之也带来了一些问题,由于模糊查询要求比较宽松,能够满足这种查询的结果将会有很多,而这些结果都是无序的,使得用户很难快速的从大量无序的结果中找到他们所需要的信息,此时用户希望在众多的查询结果中先看到最符合自己偏好的查询结果,因此对模糊查询结果进行排序就显得很重要了,但是现有的模糊查询结果排序方法没有充分考虑用户的偏好。针对用户希望按照其偏好对模糊查询结果进行排序的问题,本文提出了基于上下文偏好的RDF模糊查询结果的排序方法。首先提出了上下文偏好的形式化表示方法,用定量的方法来表示偏好,通过在偏好中加入上下文加强了偏好模型的表达能力。然后基于上下文状态间的语义相似度对偏好聚类,对每一个聚类产生一个对RDF本体中所有三元组的得分表,以节省存储空间。最后在用户查询来临时,找到和查询最相近的那些聚类,然后利用它们的三元组得分表计算所有查询结果的总体得分,快速提供给用户按照偏好度排序的结果。实验及分析表明,本文提出的方法具有可行性,并通过与现有RDF模糊查询方法比较,验证了本文提出的方法有较强的偏好表达能力和较高的查准率。