论文部分内容阅读
万维网中资源通过超链接互联,而语义网中的资源通过语义关系互联。文档排序是现有搜索引擎的关键组成部分,在未来的带有语义分析的搜索引擎中,语义关系发现、预测、查询以及基于语义关系的资源排序将发挥重要作用。
资源之间的语义关系查询是一种常见的查询需求。语义关系表示、发现和推理是语义关系查询的前提。为了发现资源之间的语义关系,需要找到语义关系表示和推理的模型和方法。资源之间的语义关系自动发现是自动构建语义链网络的关键。
本研究工作围绕语义关系发现、预测、查询和应用展开。利用概率语义链网络模型,对资源之间语义关系表示和推理。针对科学研究领域建立研究资源语义链网络,探讨了语义关系在研究网络中的应用。本文主要贡献如下:
1.提出了概率语义链网络模型,用于资源之间不确定语义关系的表示与推理。概率语义链网络为语义链网络的自动构建和不确定语义关系表示与推理提供了一种可行的模型。基于该模型,重点研究了语义关系之间的推理关联和统计关联,并探讨了在语义检索中的应用。
2.提出了一种自动发现文档之间语义关系的方法。基于初始文档集合,综合运用文本分析、文档聚类与分类、关系推理等技术,发现文档间的语义关系,并且利用语义链推理和预测规则,建立文档之间的概率语义链。文档间语义关系发现是自动构建概率语义链网络的重要一步。
3.提出网络拓扑中心度概念,利用拓扑中心度在研究资源语义链网络中进行社区发现和主干网构建。拓扑中心度用于描述网络中节点和边的中心性。节点拓扑中心度能够反映节点在网络中的角色,进而对eScience网络(如合作网络和引用网络等)进行社区划分和主干网构建。