【摘 要】
:
专家搜索是信息检索的重要研究内容之一,属于实体搜索的范畴。目前实体搜索的研究内容更多关注于实体抽取和排序算法的探索和改进,对实体相关性的研究也多关注于相关性本身,
论文部分内容阅读
专家搜索是信息检索的重要研究内容之一,属于实体搜索的范畴。目前实体搜索的研究内容更多关注于实体抽取和排序算法的探索和改进,对实体相关性的研究也多关注于相关性本身,如实体关系抽取等,没有进一步探讨这种相关性对专家搜索排序的影响。
专家搜索中发现专家实体之间的相关性,并把这种相关性用于排序结果优化是一个重要的研究内容。针对上述问题,本文提出了基于实体相关性的排序优化问题。主要工作包括:
(1)定义实体向量空间模型,构造专家实体相关性挖掘模型。指出专家实体所具有的相关性度量量,针对不同的相关性度量量选取不同挖掘算法。由于不同挖掘算法之间具有相对独立性,进一步把针对不同特征的挖掘算法线性组合,计算专家实体相关性度量值。
(2)根据专家实体相关度矩阵,建立实体关系图。图的每个节点为专家实体,图的边为实体相关度值。在此基础上定义有效实体关系图及三类关系。三类关系包括:紧密联系、有联系、无联系。只有紧密联系或有联系的节点才能提供有效的专家实体相关信息。
(3)定义激活节点,定义优化调整规则。激活节点的选取来自两种调整优化模型,一种是返回结果集的前N个节点做为激活节点;另一种选择有效实体关系图前N个节点为激活节点,当返回结果中有与激活节点联系的节点,则触发优化调整规则。
在标准数据集上的实验结果表明,基于实体相关性的排序优化模型对提高排序结果具有很好的作用,平均准率提高6.26%,Bpref提高9.71%。
其他文献
随着网络技术的迅速发展,日益严重的网络安全问题已引起了人们的高度重视,对网络内容的检测已成为网络安全体系中的重要组成部分。作为网络安全检查的核心技术,字符串匹配算
人类迈入知识社会之后,信息呈爆炸方式增长,因此信息系统的安全问题受到越来越多的重视,这不仅涉及到个人计算机的安全问题,也包括大规模分布式系统的安全问题,如那些运行在
XBRL(eXtensible Business Reporting Language)是目前应用于非结构化数据处理的最新技术,其解决了财务报告所存在的报告信息交换复杂,报告生成过程费时费力,信息分析挖掘困难等
上下文无关文法是应用最广泛的一种形式语言,现今大多数程序设计语言的语法结构都是用上下文无关文法来描述的。但上下文无关文法描述问题的能力是不充分的,不能很好的处理自
嵌入式系统在人们生产生活中的普遍应用,已经成为我们正在经历的信息技术革命中的重要标志。而SOC以及SOPC概念的提出和应用则可称得上是嵌入式系统发展过程中的里程碑。特别
随着电信技术以及计算机技术的不断发展,现代信息社会对通信应用人才的需求急剧增加。然而,传统的人才培养体系已经不能够满足社会对此类人才的需求。将网络通讯设备引入到日
有向无环图DAG(Directed Acyclic Graph)广泛应用于数据库建模、工程设计等领域。将矩阵存储的DAG图正确、美观地绘制出来,可以使其更直观、清晰,并且方便各种问题的分析和处
2008年第29届北京奥运会是本世纪初我国承办的最重大的国际活动,也是首次在中国举办的一届奥运会,国内外对此都寄予厚望。北京奥申委做出了“到2008年,基本实现任何人、在任
氧气在钢铁、冶炼、医疗等领域发挥了重要的作用,许多工业部门都采用很多方法来制取氧气。在空分制氧的工业流程中,很多外界因素直接影响到氧气的质量。如何制取高质量的氧气
信息技术的迅猛发展,对社区建设产生了全方位的影响。社区作为政府与群众联系的桥梁和纽带,它的信息化程度深刻地影响着社区的生活方式和管理方式。社区信息化不仅是城市信息