【摘 要】
:
近年来,随着互联网技术的快速发展与应用,线上数字内容呈现出爆炸式的增长趋势。用户在使用传统搜索系统进行信息搜索时,经常会获得海量不相关的搜索结果,这些结果往往与用户
论文部分内容阅读
近年来,随着互联网技术的快速发展与应用,线上数字内容呈现出爆炸式的增长趋势。用户在使用传统搜索系统进行信息搜索时,经常会获得海量不相关的搜索结果,这些结果往往与用户最真是的搜索意图相去甚远。信息检索中用户在查询时输入的查询词比较少,在信息匹配上容易产生歧义性,导致搜索结果不全面、不准确。为了减少信息负担,个性化搜索的需求日益增加,如何准确返回针对单个用户查询意图相关的文档成为了重要的研究课题。在这种情况下,很多研究者对社会标签产生了兴趣,利用用户对网络资源所标注的标签,学习用户的行为和兴趣,实现个性化查询扩展。采用社会标签虽然可以提高检索质量,但是真实的标签系统往往比较稀疏,并且标签本身存在不规范性、随意性,传统的基于社会标签的个性化查询扩展搜索结果往往并不理想。在扩展词的选择方面,由于标签与被标注资源本身可能字面上相差甚远,也并非该资源的精确描述,因此借助标签来进行查询扩展效率不高。为了解决这一问题,本文主要贡献如下:(1)本文利用标签-主题模型方法来对用户兴趣模型进行建模,模型基于词进行隐含主题的学习。在该方法中,扩展词的选择并不仅仅依赖于词项匹配,而是基于主题的相关度来进行。(2)在本文中,我们通过考虑从文档中提取的标签,文档和单词之间的多重关系作为多关系图来扩展以前的研究。我们使用词嵌入模型(WE)的学习标签之间的关系,单词之间以及标签和单词之间的关系。根据标签和单词之间的相似性构建三个关联图,并将所有关系融入到多语义查询扩展框架中进行个性化搜索。(3)本文进一步提出了个性化查询扩展方法,利用社会标签的多语义关系来进行扩展词的选择。基于大规模真实社会化标签数据集上的实验结果表明,本文提出的方法优于传统的非个性化搜索以及基于社会化标签系统的个性化查询扩展方法。
其他文献
随着人类社会的发展,城镇化是人类社会发展的必然趋势,而随着村落的消失,与之相关的自然景观和文化都在逐步缺少。在这一背景下,作为村落传统文化的组成部分,将面临着传承和
如何通过恰当的宏观财政手段,实现提升农地利用效率、农村经济发展水平和农民收入的目的,是急需研究的关键问题。近年来,农业补贴政策已经成为中央政府强农惠农政策的最重要
以往的决策研究关注的大多是个体如何在可选项间立即做出选择,却忽略了决策领域另一个普遍现象——延迟选择。近年来,有关延迟选择的研究得到了广泛的关注。已有的研究分别从认知、情绪和个体差异特征的角度探究延迟选择的影响因素。此外,有研究表明决策风格这一个体差异特征在决策中发挥着重要的作用。而关于最优化、满意型决策风格和延迟选择的关系,目前少有研究。因此,本研究重点探究最优化、满意型决策风格和延迟选择的关系
中国的煤炭产量占世界总煤炭产量的近45%,而且煤炭开采破坏大量土地产生巨大的碳排放,所以低碳减排已成为中国等世界采煤大国的责任和共识。科学研究表明土地利用优化能在很大程度上增加碳汇,对促进区域乃至全球低碳减排具有重要意义。但是目前国内外对井工煤矿区低碳土地利用优化的研究很少,也缺乏响应的理论来指导井工煤矿区低碳土地利用的规划和实践。本文以晋煤集团大型煤炭基地内的集中连片井工煤矿区为研究对象,首先以
基于标记点的谱聚类算法降低了谱聚类算法的计算复杂度,避免了传统谱聚类算法计算时间长的应用局限。但是,使用聚类准确性和标准化互信息衡量聚类有效性,基于标记点的谱聚类算法的聚类有效性较低。如何平衡聚类有效性和聚类时间成为了基于标记点的谱聚类算法面对的难题。针对此问题,提出了一种基于KD标记点的谱聚类算法。首先,提出一种KD标记点选取方法,该方法使用超平面将样本空间不均等划分为p个子块,超平面垂直于样本
为了遏制囤积商标等恶意注册行为,2019年新修订的商标法明确将“不以使用为目的的恶意商标注册申请”列为驳回注册或宣告无效的绝对事由,不受申请主体和期限的限制。商标注册阶段“使用意图”或者“使用目的”要求第一次在我国商标立法中被提及,其制度定位、调整范围、判断标准等关键问题有待论证。2019年10月,国家市场监督管理总局发布的《规范商标申请注册行为若干规定》将缺乏使用意图的恶意注册行为类型化为五类情
近年来,流式文档广泛地应用在社交、媒体、办公以及出版等领域。面对海量的流式文档,如何使计算机自动、准确地理解文档成为了各行各业开展其他应用研究的基础。其中对流式文档结构的理解,一方面可为文档检查优化、文档自动排版、结构化检索等应用奠定基础,另一方面也可辅助篇章层次分析、文章主题抽取等更高层次的语义研究,有较大的应用价值。由于流式文档格式的复杂性、排版风格的差异性等因素,导致计算机自动理解其结构较为
知识爆炸的信息化时代,人们获取信息的途径、思考的方式都发生了深刻变化。正是环境、工具的改变,信息时代对学习者的能力也有了不同以往的要求,更加注重学习者的批判性思维、问题解决等高阶能力。深度学习作为一种注重学习者以批判质疑的态度看待知识、积极主动的将新旧知识进行联结,并能利用获取的知识解决存在于现实生活中问题的学习过程,与当前社会对人才的要求不谋而合。面对知识的爆炸增长,仅仅凭借单纯的死记硬背、填鸭
针对传统入侵检测模型在高维数据且数据不均衡环境下检测性能较差的问题,采用基于深度学习模型的特征学习与泛化能力与不平衡算法中过采样算法对数据分布不均问题的解决方案,提出了一种自适应过采样算法(ADASYN,Adaptive Synthetic Sampling Approach)与改进堆叠式降噪自编码器(SDA,Stacked Denoise AutoEncoder)结合的入侵检测模型,在保持原有深
复值神经网络是一类用复数变量解决复杂问题的网络。梯度下降法是训练复值神经网络的流行算法之一。目前,建立的传统网络模型大多数是整数阶模型。与经典的整数阶模型相比,建