面向查询意图的标签推荐技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zerorolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的飞速发展,越来越多的人从网络中获取他们需要的信息。这不仅仅是因为网络的方便、快捷,更是因为网络信息已经不断涉及到政治、文化、教育等诸多领域,并能为需求者提供他们需要的足够信息,因此信息网络已成为社会发展的重要保证。用户如何从海量的网络信息中找到与他们查询相关的信息则成为现有研究的重要部分。在传统的信息检索技术中,用户使用查询关键词搜索符合他们查询意图的信息,然而在用户搜索返回的结果中,含有大量用户不需要的信息,因此仅靠关键词进行检索不能提供检索出相关文档的足够信息。然而基于用户生成的标签,则为我们带来了一种新型的发现用户查询意图的方法。Web2.0下的社会标签是用户为他们感兴趣的网页进行标注行为的结果,因为用户频繁用标签来描述自己感兴趣的话题,因此标签不但代表着用户的查询兴趣,也是对网页承载信息的最好揭示。基于以上对关键字和标签的研究,本文提出了面向用户查询意图的标签推荐方法,旨在把能体现用户真正查询意图的标签加入到查询中。标签作为对查询关键词的补充,不仅可以弥补用户短查询语义不充分的缺陷,也可以根据标签与网页上曾经被标注过的标签间的关系,更准确的判断用户查询意图与网页内容的相关度,从而把更符合用户查询兴趣的结果排在靠前的位置上。对于用户仅提交关键词进行的查询,本文利用查询日志为用户的查询意图推荐高质量的标签,用于作为对查询关键词的补充,搜索出满足更多用户需求的相关结果。最后在实验中,本文用两种不同的评价方法对推荐结果和排序结果进行验证,实验表明本文提出的面向用户查询意图的排序方法能更好的确定用户搜索兴趣,为用户返回比传统关键词检索更符合用户查询意图的结果。
其他文献
随着互联网的快速发展,网上内容极大丰富,为了在海量资源中快速获取有价值的信息,用户趋向于利用搜索引擎检索信息。市场需求的多元化促使专业搜索引擎和特定领域的门户网站在近
在生物信息学的研究中,一个很重要的问题就是基于微阵列技术将肿瘤样本分到不同的类别中。和传统的聚类问题相比,它的难点在于基因空间的维数很高,而要聚类的样本数很小。原有的
随着国际民航运输业的高速发展,我国对民航运输的需求日益提高,中国民航需求量年均增长逾10%,10年后将超过美国成为全球第一大民航市场。伴随空中交通流量的快速增长,机场、
互联网用户数量的飞速增长、网络规模的不断扩大、业务类型的日益丰富使得当前网络上的流量呈爆炸式增长,而网络带宽的扩容却相对缓慢,加上传统路由算法容易导致拥塞的固有缺陷
Hadoop作为一种比较流行的分布式计算框架,对于解决海量数据问题,比起价格昂贵且性能优异的大型计算机,拥有十分明显的优势。与此同时,分子动力学模拟是一种研究复杂物质有力的仿
竞争-冲突淘汰(Contention-Collision Cancellation,C-CC)存取控制方式的研究已经取得了很大进展,但这只是体现在理论方面,对于这种方式在星形网中的实际应用还远远不够。伴随
为了延长无线传感器网络生命周期,一种常见的方式是通过睡眠/工作时序安排算法来动态的规划传感器网络中各节点处于工作状态或者是睡眠状态的周期。K-邻居节点连通算法(CKN)
随着多核和众核技术的普及,计算机以并行化计算方式大幅度提升了系统整体的处理能力和计算性能。但是多核技术也引入了严重的资源竞争问题,各并发任务共享缓存等硬件,造成了缓存
自上世纪90年代开始,在计算机图形学中,非真实感绘制技术走进人类的视野并迅速的发展起来。和真实感绘制相比较,真实感绘制主要是人类对真实世界的模拟,而非真实感绘制技术是建立
教学预警作为高校教学的中确保教学质量的一个重要措施,在如今高校大批量培育人才的背景下显得尤为重要。传统的教学预警依靠excel表格等简单的统计工具进行,它有着滞后性、易