论文部分内容阅读
随着计算机技术的飞速发展,越来越多的人从网络中获取他们需要的信息。这不仅仅是因为网络的方便、快捷,更是因为网络信息已经不断涉及到政治、文化、教育等诸多领域,并能为需求者提供他们需要的足够信息,因此信息网络已成为社会发展的重要保证。用户如何从海量的网络信息中找到与他们查询相关的信息则成为现有研究的重要部分。在传统的信息检索技术中,用户使用查询关键词搜索符合他们查询意图的信息,然而在用户搜索返回的结果中,含有大量用户不需要的信息,因此仅靠关键词进行检索不能提供检索出相关文档的足够信息。然而基于用户生成的标签,则为我们带来了一种新型的发现用户查询意图的方法。Web2.0下的社会标签是用户为他们感兴趣的网页进行标注行为的结果,因为用户频繁用标签来描述自己感兴趣的话题,因此标签不但代表着用户的查询兴趣,也是对网页承载信息的最好揭示。基于以上对关键字和标签的研究,本文提出了面向用户查询意图的标签推荐方法,旨在把能体现用户真正查询意图的标签加入到查询中。标签作为对查询关键词的补充,不仅可以弥补用户短查询语义不充分的缺陷,也可以根据标签与网页上曾经被标注过的标签间的关系,更准确的判断用户查询意图与网页内容的相关度,从而把更符合用户查询兴趣的结果排在靠前的位置上。对于用户仅提交关键词进行的查询,本文利用查询日志为用户的查询意图推荐高质量的标签,用于作为对查询关键词的补充,搜索出满足更多用户需求的相关结果。最后在实验中,本文用两种不同的评价方法对推荐结果和排序结果进行验证,实验表明本文提出的面向用户查询意图的排序方法能更好的确定用户搜索兴趣,为用户返回比传统关键词检索更符合用户查询意图的结果。