论文部分内容阅读
查询扩展是信息检索过程中重要的一步.在现有的研究中,大部分查询扩展方法都是孤立地考察每个词对查询扩展的重要性,挑选最好的几个词作为查询扩展.但已有研究表明,多个最好的扩展词组合到一起效果并不一定是最好的.尝试以集合的方式挑选扩展词:首先通过监督的方法学习单个扩展词的权重以及扩展词之间的约束关系,然后根据一些约束条件,将查询扩展的任务转化成一个整数线性规划问题.通过解决整数线性规划这样一个全局优化的问题来得到最好的扩展词组合.最后,通过在3个TREC标准数据集上的对比实验说明,该方法能显著地提升查询扩展的效