面向个性化信息服务的查询词自动推荐方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:mapgis_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化革命在军事领域的深入推进,各类军事信息系统呈融合发展趋势,军事信息体量急剧增长,军事信息服务面临着信息过载的困境。查询词自动推荐是信息系统根据用户输入的字符,采用一定的技术和方法,向用户推荐补全完整的查询词,以提高用户的信息获取效率。而查询词本身具有歧义性和模糊性,且不同用户在兴趣偏好上存在差异,如何根据用户的搜索历史,理解他们的信息需求,建立相应的关注模型,准确推荐满足其个性化需求的查询词,是我军信息服务技术发展中亟待解决的关键问题。
  论文以实现个性化军事信息服务为目标,以用户数据挖掘和排序模型构建为关键技术,围绕军事信息服务中查询词自动推荐研究的理论与技术问题,分别从时间敏感特征、地理位置偏好、用户主题兴趣、检索任务分析、神经网络应用五个方面开展了深入的研究,并提出了相应的方法。论文的主要工作和创新点如下:
  (1)提出了基于查询词时敏特征的个性化查询词自动推荐方法
  针对当前研究没有考虑查询词频率的非周期性激增趋势,无法及时推荐时效性查询词的问题,论文提出了基于查询词时敏特征的个性化查询词自动推荐方法。首先我们利用傅里叶变换方法挖掘查询词的周期性时敏特征,以此预测未来查询频率。然后采用加权移动平均方法分析查询词的非周期性时敏特征,以此预测未来查询频率的增长幅度。最后将两个预测的变化趋势结合起来对查询词进行排序,使得查询词时敏特征得到充分的利用。实验结果表明,该方法比基准方法的排序准确率更高,能识别时效性查询词并满足用户的时效性信息需求。
  (2)提出了对于地理位置敏感的个性化查询词自动推荐方法
  针对当前研究忽略了地理查询词中包含的特殊语义信息和限定条件的问题,论文提出了对于地理位置敏感的个性化查询词自动推荐方法。该方法首先对显性地理查询词和隐性地理查询词分别进行分析和提取,并计算地理位置在查询词和用户兴趣偏好中的概率分布,然后将用户地理位置偏好作为排序标志之一对查询词进行排序。实验结果表明,该方法在排序准确率和推荐成功率上优于基准方法,满足用户对地理信息的个性化需求。
  (3)提出了基于用户主题兴趣的个性化查询词自动推荐方法
  针对个性化查询词自动推荐在用户建模时遇到的数据稀疏性问题,论文提出了基于用户主题兴趣的个性化查询词自动推荐方法。该方法首先利用主题模型挖掘用户的主题兴趣,然后采用聚类方法将主题兴趣相似的用户聚集成群,最后以相似用户历史查询词为补充数据建立当前用户的关注模型,并对查询词进行排序。由于聚类方法通常将用户划分至唯一一个用户群,不能反映用户主题兴趣的多元化,故论文提出了相似用户主题模型,使得用户能够以一定概率隶属于多个用户群。实验结果表明,该方法不仅在推荐准确率上明显优于基准方法,而且对于历史数据稀疏的用户也能给出准确的推荐结果。
  (4)提出了面向复杂检索任务的个性化查询词自动推荐方法
  针对当前研究以搜索会话为基本单元分析用户的信息需求,无法处理横跨多个搜索会话的复杂检索任务的问题,论文提出了面向复杂检索任务的个性化查询词自动推荐方法。我们首先给出搜索会话和检索任务的形式化定义,并将文本相似度与语义相似度结合来识别检索任务。然后从搜索历史、检索任务、搜索会话和查询词四个层次提出相关的排序特征,通过机器学习方法预测查询词与用户当前检索任务的相关度。实验结果表明,相比于基准方法,该方法对于不同复杂程度的检索任务均能推荐更为准确的查询词。
  (5)提出了基于神经网络的个性化查询词自动推荐方法
  针对基于机器学习的方法采用的排序特征过于主观,而且无法模拟复杂用户行为的问题,论文提出了基于神经网络的个性化查询词自动推荐方法。该方法共包含三个层层递进的排序模型。第一个排序模型是一个单层的循环神经网络(Recurrent Neural Network,RNN),它在排序中仅考虑用户在一个搜索会话内的行为信息。第二个排序模型是一个个性化的RNN,它在第一个排序模型的基础上增加了一层模拟用户兴趣偏好的RNN,从而将用户在各个搜索会话中的行为信息串联起来进行排序。第三个排序模型是一个基于注意力机制的RNN,它在第二个模型的基础上加入了注意力机制,从而能够抓住用户在搜索过程中的重点关注内容,减少干扰词对排序造成的不良影响。实验结果表明,我们所提出的个性化排序模型在排序准确率和推荐成功率上均大幅超过基准模型。
其他文献
目前的当务之急是在中低端医疗器械尤其是低端医疗器械领域,国内企业应该未雨绸缪,在跨国公司尚未占领国内市场之前,抢先出手    来自有关方面的数据显示,目前我国医疗器械市场容量在700亿元左右,到2010年,该市场容量有望达到1200亿元。医疗器械在中国即将进入一个“井喷”时代。  目前,世界药品和医疗器械消费比例平均为10∶7,发达国家达到1∶1,我国仅为10∶3。随着医疗服务市场的逐步开放,使国
期刊
《经济》:是什么使你们选择奥运特许?  史飞:这里面有偶然因素,也有必然的因素。2004年的时候,我们成立文化公司,起步阶段以做演出、展览为主,经营了一段时间,我们发现某些赛事市场开发,起步晚,商业运作落后,我们从中看到了机会。于是在经过长时间的调研之后,决定把赛事特许这种模式引入中国,这种特许与麦当劳、肯德基、迪斯尼完全不同,而是把公司定位成一个国际国内大型的文化、体育赛事运营商,这要求我们不单
期刊
首届 “建设创业型新农村 培育创业型新农民”论坛开幕    培育创业型农民,积极推进创业型新农村建设。由经济日报报业集团经济杂志社与中国农业技术经济研究会联合主办的首届“建设创业型新农村 培育创业型新农民”论坛于近日在北京举行。  据了解,该论坛旨在为政府、企业、学者和媒体提供一个互动的交流平台,就如何推进社会主义和谐新农村等问题进行沟通;为各地、各部门以及各企业等社会力量提供合作的洽谈平台,促进
期刊
联合国国际贸易法委员会《采购示范法》修订的方案与思路    为了规范世界各国政府采购行为,实现政府采购科学化并促进各国政府采购贸易市场开放,联合国国际贸易法委员会(以下简称“贸易法委员会”)于1994年正式发布了以政府公共采购为主要规范对象的《贸易法委员会货物、工程、服务采购示范法》(以下称《采购示范法》)。  该法的颁布为世界各国政府采购法律制度的建设与完善提供了良好的示范,为许多国家政府采购立
期刊
北京市政府采购中心完成2007年政府采购培训工作    2007年10月31日至11月2日,北京市政府采购中心组织了面向市区两级政府采购中心共计100余人参加的政府采购业务培训班。  清华大学公共管理学院于安教授、国际关系学院刘慧院长以及国务院发展研究中心政府采购管理体制改革课题组林初宝副组长参加了本次培训班,并分别作了题为“关于政府采购制度的改革问题”、“政府采购国际制度及最新发展动态”和“关于
期刊
2001年,中铝公司成立时,销售总收入不到200亿元。那一年,肖亚庆走马上任,担任中铝党组书记兼任总经理。6年后,这个数字变成了1300亿元。11月28日,肖亚庆在接受《经济》专访时表示,如果给自己这6年的工作成绩打分,他认为是及格。但是,肖亚庆谦逊的表态掩盖不住近几年中铝成功实施“走出去”战略的事实。  《经济》:本月初,必和必拓向力拓董事会发出了并购建议,如果双方合并成功,对中铝将带来哪些影响
期刊
一个是在多元化领域不断深入的中国国企,一个是一贯慎言多元化的世界营销大师    吴光权    多元化价值增长之路  25年前,我们现在所处的这个会场还是一片农田,从这里向东,遇到的第一个热火朝天的工地就是中航苑。航空工业系统内的急先锋们在“以工为主、工贸结合、技贸结合”的方针下,从贸易入手,以工业制造为主线,在中航苑开启了自身的发展之路。    创业初期建立起来的高科技电子制造和机械制造业务一直延
期刊
“川原五十里,修竹半其间。”用这句话来形容安吉的万顷竹海并不为过。目前, 安吉植被覆盖率75%,森林覆盖率71%,现竹林面积105万亩,占全县林业用地的51%。这里是天然的绿色世界。  种竹、育竹、游竹,听竹、画竹、论竹、吃竹笋、喝竹饮料、穿竹衣、用竹家具竿竿翠竹不仅丰富了安吉人的生活,还撑起了安吉经济“半壁江山”。     翠竹筑就致富路    “1984年才承包时,几亩地也就三四千块钱。如
期刊
访国际竹藤组织董事会联合主席、中国竹产业协会会长江泽慧    发展竹藤产业是利用非木质可再生资源并在较短时间内取得成效,经济、社会和环保长期效益显著的一项公益事业,可以有效地改善发展中国家的环境、贫困和乡村经济状况。  10年前,国际竹藤组织(INBAR)在北京宣告成立。它通过促进竹藤国际合作,推广竹藤技术转让模式,实现了环保与扶贫的有机结合,走出了一条创新之路。    发展竹藤产业有哪些重要意义
期刊
专访中国农科院农经所区域经济与现代农业研究中心主任蒋和平    广东德庆县的周富贵今年的柑桔又喜获丰收,三亩地纯收入3万元,“现在比傻种地日子好过多了。”周富贵乐不拢嘴。  通过选准柑桔作为主导产业,积极推行柑桔标准化生产,引领广大农民发展高效农业,德庆县探索出了一条现代农业发展的特色之路。如今,德庆贡柑、砂糖桔已获得“中华名果”、“广东省名牌产品”等称号。  像这样的通过突出特色产业,着力优质农
期刊