基于词义相似度的文本推荐系统的研究与实现

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:qinqincy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,由海量文本信息造成的“信息过载”现象越发严重,如何在海量数据中高效的获取目标文本成为了目前信息检索领域的研究重点。基于内容的文本推荐系统是指从用户历史阅读文本信息中提取用户兴趣,然后以此为依据从文本库中将用户可能感兴趣的文本推荐给用户的一种个性化信息检索系统,相比于传统搜索引擎,该系统能够高效的满足用户对个性化信息的需求。但是目前常见的文本推荐算法仅考虑了特征词词形的严格匹配,未考虑语境对词形的影响以及不同词形之间的同义关系。针对该问题,本文研究并实现了基于词义相似度的文本推荐系统。本文的主要工作为:1.一般在向文本推荐引入同义关系时,弱同义词关系及多义词关系会在计算用户兴趣和文档特征相符程度过程中引入误差,降低推荐效果,鉴于此,本文借鉴链路预测思想,从网络结构特征的角度优化同义词网络,提出了基于链路预测的强同义词网络获取方法。2.在强同义词网络的基础上,本文结合最短路径、最优匹配算法,在文本推荐中引入强同义词关系,并应用词干提取技术消除不同语境对词形的影响,提出了基于强同义词网络的文本推荐算法。3.以基于强同义词网络的文本推荐算法为核心,应用IOCP通信模型、多客户端多服务器C/S架构、负载均衡等技术手段,本文设计并实现了基于词义相似度的文本推荐系统。本文首先研究了信息检索模型以及结构化表示文本的方法,结合应用需求选择了合适的信息检索模型与文档预处理技术;实现了基本的基于内容的推荐方法及系统;在此基础上探究了在文本推荐算法中引入同义词关系的途径,鉴于弱同义词关系以及多义词关系对推荐系统的影响,本文从网络结构特征的角度借鉴链路预测的思想提出了强同义词网络的获取方法;随后以基于内容的推荐算法为基础,提出了基于强同义词网络的文本推荐算法,通过仿真验证了其推荐效果的提升;最后以该算法为核心设计并实现了基于词义相似度的文本推荐系统。
其他文献
为了掌握以三乙烯二胺乙二胺高氯酸盐共晶炸药(SY)为装药的柔性导爆索的起爆特性、爆轰特性以及工程应用特性,本文从SY柔爆索的起爆方式、爆轰速度测试、殉爆安全性、“T”型
周期胞结构复合装甲具有优异的抗射流侵彻和抗爆性能,具有广阔的应用前景。周期胞结构复合装甲是以饱含液态物质的多胞元结构作为夹层,高强度钢板作为盖板的新型复合装甲。开
针对Modbus协议和CAN现场总线的特点,提出了一种CAN总线与Modbus总线之间转换的方法,并给出了一种基于单片机技术的硬件实现。实现了将Modbus设备连接到CAN现场总线网络中,并
本论文是基于嵌入式系统VxWorks并利用Tornado开发工具进行的软件人机接口的开发,重点阐述了利用VxWorks的图形开发组建WindML进行控制系统人机界面的设计,人机界面与外设的
弹体侵彻靶板一直是军工领域研究的热门课题,在数值模拟计算中,一般认为在侵彻过程中弹体温升影响较小,因此不考虑热传导的影响,这是与事实不相符合的,在侵彻过程中弹体温度
当前,关注“网红”(本研究中的“网红”是指在网络上走红的人)群体年轻化,“网红”年轻化,想当“网红”成为青年群体新现象。在“网红”4.0时代下,“内容为王”大行其道。本
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
根据城市工业用电量与其影响因素之间存在的非线性映射关系,建立了一个改进BP人工神经网络模型,并将其应用于泰安市工业用电量的预测中。实例表明,该方法预测精度较高,具有一定的
在靶场等兵器试验场地进行弹药当量测试、炸点定位或者毁伤效果评估测试时,经常需要布设大量传感器采集相关信号,包括冲击波压力传感器、破片测速探头等。而传感器位置的准确