基于词嵌入的个性化新闻推荐算法研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:lblb0628wto
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的发展,越来越多的人将阅读的方式转变为网上阅读。新闻推荐作为一种新闻过滤和用户定位的手段,可以根据用户历史的阅读习惯为用户推荐其可能感兴趣的新闻话题,帮助用户在大数据时代下,准确的获得有效信息,节省大量的阅读成本,有效的解决了大数据带来的信息过载问题。而目前对于信息过载条件下的推荐系统研究主要集中在电子商务领域,对于新闻的个性化推荐研究较少,但新闻作为日常生活必不可缺的一部分,更新迭代速度快,信息量大,用户很难及时的捕获到自己感兴趣的信息。因此,针对新闻进行个性化推荐具有重要意义。协同过滤模型是经典的推荐算法模型,取得了较好的成果,且随着统计学的发展,神经网络的出现将神经网络与协同过滤相结合的神经协同过滤模型又进一步提升了推荐系统精度,然而,这两种模型均存在着一定的局限性,例如都是通过用户和项目的交互记录来提取用户的行为特征,没有充分利用可用的额外信息,限制了推荐准确度的提升,且对于稀疏数据较为敏感。因此,本文将结合文本挖掘技术与神经协同过滤模型在新闻推荐领域的应用进行研究。首先对目前主流的推荐算法和文本特征表示的相关原理进行详细的分析和介绍,并总结了各个方法的优缺点。在此基础上,结合词嵌入技术,对神经协同过滤进行改进,本文的具体工作如下:(1)本文首先对国内外推荐算法和词向量的研究现状进行文献梳理总结,并针对推荐系统中常用的推荐算法的相关原理及优缺点进行详细分析,为后面针对推荐算法的进一步研究提供理论参考。(2)对神经协同过滤算法进行改进,针对模型只利用用户和新闻交互信息的不足,将词嵌入技术引入模型,提取新闻特征,在用户和新闻交互信息的基础上,融合新闻标题、新闻内容信息作为模型的输入特征,从而提升模型精度。(3)针对目前主流的词嵌入技术如单词级别的词嵌入模型Word2Vec、字符级别的词嵌入模型FastText、段落级别的词嵌入模型Doc2Vec三种方法在中文新闻个性化推荐中的效果进行对比分析研究,并分析各自的优缺点。最后,本文将文中优化后的推荐算法与传统的隐语义模型和神经协同过滤模型的推荐效果进行对比研究,实验结果表明本文优化后的算法,能够在一定程度上提升推荐准确度,有效的完成新闻推荐任务。
其他文献
现代化农业生产发展需要地面气象观测工作提供及时、准确的天气预报预警服务以及完整、有效的气象变化资料,本文分析了地面气象观测工作的应用和存在的问题,并提出相关对策,
<正>寓教于乐,轻松愉快地学习科学?这不仅是学习者所梦寐以求的,也是广大教育工作者和科学传播工作者所关注和追求的焦点。科学普及出版社最近出版的《非正式环境下的科学学
<正> 很多父母把幼儿“粘人”视为缺点。而学前教育专家却特别指出,幼儿“粘人”不仅不是坏习惯,适当“粘人”还有利于将来的沟通和交流。
期刊
目的:探讨磁共振弥散张量成像(diffusion tensor imaging,DTI)对脊髓损伤的临床应用价值。方法:选择42例健康志愿者作为对照组和54例脊髓型颈椎病作为病例组进行颈椎常规磁共
<正> 在废水处理过程中,无论从管理角度看,或是从处理方法的经济效益角度看,污泥脱水都是重要步骤。1微米大小的污泥微粒,处在悬浮状态是最稳定的,脱水也是困难的。然而,如果
蔡家坞金矿区位于金山金矿田西部,目前金山金矿田西部投入地质工作量偏少,地质研究程度偏弱,蔡家坞金矿的发现和研究无疑对该区域地质找矿具有指导意义。
目的研究基于患者视角的公立医院品牌资产评估模型,为提升公立医院品牌传播策略提供依据。方法采用文献研究法和问卷调查法,对数据进行统计分析。结果从品质认知度、品牌知名
在新冠疫情期间,大华股份结合热成像、黑体的测温原理,通过科技创新,实现技术突破,有效解决了热成像测温精度问题。大华"热成像+黑体"的人体测温模式经过在火车站、机场、地
莫尔特曼认为,用"生态灾难"来描述当今的生态危机是准确的,因为当今的生态危机是整个系统的危机,不仅是人类自然家园的丧失,而且也是人类精神家园的丧失.危机的根源在于人的
水资源的合理利用是国家经济可持续发展的重要环节,我国是水资源匮乏的国家,污水的大量排放进一步加剧的用水矛盾,水资源污染问题治理迫在眉睫。本文在详细分析了EST技术原理和