基于混合模型的学术论文推荐方法研究

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:fly_bird2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着互联网技术的高速发展,学术研究领域也发生着翻天覆地的变化,网络上学术论文的数量呈爆炸式增长。研究人员在网络上查找其所需要的学术论文信息时,往往需要花费大量的时间和精力,因此如何快速、准确的为研究人员找到其感兴趣的学术论文信息成为亟待解决的问题。本文主要围绕研究人员学术研究兴趣建模,以及如何准确地向研究人员推荐学术论文展开研究。论文在对基于内容推荐算法中的主题模型和协同过滤方法中的模型推荐方法研究的基础上,融合两种推荐方法提出了一种新的混合推荐方法,改善了协同过滤推荐方法中数据稀疏性对于推荐效果的不良影响。本文编码实现了提出的基于混合模型的学术论文推荐方案,通过实验确定了方案中的一些参数取值,并与其他推荐方案进行了对比分析,验证了本方案的有效性和优势。本文提出的方案包括一种新的主题模型—-ACTOT(Author Conference Topic Over Time)以及基于该模型的混合推荐模型MFWT (Matrix Factorization With Topic)。ACTOT模型结合了论文的内容信息、发表期刊/会议信息和发表时间信息,可以准确地对研究人员的兴趣进行建模。MFWT (Matrix Factorization With Topic)模型在实现了基于模型的协同过滤方法和基于内容的推荐方法的混合,使用ACTOT模型和LDA模型计算的用户主题向量和论文的主题向量,并分别对PMF(Probabilistic Matrix Factorization)模型中的用户隐式因子特征向量和论文隐式因子特征向量作正则化处理,修正了PMF模型的推荐结果,有效地改善了评分矩阵稀疏性带来的不良影响,同时也解决了协同过滤方法的冷启动问题。本文首先分析了学术研究领域现在主流推荐方法的研究现状和不足之处,然后详细介绍了本文提出的MFWT混合模型设计方案和实现方法,最后介绍了MFWT模型的实验验证和实验结果分析。
其他文献
该课题研究并初步实现了一个基于WEB的机械产品协同设计环境,为机械产品设计过程中不同的设计者通过WEB环境进行协同工作提供了手段.系统使用数据库存储了大量的机械产品设计
随着现代制造业的发展,如何敏捷地利用技术提供的可能性,及时抓住市场对新产品需求的机遇,迅速开发出适应市场需要的新产品,已经成为企业赢得市场竞争的关键。于是提出了协同设计
软件测试贯穿于软件定义与开发的整个期间即整个软件开发过程中.为保证软件开发各阶段的一致性,软件测试的主要依据应该来自于软件需求和软件设计.该文的研究范围即属于基于
发布计算资源是与计算机网络的出现和发展相伴随的一个必然的现象,由于以往发布计算资源的过程较为简单,而未受到足够的重视.Internet规模的迅速扩大,网上资源的不断增多,使
(1)分析并阐述Dublin Core元数据与网络标记语言结合的原理和标记方法.(2)实际解决CNMARC与Dublin Core之间的相互映射转换关系.提出了光盘资源的Dublin Core描述方式.(3)开
随着信息时代的到来,传统的企业业务模式也在随之转变,为适应快速变化的竞争环境,出现了动态联盟(虚拟企业)的工作模式。我们将其成功地应用在住宅建设行业中。一个行业级的并具
电子商务的蓬勃发展使得Internet上的资源和服务更加丰富多彩,这些丰富的资源和服务每天又都会产生许多新的、蕴涵着大量重要的信息的异构、不确定性和非结构化海量数据,其复
发布/订阅是一种分布式系统的事件驱动过程范式,对消息的生产者与消费者进行空间、时间和控制的解耦,它的异步和多点通信的特点增强了分布式系统的灵活性和可扩展性。在现有应
该课题的设计目标是建立一个电子商务平台,为应用服务提供商(ASP)提供底层的应用服务支持,从而使应用服务提供商可以在统一的应用平台上迅速架构自己的服务.这种电子商务平台
该文的工作正围绕数据挖掘技术在基金评估与时间序列分析中的应用展开.主要的工作如下:(1)该文详细分析了数据处理和数据挖掘相关技术的发展现状.讨论了各种实现方法的特点、