基于哈希学习和时间上下文的推荐算法研究

来源 :大连海事大学 | 被引量 : 3次 | 上传用户:nvli2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断进步,人们已经开启Web2.0时代,随之而来的“信息过载”和“信息爆炸”问题也越来越严重,并且如电商平台等以盈利为目的的网站,存在着经济学中“长尾理论”的现象,即80%的盈利来源于20%的热门商品,但是剩下的80%商品拥有巨大的商业价值,如何将剩余的80%商品推荐给需要的人是解决这一问题的关键。海量的数据使人们需要花费大量的时间和精力去寻找自己所需要的信息,而推荐系统的出现大大地缓解了这一难题。推荐系统通过收集用户的历史行为或者用户的兴趣偏好经过推荐算法的计算来产生用户可能感兴趣的项目列表,在人们没有明确目的或者目的模糊的情况下,推送给用户可能需要的信息。但是推荐系统仍然存在着新用户或者新项目的冷启动问题、准确率问题以及大数据下实时性的问题。本文作者通过大量阅读、收集整理推荐系统相关知识,较为全面地介绍了推荐系统的基本理论知识,阐述了论文的研究意义和国内外的研究现状,针对现有推荐算法中的某些问题与不足进行了探究。本文的主要研究成果如下:首先,针对现有基于时间上下文的推荐算法仅考虑记忆遗忘曲线对用户兴趣变化的影响,而没有将物品以及用户本身具有的时间属性考虑到对用户兴趣的影响因子中,本文提出了一种改进后的基于时间上下文的推荐算法,主要是将用户的年龄以及物品的背景时间等属性融入到传统的时间衰减函数中,改变用户相似度权重对推荐物品的预测评分的影响,最后在真实的数据集上进行实验验证,对比传统的推荐算法本文算法在准确度等多项指标上有较大提升;其次,针对传统的基于哈希学习的推荐算法在二进制码相似性与用户偏好的等价问题,提出了改进的哈希学习推荐算法,在评分信息的处理方面通过去除评分偏置来更好地求解相似度,并通过加入用户和项目时间属性来缓解算法的冷启动问题,通过实验以及结果分析说明了算法的可行性。最后本文通过基于上述两个算法,设计并实现了结合离线推荐与实时推荐的电影推荐网站,在相似度计算方面,通过第四章提出的改进的哈希学习推荐算法缓解了评分信息与用户偏好不对等的问题,使得计算得到的相似度更好地放映用户的偏好进而提高推荐的准确率;对于冷启动等问题,通过本文第三章的改进的时间上下文推荐算法,将添加用户和项目的时间信息来缓解新用户以及新项目的冷启动问题。然后描述了网站的总体结构设计、具体流程的设计、实现的过程、主要的功能网页和推荐效果的展示。本网站加入了实时推荐部分,以便及时地跟踪用户兴趣偏好的变化,提升推荐结果的准确度。
其他文献
随着雷达技术的发展和应用需求的增加,曲线轨迹合成孔径雷达(Curve Trajectory Synthetic Aperture Radar,CTSAR)应势而生,它能解决一些特殊区域的观测问题,具有更大的灵活性
碳纤维增强复合材料(Carbon Fiber Reinforced Polymer,CFRP)被广泛用于航空航天领域,实现其结构健康监测具有重要意义。电阻抗成像(Electrical Impedance Tomography,EIT)方
阿尔茨海默病(AD)是一种神经退行性疾病。由于其不可逆性以及巨大的社会负担,对其早期阶段建模研究,将有助于医生诊断和及时干预治疗。磁共振成像提供了一种安全且高时空分辨
大系统是指由若干个子系统耦合成的系统,广泛存在于石油、化工、电力、交通等诸多领域.由于大系统存在着规模庞大、耦合强、约束参数不确定等特征,使得集中式控制无法实施,也
丁酸香叶酯作为应用最频繁的萜类香料之一,被广泛用于食品、药物、香水和化妆品调配中。工业上目前应用的丁酸香叶酯化学合成法有明显缺点,酶法合成具备反应专一、反应条件温
电气化铁路运输已经逐渐成为世界铁路运输的重要支柱,而我国针对未来高铁发展方向为达到更快的速度,发展智能高铁以及建设绿色高铁。这三个方面相辅相成,也需要同步推进。中
航空发动机叶片作为航空器重要的零件,其健康状况直接关系到航班的运行安全。叶片由于工作环境恶劣很容易产生裂纹、掉块、压坑等损伤,及时准确的日常检查对于维护叶片状态良
逼真地实时绘制动物毛发是3D交互式软件、虚拟现实、数字娱乐等领域的重要课题之一。由于毛发数量巨大且细节复杂,导致计算耗时过长,高精度的毛发效果仅能用于离线渲染。近年
对于提倡新型能源的当今世界,清洁无限的地热能,俨然已成为解决能源危机和全球变暖问题的新型能源之一,但是对于使用地热能的地源热泵系统而言,其设计和应用目前仍存在一定的
随着信息技术和电子商务的飞速发展,电子现金凭借网络支付的优势成为了理想的支付方式。对安全、高效和实用的电子现金的研究,是电子商务交易中亟待解决的关键问题之一,是电