【摘 要】
:
随着大数据时代的到来,信息的海量增长使人们不得不面对信息过载的困局。推荐系统作为解决信息过载的有效技术手段,一经提出就吸引了众多学者的关注。协同过滤算法作为推荐系统领域中最常用的算法之一,随着数据的快速增长逐渐暴露了其固有的一些问题。其中,可扩展性问题是阻碍其发展的主要障碍之一。为了缓解该问题,学者们提出了各种各样的方法,基于信息核的推荐方法就是其中一种较为新颖的方法。目前主要是通过启发式的方法构
论文部分内容阅读
随着大数据时代的到来,信息的海量增长使人们不得不面对信息过载的困局。推荐系统作为解决信息过载的有效技术手段,一经提出就吸引了众多学者的关注。协同过滤算法作为推荐系统领域中最常用的算法之一,随着数据的快速增长逐渐暴露了其固有的一些问题。其中,可扩展性问题是阻碍其发展的主要障碍之一。为了缓解该问题,学者们提出了各种各样的方法,基于信息核的推荐方法就是其中一种较为新颖的方法。目前主要是通过启发式的方法构建信息核,相比于传统协同过滤算法在推荐质量方面存在一定损失。针对这一问题,本文提出了基于进化及网络传播算法的信息核优化方法,用于减少在线推荐时间,以缓解可扩展性问题,同时也提升了推荐质量。具体内容安排如下:(1)提出了一种基于多子种群进化算法的信息核优化方法。首先,根据用户的度提出三种约束条件将种群划分为三个子种群。然后,将每种约束条件与信息核都编码在种群个体中,通过进化迭代自动搜索出较好的度阈值。最后,利用精英保留策略保留竞争能力较强的子代个体构成下一代种群,在种群个体总数不变的情况下,竞争力强的子种群规模逐渐增大,而竞争力弱的子种群规模会逐渐缩小甚至被完全淘汰。实验结果表明,本方法能够有效地发现信息核,从而得到了比其他对比方法更好的推荐质量。此外,极大地减少了在线推荐的时间。(2)提出了一种基于进化及聚类算法的虚拟信息核优化方法,该方法旨在提高系统中用户信息的利用率,构建包含信息更丰富的虚拟核用户。首先,提出了一个简单“平均法”去融合多个用户的信息来构成虚拟核用户。然后,将搜索虚拟信息核的问题建模为组合优化问题,并通过进化算法去解决该问题。最后,为了使离线优化更有效率,我们提出两种改进策略。第一种策略是通过降维和聚类构建更小的训练集和验证集;第二种策略是引进一种基于降维和聚类的相似度方法。实验结果表明,基于进化及聚类算法的虚拟信息核优化方法进一步提高了推荐质量,其在线推荐时间与对比方法相比更短,具有更强的缓解可扩展性问题的能力。(3)提出了一种基于聚类及网络传播算法的虚拟信息核优化方法,该方法旨在减少虚拟信息核的离线优化时间,同时进一步利用系统中用户的信息去构建性能更好的虚拟信息核。首先,为了减少重复聚类的时间以及获得更好的聚类效果,我们利用t-SNE算法获得用户的低维数据。然后,将用户的低维数据进行重复聚类,并在用户的高维数据中计算每个簇的聚类中心,从而获得虚拟用户。最后,利用改进的网络传播算法从虚拟用户中选出一些虚拟核用户来组成虚拟信息核。实验结果表明,通过该方法构建的虚拟信息核进一步提高了推荐质量,并且大大减少了虚拟信息核的离线优化时间。
其他文献
太阳能与燃煤互补发电技术已被证明是一种利用太阳能规模化发电的有效方式。将太阳能热引入到常规燃煤机组,一方面可以大幅降低太阳能热发电成本、提高光电效率,另一方面也可
普惠金融的基本理念自2005年正式提出起,通过十几年的发展与改革,普惠金融已逐渐得到政府的支持与认可,这主要归功于其所具备的包容性和非歧视性。金融服务的“追求利润”特征是长期存在贫富差距,制约经济增长的重要原因之一。在2006年我国引入“普惠金融”以后,一系列的举措与普惠金融政策密集出台,以推动普惠金融在我国的发展。农村金融的发展涉及八亿农民,不仅对农民增收有着显著的正效应,还能相应的增加农民的收
红外被动测距系统自身不向外辐射能量,仅以被动的形式接受目标的红外辐射,再通过一定的算法将接收到的红外辐射转换为距离信息,较激光、声呐等主动测距系统而言,红外被动测距
时间域电磁法(Time-domain electromagnetic method,TDEM)又可称为瞬变电磁法(Transient electromagnetic method,TEM),是地球物理电磁法勘探的重要分支,一般采用不接地回线
随着信息技术迭代速度加快、消费者需求越加差异化、多样化、个性化,在瞬息万变的市场环境中如何快速的响应市场和客户的需求变化,已成为项目驱动型企业不可避免的重要课题。流程模块化作为模块化理论在业务流程系统中的创新性应用,因其通过模块化设计能够在不损失效率的前提下,提高业务流程系统的柔性,帮助企业在日趋激烈的竞争中占据先发优势,受到了越来越多的企业和研究学者的关注。当前,项目作为迅速满足市场所需,帮助企
习近平总书记在十九大报告中指出,中国特色社会主义进入新时代,这是我国社会发展新的历史定位。青年兴则国家兴,青年强则国家强,习近平总书记重视青年学生的思想政治教育工作
20世纪80年代初期,随着苏联入侵阿富汗,美苏关系急剧恶化,美国总统里根上台后对苏全方面施压,引起了苏联的恐慌。苏联决策层认为北约国家准备对苏联发起核导弹攻击,于是开展
上市公司并购重组类公告信息的结构化处理,可以为投融资决策、市场监管、股市预测、企业画像等领域提供有效的数据支撑,成为股市和证券市场应用服务开发的重要一环。如何精准且高效地实现并购重组类公告信息的结构化,成为当前金融和证券公司着重需要解决的问题之一。并购重组类公告是一种具有固定格式的自由长文本,针对公告特点,本文提出一种规则法和序列标注法相结合的的公告信息抽取方案。该方案主要包含两部分,第一部分为“
微小区网络,通过在传统宏基站的覆盖范围内密集部署小基站向用户提供低功率接入点,有效地减少了覆盖漏洞并提升了频谱效率,被认为是第五代移动通信系统的关键技术之一。然而,回传作为宏基站与小基站之间的通信链路,对微小区网络的部署难度、成本以及用户的服务质量均具有决定性作用。近年来,毫米波频段由于具有大带宽、高增益、小干扰、低成本的优点,成为了目前最具有发展前景的无线回传方案。尽管毫米波回传具有诸多优势,但
图像修复一直以来是计算机视觉领域的一个热门课题,近几年随着人工智能的蓬勃发展,深度学习也随之快速发展。特别是在图像识别、图像分类、语音识别、身份识别、目标跟踪、图像修复、行为分析等领域的研究上有了巨大的发展。深度学习对于非线性问题的拟合以及对于图像、语音等物理特征的快速有效提取,使得这些原本在传统方法上需要人为设定并人工提取特征的问题变得简单。深度学习的模型训练和学习变得更为方便和快速。虽然深度学