推荐系统若干关键技术研究

来源 :电子科技大学 | 被引量 : 26次 | 上传用户:turandeji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,网络已经从以内容为中心的单向信息提供者,发展到以人为中心、以交互为特征的网络平台阶段,目前正进入以移动互联网为代表的智能化、个性化的万物互联时代。网络一方面给人们带来了便利,但另一方面,由于网络中的信息量呈现指数式增长,使人们真正需要的、真正感兴趣的东西被淹没在信息的海洋中,面临着严重的信息过载问题。为了解决这个问题,相关的技术工具也经历了分类目录、搜索引擎、以及目前的推荐系统三个发展阶段。推荐系统已经成为继搜索引擎之后最为重要的信息过滤工具,其目标是为用户提供个性化的产品和服务,或者帮助用户决策。相关推荐技术在信息检索、机器学习以及数据挖掘领域得到了广泛的研究。目前推荐系统已经在新闻、微博、图书、电影、视频、音乐、产品以及餐馆等众多领域得到应用;Amazon、Netflix、Youtube等的在线推荐系统都得到成功部署,不但为用户带来了的良好的消费体验,而且也为企业带来了巨大的商业价值。最近几年,随着移动互联网、物联网、云计算以及人工智能技术的发展,推荐系统逐渐发展成基于广泛连接、以人为中心的个性化服务推荐模式。在这个过程中,推荐系统面临着许多机遇和挑战,主要表现在三个方面:第一、如何利用互联网上出现的大量辅助信息(用户、物品以及交互信息)来解决广泛使用的协同过滤算法的稀疏性、冷启动问题。第二、由于普适计算的发展,上下文信息成为另一种提升推荐系统体验的重要辅助数据来源;因此,如何利用这种新型的辅助数据,设计基于上下文感知的服务推荐系统,实现真正的以人为中心的服务推荐,成为一个重要的研究课题。第三、大量的用户、物品相关的辅助数据、上下文感知相关的辅助数据的出现,一方面可以据此优化算法、提升系统服务;但另一方面,这些数据的隐私保护也变得日益迫切。本文基于这些机遇和挑战,实现了如下的研究工作和创新点:(1)以矩阵分解协同过滤为基础,提出了耦合辅助信息的模型框架,并且基于这个框架提出了耦合物品属性信息的过滤算法。为了解决传统矩阵分解协同过滤算法的冷启动以及推荐准确性不高的问题,本文从隐语义分析的角度,对矩阵分解协同过滤模型的用户隐因子和物品隐因子采用辅助信息进行修正,并形成了模型框架。然后,基于这个框架,从物品端入手,创新性地通过耦合物品属性的COS(Coupled Object Similarity)相似度,提出了耦合物品属性信息的矩阵分解协同过滤算法。该算法利用物品属性相似度约束物品隐特征向量分解,使得属性越相似的物品的隐特征向量也越相似。实验表明该算法可以显著提升推荐结果的准确性,并且可以较大程度地缓解物品端冷启动问题。(2)基于模型框架,从用户端入手,提出了耦合社会信任关系的矩阵分解协同过滤算法。因为人们在购买产品或消费服务之前,常常倾向于向社交网络中的朋友寻求建议;基于这个假设,本文利用社会信任信息计算朋友之间的信任度,并集成到提出的模型框架中来解决用户端冷启动、提升推荐性能。为了实现模型,本文又提出社会信任的度量、群组检测算法、基于压缩自动编码器的用户及物品隐特征初始化方法。实验表明该算法可以明显改善推荐性能,缓解用户端的冷启动。(3)基于上下文辅助信息,提出了智慧家庭个性化服务推荐系统框架及身份感知算法。上下文不仅是推荐系统中用户偏好的来源,也是实现基于环绕智能的个性化推荐服务的基础。因此,本文以智慧家庭为背景,以上下文计算为基础,提出了智慧家庭个性化服务推荐系统的概念框架。然后基于这个框架设计了一个演示场景。为了实现这个应用场景,提出了基于步态识别的移动终端身份感知算法,并对GMM-UBM和I-Vector+PLDA声纹感知算法进行训练评估。前者采用神经网络的方法实现身份匹配。针对后者,创新性地提出了文本半相关的训练方法。(4)针对朋友推荐系统的隐私保护问题,基于混合体系架构与可交换加密技术,提了出用户属性匹配的隐私保护方案。此方案首先使用KNN分类算法做粗粒度朋友筛选,然后使用属性匹配协议实现共享相同属性的朋友之间的细粒度推荐。论文从理论上证明了该协议的确能够抵御主动攻击和被动攻击。最后利用匿名数据进行实际部署,其实验结果表明,论文提出的模型不仅可以实现细粒度的好友推荐,而且保护了用户的隐私信息。
其他文献
随着互联网业务的高速发展,广域网在网络响应速度方面已经无法满足用户的需求。由于响应速度受到很多因素的影响,依靠增加带宽解决这一问题是一个方法但同时带来了带宽利用率
期刊
无线传感器网络是由大量部署在观测环境中或附近的传感器节点通过无线通信方式形成的多跳网络系统。该网络系统因能通过传感器节点采集、处理、传输数据协作地完成大型或复杂
星载合成孔径雷达是以卫星为平台的。卫星沿着轨道运动,雷达以一定的频率发射接收脉冲信号,这就相当于天线顺序地从一个阵元位置移到下一个阵元位置,在空间形成一个“虚”的
心电图是心脏电生理活动的一种图形反映,它是评价心脏功能和诊断心脏疾病的重要的参考依据。如何通过压缩来减少需要传输的心电数据量在临床上具有重要意义。本文结合当前心
当前WiMAX网络管理系统实现了对被管理设备的数据采集,但是对网络资源尚未充分利用,WiMAX技术所独有的QoS机制成为提高网络管理性能以及优化资源配置新的研究热点。论文首先
Ad hoc网络是多跳无线网络,无需基础设施就可以建立动态互联的网络,其网络技术优点是能够提高通信设施的抗毁性和应变能力。在Ad hoc网络中,通信的主机一般是便携式计算机、
典型线目标(道路和海岸线)的提取,在军事和民用领域的各方面已获得广泛的应用,并发挥着巨大的作用。而随着遥感技术的发展,仅依靠单个光谱信息的传统分类方法难以满足实际需
密码算法作为信息安全的重要基础,在信息的传输方面有着至关重要的作用。与软件实现方式相比,密码算法的硬件实现在性能方面具有比较大的优势。本文以FPGA作为硬件基础,对AES