论文部分内容阅读
随着信息技术的快速发展,网络已经从以内容为中心的单向信息提供者,发展到以人为中心、以交互为特征的网络平台阶段,目前正进入以移动互联网为代表的智能化、个性化的万物互联时代。网络一方面给人们带来了便利,但另一方面,由于网络中的信息量呈现指数式增长,使人们真正需要的、真正感兴趣的东西被淹没在信息的海洋中,面临着严重的信息过载问题。为了解决这个问题,相关的技术工具也经历了分类目录、搜索引擎、以及目前的推荐系统三个发展阶段。推荐系统已经成为继搜索引擎之后最为重要的信息过滤工具,其目标是为用户提供个性化的产品和服务,或者帮助用户决策。相关推荐技术在信息检索、机器学习以及数据挖掘领域得到了广泛的研究。目前推荐系统已经在新闻、微博、图书、电影、视频、音乐、产品以及餐馆等众多领域得到应用;Amazon、Netflix、Youtube等的在线推荐系统都得到成功部署,不但为用户带来了的良好的消费体验,而且也为企业带来了巨大的商业价值。最近几年,随着移动互联网、物联网、云计算以及人工智能技术的发展,推荐系统逐渐发展成基于广泛连接、以人为中心的个性化服务推荐模式。在这个过程中,推荐系统面临着许多机遇和挑战,主要表现在三个方面:第一、如何利用互联网上出现的大量辅助信息(用户、物品以及交互信息)来解决广泛使用的协同过滤算法的稀疏性、冷启动问题。第二、由于普适计算的发展,上下文信息成为另一种提升推荐系统体验的重要辅助数据来源;因此,如何利用这种新型的辅助数据,设计基于上下文感知的服务推荐系统,实现真正的以人为中心的服务推荐,成为一个重要的研究课题。第三、大量的用户、物品相关的辅助数据、上下文感知相关的辅助数据的出现,一方面可以据此优化算法、提升系统服务;但另一方面,这些数据的隐私保护也变得日益迫切。本文基于这些机遇和挑战,实现了如下的研究工作和创新点:(1)以矩阵分解协同过滤为基础,提出了耦合辅助信息的模型框架,并且基于这个框架提出了耦合物品属性信息的过滤算法。为了解决传统矩阵分解协同过滤算法的冷启动以及推荐准确性不高的问题,本文从隐语义分析的角度,对矩阵分解协同过滤模型的用户隐因子和物品隐因子采用辅助信息进行修正,并形成了模型框架。然后,基于这个框架,从物品端入手,创新性地通过耦合物品属性的COS(Coupled Object Similarity)相似度,提出了耦合物品属性信息的矩阵分解协同过滤算法。该算法利用物品属性相似度约束物品隐特征向量分解,使得属性越相似的物品的隐特征向量也越相似。实验表明该算法可以显著提升推荐结果的准确性,并且可以较大程度地缓解物品端冷启动问题。(2)基于模型框架,从用户端入手,提出了耦合社会信任关系的矩阵分解协同过滤算法。因为人们在购买产品或消费服务之前,常常倾向于向社交网络中的朋友寻求建议;基于这个假设,本文利用社会信任信息计算朋友之间的信任度,并集成到提出的模型框架中来解决用户端冷启动、提升推荐性能。为了实现模型,本文又提出社会信任的度量、群组检测算法、基于压缩自动编码器的用户及物品隐特征初始化方法。实验表明该算法可以明显改善推荐性能,缓解用户端的冷启动。(3)基于上下文辅助信息,提出了智慧家庭个性化服务推荐系统框架及身份感知算法。上下文不仅是推荐系统中用户偏好的来源,也是实现基于环绕智能的个性化推荐服务的基础。因此,本文以智慧家庭为背景,以上下文计算为基础,提出了智慧家庭个性化服务推荐系统的概念框架。然后基于这个框架设计了一个演示场景。为了实现这个应用场景,提出了基于步态识别的移动终端身份感知算法,并对GMM-UBM和I-Vector+PLDA声纹感知算法进行训练评估。前者采用神经网络的方法实现身份匹配。针对后者,创新性地提出了文本半相关的训练方法。(4)针对朋友推荐系统的隐私保护问题,基于混合体系架构与可交换加密技术,提了出用户属性匹配的隐私保护方案。此方案首先使用KNN分类算法做粗粒度朋友筛选,然后使用属性匹配协议实现共享相同属性的朋友之间的细粒度推荐。论文从理论上证明了该协议的确能够抵御主动攻击和被动攻击。最后利用匿名数据进行实际部署,其实验结果表明,论文提出的模型不仅可以实现细粒度的好友推荐,而且保护了用户的隐私信息。