基于生成式对抗网络的个性化推荐方法研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:alpine
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的发展为人们的生活既带来了便利,也带来了严重的信息过载问题。为解决信息过载问题,个性化推荐系统应运而生。近些年来,深度学习的出现为个性化推荐系统的发展带来了新的契机。作为深度学习领域新兴的算法,生成式对抗网络展现了强大的无监督学习能力,可以很好的解决推荐系统中非线性高维数据分布的拟合问题。同时,生成式对抗网络可以灵活的与其他深度学习模型结合,融合其它模型的优势进行改进。因此本文基于生成式对抗网络提出了三种个性化推荐方法,具体内容如下:1.针对矩阵分解方法非线性数据拟合能力较弱的问题,本文提出一种基于生成式对抗网络的深度矩阵分解方法(Deep Matrix Factorization Based on Generative Adversarial Network,DMF-GAN)。具体来说,首先利用用户的评分信息作为输入数据,使用多层神经网络作为DMF-GAN模型的生成器提取用户特征向量,同时定义一个物品特征矩阵,将用户特征向量和物品特征矩阵的内积作为预测评分。然后DMF-GAN模型的判别器基于重构评分对物品进行离散采样,将采样得到的物品作为判别器输入的负样本,同时将真实物品作为判别器输入的正样本。通过生成器和判别器的动态对抗训练,实现生成器对真实数据样本分布的特征学习。最后,通过在两个公开数据集上进行仿真实验,验证DMF-GAN模型的有效性。2.为了将时间信息融合到评分信息中进一步改善推荐性能,本文提出了一种以生成式对抗网络为基础,融合循环神经网络的推荐方法(Recurrent Adversarial Recommender Network with Time Information,T-RAN)。首先,为了避免物品数量过多带来的维度灾难问题,本文采用词嵌入模型对用户评分信息按照时间顺序进行降维处理;然后,本文采用循环神经网络作为T-RAN模型的生成器提取用户评分的深层特征,通过全连接层预测物品评分。最后,本文采用gumbel-softmax采样方法,以贝叶斯个性化排序模型为判别器,采取逐对训练的方式对生成数据和真实数据进行训练。通过在公开数据集上的仿真实验,证明T-RAN模型可以取得很好的效果。3.为了将社交信息融合到评分信息中,同时解决离散物品采样给对抗训练带来的限制问题,本文提出了一种融合用户社交信息的逐向量推荐方法(Trust-aware Generative Adversarial Network with Recurrent Neural Network for Recommender systems,Tag Rec)。首先,将用户评分数据根据用户信任关系编码为用户信任评分矩阵,对每一个用户计算相似度,从中挑选出与给定用户最相似的多个用户作为输入数据;然后,采用长短期记忆网络作为Tag Rec模型的生成器提取输入数据的深层特征,并使用全连接层预测物品评分;最后,将生成的评分向量和真实评分向量分别作为正负样本送到多层感知机中通过随机梯度下降进行训练。通过在两个公开数据集上的实验结果表明,本文提出的方法优于多个基线方法。
其他文献
高频地波雷达探测目标时具有超视距、大范围、全天候、全天时以及低成本等优点,成为海上运动目标大范围探测跟踪的重要手段。相对于传统的大型阵列式高频地波雷达,紧凑型地波雷达占地面积小、发射功率低、架设和维护方便,成为地波雷达系统的一个发展趋势。然而,紧凑型地波雷达因接收阵列孔径减小,发射功率降低,在目标探测时具有定位精度低、检测概率低和虚警率高等特点,给目标跟踪带来了很大挑战。数据关联是目标跟踪算法的关
学位
地震子波和包含低频成分的地震记录在地震资料处理中具有重要意义,全波形反演建立的速度模型的精度受两者准确性的影响。受地下介质吸收衰减的影响,实际资料中的地震子波具有时变特性;由于受到外界条件的限制,检波器接收到的实际地震记录缺少低频成分。目前,时变地震子波难以准确提取和地震记录缺失低频是限制全波形反演广泛应用的主要因素。为了提高速度模型的反演精度,论文从时变地震子波提取方法和地震记录低频补偿方法两个
学位
输油输气管道等承压设备因长期受到腐蚀、高压冲刷会发生壁厚减薄现象,壁厚减薄到一定程度时会发生严重的爆炸和泄露事故。因此,为了保障管道安全运行、避免事故的发生,需要定期检测管道的剩余壁厚。然而,输油输气管道多是铁磁性材料且外有包覆层,常用的无损检测方法难以有效检测其剩余壁厚。脉冲涡流检测技术是一种新兴的无损检测技术,具有穿透能力强、检测速度快等优点,能够用来检测带包覆层铁磁性管道的剩余壁厚。但是,目
学位
<正>膀胱癌是泌尿系肿瘤中最常见的肿瘤之一,根据肿瘤是否侵犯肌层可分为非肌层浸润性膀胱癌(non-muscle invasive bladder cancer, NMIBC)和肌层浸润性膀胱癌(muscle invasive bladder cancer, MIBC)。对于MIBC,新辅助化疗联合根治性膀胱切除术(radical cystectomy, RC)是标准的治疗方案。但RC存在较高风险,
期刊
近年来,随着功能磁共振成像(functional Magnetic Resonance Imaging,fMRI)技术的发展,使得人类可以对人脑的认知活动和功能机制进行深入探索和研究。但是,由于fMRI的成像通常是通过逐层扫描方式获得的,这会造成扫描层之间的时间偏移,从而导致fMRI信号分析的误差。所以,为了解决不同扫描层之间信号不同步的问题,就需对时间层进行矫正(即时间层数据插值)。然而,现有的
学位
该文分析高校学生基础信息数据特点,针对本地数据管理不规范、不可追溯、关联性不足等问题,分别对Tableau Prep Builder和Power BI 2种商业BI工具数据预处理功能进行研究分析,提出基于2种BI工具的数据预处理的实现路径,并对2种数据处理方式进行比较。
期刊
成像雷达卫星的小型化是近年来合成孔径雷达(Synthetic Aperture Radar,SAR)领域的主要发展趋势之一。小卫星SAR的发展有助于降低SAR系统的成本、提高SAR系统的灵活性,更便于实现雷达卫星组网观测。合理地确定不同工作模式下小卫星SAR的天线尺寸、信号带宽、脉冲重复频率、波位位置等系统工作参数是开展小卫星SAR系统软件仿真乃至实际卫星平台研制的重要基础。在SAR系统参数设计的
学位
航天飞机雷达地形测绘任务(Shuttle Radar Topography Mission,SRTM)获得的高程数据在测绘、遥感、自然灾害监测和国防领域发挥重要作用。通常,数字高程模型(Digital Elevation Model,DEM)基于SRTM数据实现,因此,DEM的精度取决于SRTM数据的精度。然而,SRTM高程数据中存在大量数据缺失,导致DEM精度不高。为了提高DEM的精度,需要对S
学位
无人机(Unmanned Aerial Vehicles,UAV)在世界各国工业、农业、服务业和国防等各个领域得到了广泛的应用。为实现无人机自主精确着陆,无人机着陆地标定位问题已经成为研究的热点和难点。本文针对无人机着陆地标定位过程中遇到着陆地标检测有误、定位精度差,以及着陆地标暂时离开视野又重新返回时无法再次定位的问题,提出了基于主动强化学习的无人机着陆地标定位模型,实现了对无人机着陆地标的精确
学位
当前,气象要素的预测多采用数值模式的方法。此类方法预测结果的准确性依赖于构建的模型的可靠性。但是,气象要素复杂多变,影响因素众多,难以全面、有效地对其进行建模。因此,数值模式预测方法的结果存在一定的误差。另外,数值模式的结果形式单一,仅能定量表示预测结果,缺乏直观的表达。生成对抗网络近年来被广泛应用在预测任务并表现突出。生成对抗网络可以学习数据在时间维度上的发展模式,刻画相邻时刻的数据之间的内在联
学位