【摘 要】
:
信息时代,互联网行业迅猛发展,大量信息交换给人们带来方便的同时也出现了信息过载现象,导致人们很难快速寻找出自己需要的事物。虽然推荐系统的广泛应用有效缓解了这一难题,但是数据稀疏性、冷启动和可解释性等问题始终限制着推荐系统的发展。本文围绕融合辅助信息缓解传统推荐算法存在的数据稀疏性问题展开研究。针对评论文本信息挖掘不充分、不准确,以及单一信息无法全面精准挖掘用户兴趣偏好等问题,提出相应的解决方案。本
论文部分内容阅读
信息时代,互联网行业迅猛发展,大量信息交换给人们带来方便的同时也出现了信息过载现象,导致人们很难快速寻找出自己需要的事物。虽然推荐系统的广泛应用有效缓解了这一难题,但是数据稀疏性、冷启动和可解释性等问题始终限制着推荐系统的发展。本文围绕融合辅助信息缓解传统推荐算法存在的数据稀疏性问题展开研究。针对评论文本信息挖掘不充分、不准确,以及单一信息无法全面精准挖掘用户兴趣偏好等问题,提出相应的解决方案。本文主要工作如下:(1)为了缓解数据稀疏性问题,本文引入用户-物品评论文本作为辅助信息,构建了融合评分与评论的深度评分预测模型(Deep Model Combining Rating and Review,DMRR)。一方面,针对传统文本特征提取方法忽略上下文关系的问题,结合了CNN与GRU进行文本信息特征提取。另一方面,考虑不同物品评论之间以及不同用户评论之间语义信息的差异性,利用评分数据引入物品可推荐度与用户偏好程度,使评论文本特征有效得到增强。(2)面对交互数据极其稀疏的情况,单一辅助信息可能无法很好地构建用户偏好模型和物品属性模型。因此,本文将评论文本与用户历史行为序列同时引入,构建了多辅助信息融合的深度推荐模型(Deep Model of Multi-auxiliary Information Fusion,MAIF)。首先,对评论文本、用户历史行为序列以及评分矩阵分别建模,获取相应的特征向量。其次,利用线性加权和的方式,对特征进行有效融合。最后,通过推荐算法实现评分预测。在对所提出的模型给出必要的理论分析基础上,本文使用Amazon子数据集和Yelp数据集进行实验验证。理论分析与实验结果均表明,该模型与已有的相关模型相比较,有效地提高了评分预测准确性。
其他文献
高光谱图像(Hyperspectral Image,HSI)是一种由数十个或数百个波段构成的数据立方体,相对于传统的RGB图像或多光谱图像(Multispectral Image,MSI)而言,它包含了丰富的光谱信息,可以更好地反映地物的实际情况。而由于光学成像原理的限制,HSI空间分辨率相对较低,这限制了HSI后续的分析与应用。在这种情况下,融合高空间分辨率(High Resolution,HR
甲基法尼酯(Methylene farnesoate,MF)是存在于甲壳动物体内一种十分重要的内分泌倍半萜类激素,其主要作用包括调控甲壳动物蜕皮、生长发育与繁殖等过程。然而,在甲壳动物中,甲基法尼酯如何运输到靶器官从而发挥作用尚未清晰。本研究以凡纳滨对虾Litopenaeus vannamei为研究对象,通过生物信息学整合凡纳滨对虾基因组与转录组的数据信息,筛选到了11个Juvenile horm
合成孔径雷达(Synthetic Aperture Radar,SAR)以其独有的全天候、全天时成像特点,在军事和民用方面有众多的研究和应用,如:军事测绘、海洋监测、资源勘探等方面。然而,受相干成像机制的影响,SAR图像会带有相干斑噪声,该噪声的存在降低了SAR图像的信噪比,使图像中的目标信息受到遮挡,从而严重地影响了图像质量,模糊了图像中的重要信息,为后续进行SAR图像高水平处理任务带来巨大的挑
孤独症(Autism Spectrum Disorder,ASD)是一种神经系统疾病,常发病于婴幼儿早期,症状包括行为方式刻板和认知方式局限等。目前,主要是医师参考量表对ASD进行诊断,方法主观性强且诊断效率低。因此寻找客观生物学标志物对ASD诊断具有重要意义。本文基于递归图(Recurrence Plot,RP)提取ASD儿童八通道脑电信号(Electroencephalogram,EEG)特征
SDN解耦了数据平面和控制平面,具备网络可灵活配置的优势。SDN网络状态的全局可见性和流量转发规则的运行操作使得任何冲突都可以通过逻辑上集中的控制器远程解决,增强了网络的稳定性。但同时,控制器的集中化及其可见性使得网络更易受到攻击,为恶意攻击创造了更多的机会。DDoS攻击会对SDN网络造成毁灭性打击,这是一个非常严重的问题。论文对此问题,从检测、负载均衡以及攻击溯源三个方面进行研究。所做的工作主要
近年来,脑血管疾病的患病人数急剧上升,特别是脑卒中患者在治疗后普遍存在的不同程度的运动功能障碍,给家庭和社会带来极重的负担。及时而有效的康复治疗能够最大程度地恢复患者运动能力。而对脑卒中患者运动神经系统功能状态进行准确评估是提高康复治疗效果的基础。皮质肌耦合(corticalmuscular coupling,CMC)能够揭示大脑皮层和运动肌肉组织两大系统之间的信息传递和功能联系,可以用于研究神经
药物靶点关系是药物研发过程中不可缺少的信息。因此,药物靶点相互作用相关的研究已经成为药学研究的热点。传统的实验方法验证药物靶点相互作用关系效率很低,需要花费大量的时间和精力,并且费用也十分高昂。这大大制约了药物的研发速度,阻碍了医学技术的进步。随着科学技术的发展,越来越多的专家学者利用计算机技术辅助药物靶点关系的预测,极大地提升了实验效率,缩短了药物研发的周期。现有的药物靶点关系研究中主要存在两大
疲劳表情作为人体的生理和心理机能的外在体现,能够真实反映人们的注意力、知觉、思维、判断、意志、决策和运动能力是否下降。因此,疲劳表情识别在医疗健康检测、疲劳驾驶等领域有着很大的应用潜力。在疲劳表情识别领域中,遮挡条件下的表情识别技术是目前广大研究者的重点研究对象。在遮挡情况下,疲劳表情识别任务时常因难以提取到有效的分类特征信息,导致疲劳状态判断不准确。因此,本文围绕如何提高遮挡条件下的疲劳表情识别
胎儿心电图检测技术是一项检测围产期以及妊娠期胎儿健康情况的重要技术手段,能有效地发现胎儿在母体内正常发育生长中的不良情况,但现实中采集到的胎儿心电图往往受到复杂噪声和母体心电分量的干扰。通过对胎儿心电图进行分析,可以在早期及时诊断胎儿宫内缺血和先天性心脏病等,能有效地降低新生儿各类疾病的发病率和死亡率。从母体腹壁混合信号中稳健地提取胎儿心电信号是有效监测胎儿健康最大的挑战,这主要是由于胎儿心电相对
睡眠呼吸暂停综合征作为一种常见的睡眠疾病,它严重影响人们的睡眠质量和身体健康。近些年来,越来越多的医生和学者逐渐关注到睡眠呼吸暂停综合征。多导睡眠监测仪作为睡眠呼吸暂停综合征的金标准,用它对患者进行整夜检测,根据呼吸信号进行判断疾病,但是这种检测方式会让患者产生严重的不适感且其检测成本昂贵,因此研究出一种简单方便并且易采集的生理信号对于检测睡眠呼吸暂停综合征来说尤为重要。心电图机和它的便携式设备在