【摘 要】
:
随着互联网技术的迅猛发展,衍生了海量网络数据资源,信息过载问题愈发严重,如何高效获取有用信息成为当今社会的热点关注问题。推荐系统能够有效过滤不相关信息,主动为用户推荐符合其兴趣或需求的内容,缓解了信息过载问题对用户造成的困扰。目前,主流的推荐算法是协同过滤技术,它通过从用户历史行为信息中挖掘用户偏好进行推荐,但评分数据稀疏性和冷启动问题一直制约着协同过滤技术的发展。为解决上述问题,提升推荐准确性,
【基金项目】
:
山西省应用基础研究项目(NO. 201801D221190, 201801D121144);
论文部分内容阅读
随着互联网技术的迅猛发展,衍生了海量网络数据资源,信息过载问题愈发严重,如何高效获取有用信息成为当今社会的热点关注问题。推荐系统能够有效过滤不相关信息,主动为用户推荐符合其兴趣或需求的内容,缓解了信息过载问题对用户造成的困扰。目前,主流的推荐算法是协同过滤技术,它通过从用户历史行为信息中挖掘用户偏好进行推荐,但评分数据稀疏性和冷启动问题一直制约着协同过滤技术的发展。为解决上述问题,提升推荐准确性,本文从两个方面展开了研究,一方面添加评论文本作为辅助信息,通过充分挖掘评论文本来全面刻画用户偏好和商品属性特征,进而提升推荐质量;另一方面将稀疏的评分矩阵看作是不完备信息系统,利用粗糙集在处理在不完备数据上的优势,有效填补缺失评分值,从而改善数据稀疏性。具体的工作体现在三个方面:(1)提出了一种融合双重注意力机制的深度推荐模型(MSDA)。该模型在基于矩阵分解的协同过滤推荐算法中引入了评论文本信息,首先采用卷积神经网络提取评论文本特征,然后为学习有用性评论下用户-商品特征之间的相关性,先后设计了评论级别的注意力机制和共同注意力机制;最后,为全面刻画用户偏好和商品属性特征,将评论潜在特征与矩阵分解得到的评分潜在特征相融合,并利用神经因子分解机建模复杂的用户-商品评分行为,以实现评分预测。实验结果表明,相比于NARRE、HRDR等基准方法,MSDA能有效挖掘评论文本信息提升推荐质量。(2)提出了一种基于粗糙集的不完备混合信息系统填补算法(HIRS)。首先,为避免决策规则冲突,该算法优先填补决策属性缺失值,并将填补后的决策属性作为等价关系来划分信息系统;其次,为提高样本在混合属性下的相似度量准确性,从定性和定量角度对属性进行了细分,并针对不同类型属性定义了相应的距离度量方式;最后,结合k近邻思想填补缺失条件属性值,从而得到完备化的信息系统。实验结果表明,相比于ROUSTIDA、RSHISMIA等基准方法,HIRS的填补性能得到了显著提升。(3)在前两个工作的基础上,结合评论文本和粗糙集理论在缓解数据稀疏性上的优势,提出了一种基于粗糙集的协同过滤推荐模型(MSDA-RS)。该模型首先结合K-means++算法和改进的HIRS-SM算法对原始稀疏的评分矩阵进行缺失值填补,得到稠密的评分矩阵;然后,将稀疏性处理后的稠密评分矩阵输入到第一个工作提出的推荐算法中,与评论文本一起进行深度建模,最终输出评分预测值。实验结果表明,相比于MSDA模型,MSDA-RS的评分预测性能进一步得到了显著提升,充分验证了本文所提方法的有效性。
其他文献
旋翼飞行器室外飞行和执行任务时,受室外风场环境干扰常常无法稳定飞行。本文通过分析室外风场环境对旋翼飞行器影响,研究了风场环境下的旋翼动力学模型、状态估计、飞行器控制等方面内容,改善了室外风环境下的旋翼飞行器抗风扰性能。本文通过3D风环境建模来实现旋翼飞行器的抗风扰实验验证。在进一步验证旋翼飞行器抗风扰性能的同时,使用飞行器实物进行了抗风扰实验;实验结果表明,本文方法可一定程度上解决了旋翼飞行器的风
步态是对于人体而言与血压、血氧、心率同等关键的生理参数,其分析在疾病诊疗、康复预防等多个方面都有极其关键的意义。因此,步态分析系统的研究已经成为备受追捧的研究方向。然而,目前步态分析系统产品设计不够便捷且成本过高,导致进行足底压力检测的设备很难融入到日常生活中。本论文设计的上位机软件针对基于柔性阵列式压力传感器的下位机,可满足步态分析系统进行实时检测的要求,能够跟随人体足底压力变化实时做出反应,实
风力发电是传统能源结构向绿色低碳转型升级的重要途径,然而由于风电机组往往通过变换器柔性并网且控制系统复杂。与同步发电机主导的电力系统相比,大规模风电并网的电力系统具有高阶、非线性、多时间尺度等特点,其稳定性问题也更加复杂。时域仿真是分析电力系统稳定性的重要技术手段。由于开发背景和使用目的不同,不同仿真软件提供的双馈风机模型存在一定差异,而模型差异导致的仿真偏差将对电力系统运行控制与决策的正确性产生
"双碳"发展目标的提出,促进了风能发电、太阳能发电等新能源的跨越式发展,储能技术是新能源产业的核心技术,是迫切需要突破的瓶颈,锂电池作为光伏发电、智能电源等的重要储能容器,具有高能量密度、无记忆效应、环保、维护要求低、以及灵活多样的成组形式等优势,可适应目前对大规模储能的需求。由于锂离子电池的非线性、不一致性和时变特性,很容易导致电池性能衰退,甚至危及生命安全,因此设计安全经济高效的锂电池充电控制
随着科学技术的不断发展,现代机械加工对零件表面质量提出了更高的要求。零件表面粗糙度作为描述零件表面质量的重要参数之一,直接影响零件的使用性能以及零件间的配合性能,其检测方法和检测精度至关重要。目前现有的粗糙度检测方法主要包括目测比较法、接触式检测法以及非接触式检测法。其中目测比较法操作简单,但精度较低。接触式检测法的检测仪器昂贵,需要时刻注意检测的方向,受人为主观影响较大,且对检测人员的技术要求较
前列腺癌症是一种常见的恶性肿瘤,是男性疾病中患病率和致死率非常高的一种疾病,极大危害男性健康。而前列腺特异性抗原(PSA)则是检测前列腺癌症的一种相关肿瘤标志物,也是临床诊断的判断依据。因此,如何能快速、高灵敏和准确地有效识别PSA是临床诊断前列腺癌的关键。电化学免疫分析法是免疫分析技术与电化学检测技术相结合的分析方法。无标记型电化学免疫传感器作为其重要分支,克服了标记型免疫传感器的复杂操作过程及
通过观察眼底视网膜血管系统可以很容易地诊断和追踪许多疾病,因为这些疾病(如糖尿病)会导致视网膜血管的形态学改变。系统性微血管和小血管疾病是糖尿病常见的病理改变,尤其是眼底视网膜血管疾病最为脆弱。视网膜血管还可以帮助精确定位视网膜的许多解剖结构。然而现在眼科医生从眼底图像手动注释视网膜血管系统来检查视网膜血管,这种手动分割是一项繁琐、费力且耗时的任务,需要技能培训和专家知识。此外,它基于经验,容易出
恶性肿瘤(癌症)是严重危害人类生命健康的恶性疾病,已经成为导致人群死亡的主要原因之一。肿瘤标志物的水平高低可以揭示是否患有某种癌症的风险,对癌症的早期诊断、治疗效果监测以及预后判断有重要的参考意义。光电化学(photoelectrochemical,PEC)传感实现了光和电的结合,激发源和探测信号分离,所以背景噪声较低,有望实现很高的灵敏度,广泛应用于生物医学、食品安全、环境监测等领域。本文提出了
作为影响林火发生及火烧强度最重要的因素,森林可燃物的类型提取及其其它特性研究尤为关键。当前针对森林可燃物类型的提取多是基于飞行器拍摄获取的影像数据,数据集庞大,需要从中选出有代表性的数据来有效表征该区域内的可燃物类型。目前有关于森林火灾发生特性的研究主要集中在可燃物的分布、含水率等方面,其中可燃物的含水率的高低是影响森林内传感器布局的重要因素。本文围绕森林可燃物类型提取及森林内传感器布局两方面内容
近年来,随着居住环境日益受重视以及生产生活方式向室内化转变,人们对室内居住环境提出了越来越高的要求。目前,室内建筑材料、装饰材料和有机涂料油漆是室内污染的主要来源,其污染物主要是低分子量(小于100 Da)的挥发性有机化合物(Volatile Organic Compounds,VOCs)(如甲醛、苯及甲苯等有机化合物),这些有机气体具有很强的挥发性和毒性,极易对人体健康造成危害。由于人类的感知系