攻击环境下的推荐鲁棒性研究及其应用

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:dashao1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技与信息化发展致使数据存储量呈“爆炸式”发展,为了解决信息过载问题,推荐系统应运而生。如今,推荐系统被广泛应用到各类电子商务领域及线上购物领域,在提高网站商品转化率、用户选择效率及市场公平性等方面具有重要作用。但是由于推荐系统的脆弱性,部分不法分子在利益驱使下对推荐系统进行有目的的攻击,以使得推荐系统的推荐结果产生偏移。因此,为保障推荐系统的推荐质量与用户对推荐系统的信任度,针对攻击环境下的推荐系统进行鲁棒性研究是一项有意义的研究。近年来,攻击下的推荐系统鲁棒性研究主要有两种主要方法:一种是在面临攻击的情况下提高推荐模型的稳定性能从而提高鲁棒性,另一种是在数据集中对攻击用户/虚假信息进行检测并阻止。本文以深度学习与机器学习等知识为基础,对攻击环境下的推荐系统鲁棒性展开深入研究,分别为:(1)在先令攻击环境下进行攻击检测与预测推荐相结合的方法来提高推荐系统鲁棒性;(2)检测并降低无用信息比重以提高攻击环境下的鲁棒推荐性能;(3)基于协同过滤的在线电影推荐应用系统开发。(1)针对先令攻击(攻击者发布恶意的评级以及用于促销或压制目标产品的评论)存在环境下的推荐系统,本文提出了一种攻击检测与预测推荐相结合的模型RMPD(Rating matrix prediction detection)。首先使用改进SVD(Singular Value Decomposition)方法对评级矩阵的空缺值进行预测填充以降低评分矩阵稀疏性带来的消极影响,使用MLP(Multi layer Perceptron)分别对用户以及项目进行深层特征表示学习,使用LFM(Latent factor model)组件根据用户及项目表示对评级进行预测。在攻击检测部分,本模型采用NDF(Neural detection forest)对攻击用户进行检测分类,将NDF组件的攻击用户检测结果作用于评级预测中以控制攻击用户对评级预测所做的贡献,根据最终项目评分预测最终生成项目评分排名列表以进行推荐。(2)根据对攻击用户的行为研究,向推荐系统中注入无用信息(评分与评论情感不一致的评价信息)以扰乱信息特征的行为被认为是攻击的方式之一。为解决无用信息对推荐系统推荐准确率的影响,本文提出了一种检测并降低无用信息比重的方法,可以有效提高攻击环境下的推荐鲁棒性与推荐准确率。通过情感分析模型Bi LSTM(Bi-Long Short-Term Memory)对评论文本进行情感极性判定后,与所属评级分数进行对比,根据阈值来对情感不一致的评价标记无用信息,并随即删除一定比例的无用评价。在后续的预测推荐模型中,使用CNN(Convolutional Neural Networks)与MLP组件分别对用户与项目的评级、评论信息进行建模学习并获得特征表示,使用注意力机制对无效评论进行权重划分以降低其重要程度,最终评级预测组件将输出预测评级分数实现有效推荐。(3)根据本文研究内容对基于协同过滤的鲁棒在线电影推荐系统展开设计与开发,本系统基于Python+Django+My SQL技术进行实现,通过调用协同过滤算法实现非个性化推荐的热点推荐和基于用户或项目的个性化推荐,通过加入推荐鲁棒算法实现系统在攻击下的鲁棒性。本文将对系统核心功能及界面进行介绍,并通过后台数据库设计介绍与系统测试结果来说明本系统的可行性。
其他文献
智能化转型升级正在成为酒店业发展的新趋势。然而,很多酒店进行智能化转型升级并没有带来所预想的效果,反而面临着诸多的困境。虽然酒店在硬件设施上进行了智能化改造,但酒店的服务流程并未升级、人员服务模式并未转型、组织结构和人员配备未调整、培训内容未优化等,还是沿用了未转型时的模式。要突破智能化转型升级的困境,酒店需要在组织管理和人力资源管理等方面做出相应的调整,如要基于顾客满意的人机协同合作服务设计理念
期刊
The existence of deep learning’s "black box" makes it difficult to understand how the algorithms analyze patterns and make image-level predictions.A representation of the pixels contributing the most
学位
由于环境光线昏暗或者设备自身问题,会导致获取的图像亮度较低,不仅影响人类视觉体验,还会制约以高质量图像为输入的计算机视觉应用性能,如目标检测、人脸识别等。与一般暗光环境下低照度图像增强研究相比,实现在复杂光照环境下低照度图像增强研究,要在考虑平衡不均匀光照问题的同时,还要考虑图像清晰度、噪声干扰等问题,这是具有挑战的。本文将对目前的低照度图像增强方法进行分析,并提出相关的改进方法。本文具体研究内容
学位
在互联网和信息科技高速发展的今天,人们已经能够随时凭借各类社交网络平台和电子商务平台发布自己的观点和想法。这使得互联网中涌现出海量的文本数据,这些评论文本中大都包含着情感信息,分析文本中蕴含的情感并提取出其中有价值的信息对于企业、政府乃至社会都有着重大的研究价值。基于此,文本情感分析成为了最受学者们关注的领域之一。传统的情感分析任务是在文档或句子级别上进行的,通常只能粗糙地表达出一个整体的情感极性
学位
随着影视行业的发展与渲染技术的进步,高质量的作品也大量涌现。画面是检验一部好作品的重要依据,而这些画质背后是各种渲染技术的支撑。渲染就是通过计算机对现实世界进行模拟,再用算法把场景中的模型、材质和灯光绘制成图片或者视频。在绘制一些比较复杂的场景时,由于光线在场景中传播的递归性,一些渲染算法在绘制的过程中会有较大的时间代价或者偏差。存在于现实世界中的云、烟雾、蒸汽等半透明状的物质在图形绘制领域一般被
学位
在许多实际应用的领域中,许多过程都可以用正系统来建模。正系统意味着只要初始状态和输入是正的,则输出和状态变量总是非负的。当正系统具有一定的切换规则并且系统的动力学在不同的时间间隔内被不同的正子系统控制时,该系统被称为切换正系统。切换正系统在网络拥塞控制、信息科学、医学和神经网络等领域都发挥着极其重要的作用,因此,研究切换正系统是非常有益的。但是同样也会遇到挑战,当切换后的正系统遇到脉冲时,系统的状
学位
当前我国汽车保有量大,停车难成为急需破解的民生问题。随着大数据的产生与不断发展,建立智慧停车系统成为解决传统停车问题的有效手段。而县城是我国城镇体系的重要组成部分,县城停车问题又具有一定的独特性,文章立足于县城停车现状,针对县城停车特有问题,以温州市苍南县城新区为例,研究县城智慧停车系统建设方案,因地制宜选取技术手段并配套完善的管理制度与保障体系,缓解县城交通拥堵,提升停车位资源利用率,推进县城数
期刊
癌症亚型的识别对个性化医疗的应用具有重要意义。它致力于使用无监督聚类方法将癌症患者划分为不同的亚型,并为后续的治疗方案提供有价值的参考。近年来,随着测序技术的快速发展,其产生的丰富的多组学数据为在整体水平上发现癌症亚型带来了前所未有的机遇。然而,由于测序技术的限制,组学数据中往往包含大量的噪声。此外,尽管测序成本在不断下降,但仍然难以覆盖大量的样本,这使得目前的组学数据大都呈现出高维小样本特点,并
学位
跨模态由文本生成图像是大数据人工智能领域的重要研究课题,其发展推动了跨视觉和语言的多模态学习和推理的研究进程,是近年来最活跃的研究领域之一,在诸多行业有着广泛应用,如艺术生成、游戏引擎和计算机辅助设计等。根据自然语言描述生成与之语义匹配的图像是一个复杂的计算机视觉和机器学习问题,近年来取得了很大的进展。然而,目前大多数由生成对抗网络辅以语义约束的图像生成网络仅提高了图像的视觉真实性和语义一致性,而
学位
目前的医疗影像任务中,磁共振(Magnetic Resonance,MR)图像的获取存在价格昂贵和耗时长的问题,需要借助技术手段获取多对比度MR图像,如今通过深度学习算法研究磁共振图像的合成以提高诊断效率成为一个炙手可热的话题。随着生成对抗网络(GAN)在近年来的图像处理领域中发挥了重要作用,本文主要将结合生成对抗的方法研究不同对比度磁共振图像的合成。现有的一对一MR图像合成方法中,多数只关注图像
学位