针对联邦学习的多后门攻击算法研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yuerenqiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能逐渐走向大规模和分布式,联邦学习作为一种隐私保护的分布式模型训练技术逐渐成为研究人员的关注重点。联邦学习可以在多方数据拥有者不进行数据共享的情况下,共同学习得到一个全局最优的机器学习模型。但联邦学习框架分布式特性也带来了潜在恶意参与者。本意为避免第三方进行隐私窥探的安全聚合协议,却使得针对联邦学习算法的模型攻击变得更加隐蔽且难以检测。基于数据投毒的后门攻击是一种隐蔽性极高的模型攻击方法,其目标是将隐藏后门嵌入到深度学习模型中,使得后门模型在良性样本上表现良好,而隐藏后门在攻击者定义的触发器激活下,预测结果可以发生定向恶意更改。联邦学习中的恶意节点对数据拥有完全的控制权,这为后门攻击进行数据投毒提供了天然攻击环境。联邦学习中的后门攻击,可以通过恶意参与者的投毒传递到整个联邦学习环境,危害性极强。本文深入研究了联邦学习系统中的多后门攻击问题,提出了一种触发器生成技术,为后门攻击引入了目标特征;同时,提出了一种针对联邦学习的多后门攻击方案,有效破坏了模型的鲁棒性。主要研究工作如下:1.本文提出了一种基于生成对抗网络的触发器生成方案,可以在联邦学习训练之前完成触发器生成,保证后门攻击在联邦学习中的实施。通过特征提取网络提取目标标签的数据特征,并将其作为生成对抗网络的输入条件,增强了后门模型对目标标签的学习能力。通过设计GAN损失函数形式,使得生成的低可见性触发器可以平滑注入良性数据。实验结果表明,在可见性得分上,本文触发器生成方案优于先前的触发器方案。实验还证明了本文触发器触发的后门攻击效果显著且不会被用户察觉。此外,本文触发器后门攻击效果与对抗攻击不同,并不会受到模型差异影响。2.本文研究了基于多目标优化的多后门攻击方案,可以在单次后门训练中兼顾不同的后门攻击任务,同时保证主任务的识别精度。多后门攻击考虑到了需要多种触发器共同定位目标的情况,还大大增加了后门攻击的灵活度和闪避性,使得后门攻击的危害性进一步加强。本文通过理论分析解释了所提多后门攻击的攻击有效性。本文在联邦学习场景中,将上述两种技术结合提出单触发器触发和多触发器叠加触发两种多后门攻击方案。实验表明,本文所提两种多后门攻击,在攻击成功率和模型进度下降两项指标上均取得了优秀的攻击效果。进一步地,两种多后门攻击方案可以轻松越过Neural Cleanse防御方法的防御。为了进一步探索多后门攻击的特性,本文还通过组织联邦学习环境中的多个攻击者,进行分布式多后门攻击,并与单个攻击者的多后门攻击方法进行了对比。
其他文献
日志作为记录系统实时运行状态和程序执行状况的数据,既是软件开发人员和运维人员监测系统运行状态重要资源,也是实现系统异常检测的绝佳数据源之一。当下基于深度学习的日志异常检测已经成为自动化系统异常检测研究领域的重点关注内容之一,但仍存在以下难题亟需解决:日志文本数据其中所包含的信息和特征很难直接作为输入被深度学习模型所学习,需要构建特定的日志解析方法;传统的日志异常检测模型仅适合特定系统,忽略了日志所
学位
随着信息技术的不断普及,实时监控技术在物联网中得到了广泛的应用。重要公共场所均安装了摄像头监控设备,这些场所更关注物体移动变化而非固定的场景画面。由于摄像头经常处于复杂干扰环境中,视频流的实时传输效果无法得到保障。当传输环境较差时,现有的自适应视频压缩方法通常会随机降低某些帧的分辨率,以保障视频的播放流畅。若被降分辨率的帧是含有移动物体的关键帧,则不能满足视频监控获取关键信息的要求。因此,为了提高
学位
越来越多的企业利用机器学习中的分类技术来分析各种商业数据,从中提取有价值的信息。这些商业数据中的大部分数据是正常类数据,少部分数据是异常类数据。大部分的商业数据都是不平衡的。因此,不平衡数据分类问题一直以来都是机器学习领域的一项重要研究课题。目前为止,不平衡数据分类方法主要分为数据层和算法层两个方面。本文分别基于数据层的数据合成思想和算法层的集成学习思想,提出了两种用于结构化数据不平衡处理的方法。
学位
研究背景:慢性阻塞性肺疾病作为一种常见的呼吸系统疾病,是一种可预防和治疗的疾病。近年来慢阻肺患病率逐渐上升,患者生活质量低、社会经济负担较重,成为全球关注的公共卫生问题。目前研究表明,COPD的发病机制主要有炎症反应、蛋白酶/抗蛋白酶失衡、氧化/抗氧化失衡等。COPD的特点是炎症因子、多种蛋白酶的水平提高,NF-κ B诱导多种炎性细胞分泌如集落刺激因子、白介素-6、肿瘤坏死因子-α、粘附分子等多种
学位
背景作为人类常见的消化系统疾病之一,是一种由多种因素引起,病因尚不明确的慢性非特异性炎症性肠病,目前导致溃疡性结肠炎的因素包括:肠道菌群失调、适应性免疫失常、环境和遗传等。溃疡性结肠炎反复迁延不愈在影响患者身体健康以及生活质量的同时,由于其反复发作导致溃疡性结肠炎相关性结直肠癌占溃疡性结肠炎患者死亡的9%-11%,因此溃疡性结肠炎被世界卫生组织列为现代难治病之一。人体肠道菌群的数量、组成和分布与肠
学位
随着信息化技术的日益更替,针对信息系统的恶意攻击愈来愈频繁。恶意攻击的对象已不仅局限于个人用户,攻击者的攻击目标逐渐深入到企业、政府等关键组织和机构,对金融、交通、通信、医疗等重要行业都造成大量损失,严重危害社会的稳定。为阻止攻击事件的发生,针对恶意攻击的测试和研究成为网络安全专业人员的关注重点。为更好的测试和研究攻击,采集恶意攻击产生的数据信息是非常有效的手段和必要的基础。然而,现存的数据采集系
学位
近年来,人工智能飞速发展,正在以空前的广度和深度推动社会进步。作为当前人工智能技术的重要分支之一,深度神经网络被广泛应用于图像分类、语音识别、自然语言处理等领域,发挥了不可替代的作用。训练深度神经网络需要大量的训练数据、强大的计算能力、相关的专业知识和专业经验。因此,一个训练好的高性能深度神经网络具有很高的价值,通常被视作模型所有者的知识产权。模型所有者可以基于自己拥有的模型对外提供付费服务,也可
学位
传统的集中式联邦学习系统依赖一个中央服务器来协调全局模型的训练过程。然而,集中式联邦学习的前提是所有客户端信任一个中央机构,一旦中央服务器出现单点故障,将导致系统崩溃和全局模型训练的失败。此外,系统中通常涉及大量的客户端,每个客户端与中央服务器进行直接通信和多轮次交互,这需要负担巨大的通信成本。因此,集中式联邦学习系统可能会出现单点故障和通信开销大的问题。事实上,在许多实际场景中的网络通常是点对点
学位
近年来,随着计算机计算能力的显著提升和数据量的大幅度增长,以深度神经网络模型为基础的深度学习算法快速发展,广泛应用于计算机视觉、自然语言处理、智能控制等诸多领域,甚至引发了新一轮的工业革命。然而,随着对深度学习技术研究的深入,人们发现其很容易受到对抗样本的欺骗。所谓对抗样本,是指攻击者人为地在原本能够被正确推理的数据中,添加微小的甚至人类难以察觉的对抗性噪声,从而生成的恶意样本,它可以误导目标模型
学位
联邦学习(Federated Learning)能够使用来自大规模节点的本地数据集进行分布式模型训练,由于联邦学习在解决“数据孤岛”问题和保护数据隐私方面具有巨大优势,近年来迅速成为安全机器学习领域的研究热点。联邦学习的成功离不开分布式节点的积极参与,而长期机制的目的在于增加系统中用户节点的粘性,确保用户能够长期参与到系统中来,因此针对联邦学习系统中长期机制的研究与设计必不可少。在本文中,我们针对
学位