联邦学习中的数据安全和隐私保护方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:renyuh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来人工智能技术,尤其是深度学习取得了重大突破,被广泛应用于金融、医疗、自动驾驶、工业制造等领域。大数据作为人工智能技术发展的关键驱动力,其数据源正从大型数据中心转移到越来越多的终端设备上,然而终端设备所有者出于隐私保护的需求,可能不愿将带有敏感信息的本地数据分享给他人,从而带来了“数据孤岛”的问题。传统的集中式机器学习已经无法解决此类问题,联邦学习(Federated Learning,FL)是一种适用于多源数据训练的分布式机器学习框架,其中的终端节点基于本地数据训练模型,并将模型参数上传到服务器来聚合生成全局模型。由于无需分享本地数据,联邦学习保护了终端节点的隐私。然而联邦学习中节点众多,管理复杂,节点易受到攻击者的入侵,进而威胁全局模型,节点的安全问题成为阻碍联邦学习发展的关键问题之一。而且,尽管联邦学习不需要分享本地数据,但仍需要交换模型参数,半诚实(诚实但好奇)的服务器和参与者可以从中推测出他人信息,造成隐私泄露。另外,半诚实的服务器还可以将参与者身份与模型参数链接起来,这也将造成隐私泄露。现有的方案基于模型层次的异常检测以及各种隐私保护技术,存在效率不高、开销大、以及影响模型性能等不足。为了解决这些问题,本文提出了一种基于改进k-prototypes算法的异常检测方案以及一种支持匿名和隐私保护的联邦学习方案。本文首先提出一种基于改进k-prototypes算法的异常检测方案,用于联邦学习中的恶意节点识别。该方案基于联邦学习节点行为数据的特点,提出了一种改进的k-prototypes算法,其重新定义了损失函数,在统一衡量数值属性和分类属性的相似度的同时,考虑到不同属性的重要性,为每个属性分配了一个权重,因此更适用于联邦学习。此外,该方案给出了计算权重的方法,其采用基于信息熵的度量方法,对簇内的相似性和簇间的差异性进行度量,从而将属性的重要性量化,进而计算出权重。该方案还提出了一种基于上述改进k-prototypes算法的异常检测模型,对联邦学习异常节点进行检测。本文又提出一种支持匿名和隐私保护的联邦学习方案,用于防止参数及参与者身份造成的隐私泄露。该方案提出了一种分享更少参数的模型训练方法,每次迭代时,参与者选择部分参数下载以及部分梯度上传,在几乎不影响模型准确率的基础上,通过减少参数共享减少了隐私泄露。此外,该方案在联邦学习服务器和参与者之间引入一个代理服务器,实现了参与者的身份匿名,减轻了联邦学习服务器的通信开销,同时采用非对称加密方案,来防止模型被代理服务器窃取。该方案还采用差分隐私技术,在上传的梯度上添加高斯噪声,提供了更严格的隐私保护,同时平衡了模型的性能和隐私。最后本文结合理论分析和仿真实验,通过与现有方案的对比,对所提的两个方案的安全性和性能进行了分析,证明了所提方案的是安全高效的。
其他文献
随着4G、5G技术深入生活,MIMO-OFDM技术得到广泛应用,使得无线传输速率极大提高,下行峰值速率从3G时代不到10Mbps提高到5G的1Gbps。MIMOOFDM技术为人们生活带来便捷的同时,也为无线物理层安全的研究提供了新的平台。基于信道特征的无线物理层密钥协商是无线物理层安全研究中的一个重要方向,能够在满足信息论安全的条件下完成密钥共享。如何利用MIMO-OFDM技术多天线、多载波的信道
学位
随着机器学习技术的成熟与发展,大数据与机器学习结合下的数据挖掘变得更加普及,从电商行业到金融服务业,从科学研究到百姓生活,从宏观建模到微观分析都有着重要的应用。伴随着5G技术的全面推广,结合物联网等相关产业,机器学习在未来的智慧生活中的应用会是无处不在的。支持向量机作为一种分类器被广泛应用于机器学习、模式识别和数据挖掘等领域,其用统计学习理论从数学上解释了机器学习的核心问题,奠定了有限样本情况下的
学位
自从2013年第一款安卓勒索软件诞生以来,其发展和传播速度迅猛,每年都有大量的安卓设备感染勒索软件。这些安卓勒索软件经常伪装成具有迷惑性或者诱惑性的应用,通过论坛、邮件或者仿冒的应用商店进行传播和扩散。用户设备一旦被感染,勒索软件便会锁住设备屏幕或者加密设备中的文件,并以解锁设备或解密文件为条件向用户实施勒索,给用户带来了极大的安全威胁。为了更好的应对安卓勒索软件的攻击,本文提出了一种基于代码改写
学位
随着集成电路(Integrated Circuit,IC)市场全球化程度与日俱增,越来越多的IC设计者选择使用第三方IC供应商提供的服务完成产品设计。在这一全球化背景下,某些第三方IC供应商是不可靠的,他们可能会在其产品中植入硬件木马(Hardware Trojan,HT),从而导致产品损坏或者泄露机密信息等。特别是,这一事实可能给一些重要领域,例如航空航天、移动卫星、证券交易、国防科技等的设施带
学位
证券投资基金,特别是开放式股票型基金作为中国资本市场的重要载体,其投资行为和业绩表现对资本市场的稳定发展影响巨大。随着基金规模和数量的不断扩大,基金投资风格趋同,在股票市场呈现出羊群行为特征。本文将围绕基金羊群行为这一问题,探讨其存在性及其与基金业绩之间的关系。首先,基于对羊群行为和基金业绩等相关理论的梳理,综合考虑基金经理投资决策时面临的薪酬激励与解职风险,以及这两种激励相对强度在不同市场状态下
学位
近年来,环境污染、资源匮乏等问题日渐严重,发展生态文明城市已成为我国建设的重中之重。目前,市场上已有大量“回收”及“二手”平台出现在消费者视野,如咸鱼、转转等,美国的Apple公司早在2015年3月就开始在中国施行“Trade in换购计划”,我国的小米、华为等公司也通过与第三方回收平台合作的方式,对市场上淘汰下来的电子产品进行回收。再制造企业通过回收市场上淘汰的废旧电子产品,进行拆解、检查、清洗
学位
近些年来,车联网作为智能交通系统的重要架构基础,在车载导航、车载娱乐、车辆数据统计与分析等方面发挥了巨大作用,车联网的发展也直接影响着智能交通系统的研究方向,其中数据传输安全作为车联网中的重要部分受到研究人员持续的关注。尽管研究人员针对车联网环境提出了相关的数据隐私保护方案,但由于车联网中车辆具有高速移动性,并且其自身计算、存储及通信能力有限,使得现有方案无法完全满足车联网环境下的需求。首先,已有
学位
无人机蜂群通过传感器融合、云资源虚拟化等技术整合群体资源,完成复杂多样的任务。大规模无人机蜂群在复杂网络环境下具有群集可信和容错需求。由于重部署困难和诊断实时性要求,无人机蜂群需要实现对故障或非完整性节点的高效溯源。针对以上需求,本文从高效群集可信证明和非完整节点溯源方面开展研究,具体研究内容如下:(1)针对传统远程可信证明架构在蜂群场景下存在的验证效率低且无法准确溯源的问题,本文提出一种基于边缘
学位
随着通信技术的不断发展,物联网得到了广泛的接受和普及。从可穿戴设备、智能家居到智能汽车,这些设备不断地收集、处理和共享数据,给人们的生活带来便利的同时,也给个人隐私带来极大的风险和挑战。物联网设备中通常包含大量的敏感数据,如果不对这些数据提供可靠的保护,一旦泄露会给用户带来巨大的损失。因此,研究物联网中访问控制机制,防止未经授权的访问,成为了物联网安全和隐私保护的重要研究内容之一。然而传统的访问控
学位
进入21世纪以来,互联网与无线通信技术的快速发展让人类迈入了万物互联的新时代。由于无线射频识别(RFID)技术通过非接触的方式就能达到识别物体的目的,所以成为了物联网(Io T)的重要组成部分。近几年RFID系统开始逐渐被应用于对数据安全十分敏感的资产管理以及医疗保健等行业,因此提高RFID系统的安全性是亟待解决的问题。由于RFID系统中标签的计算资源有限,因此一些发展成熟但运算复杂的安全协议无法
学位