隐私保护线性回归方案与应用

来源 :计算机科学 | 被引量 : 0次 | 上传用户:a596298067
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
线性回归是一种基础且应用广泛的机器学习算法,线性回归模型的训练通常依赖于大量的数据,而现实中数据集一般由不同的用户持有且包含用户的隐私信息,当多个用户想要集中大量的数据训练效果更好的模型时,会不可避免地涉及用户的隐私问题。同态加密作为一种隐私保护技术,可以有效解决计算中的隐私泄露问题。针对数据集水平分布在两个用户上的场景,结合CKKS同态加密技术,设计了一种新的基于混合迭代方法的隐私保护线性回归方案。该方案分为两个阶段:第一阶段实现了密文域上的随机梯度下降算法;第二阶段设计了一种安全两方快速下降协议,该协议的核心思想基于雅可比迭代算法,可以有效弥补实际应用中梯度下降法收敛效果不佳的缺陷,加速了模型的收敛,从而降低了方案的计算代价和通信损耗,在高效训练线性回归模型的同时保护了两个用户的数据隐私。分析了方案的效率、通信损耗以及安全性,利用C++实现了该方案并将其应用于真实数据集。大量实验结果表明,该方案可以高效地解决特征规模较大的线性回归问题,可决系数的相对误差小于0.001,这表明得到的隐私保护线性回归模型在真实数据集上的应用效果接近于直接在明文数据上求得的模型,可以满足特定场景下的实际应用需求。
其他文献
煤炭在中国的能源供应中起着重要的作用,煤矸石是从煤矿开采和加工过程中排放的固体垃圾。煤矸石中的SiO2、Al2O3成分含量可占其总化学成分50%以上,因此可以作为国内外研究学者用以合成沸石的原材料。除此之外,合成的沸石可以被用作吸附剂处理废水中染料成分,以达到充分利用煤炭资源治理水环境问题的目的。本研究以内蒙古地区的煤矸石为原料,用碱熔-水热法成功合成出NaA沸石,以X射线衍射分析(XRD)、扫描
利用山西省临汾城市站2013—2018年CO2、CH4摩尔分数及气温、相对湿度、风速风向观测资料,以及欧洲中期天气预报中心ERA-5 PBL(planet boundary layer)再分析资料和美国国家环境预报中心GDAS(global data assimilation system)再分析资料,分析高碳排放城市临汾两种温室气体浓度的时空分布特征及影响因素。结果表明:临汾市年平均CO2和CH
目的 探讨长波紫外线(ultravioletA,UVA)致人皮肤成纤维细胞凋亡过程中胞内活性氧簇(reactiveoxygenspecies,ROS)及细胞自噬的调控作用。方法取生长良好的人皮肤成纤维细胞,按照不同处理方式分组并给予处理后,以UVA照射后观察成纤维细胞生长状态,MTT法检测成纤维细胞增殖活性,流式细胞技术检测成纤维细胞凋亡以及胞内ROS水平,Westernblot检测自噬相关蛋白P
学位
学位
表面增强拉曼光谱(SERS)技术具有灵敏性高、选择性好、水分干扰小、前处理简单、快速、无损检测等优点,现已成功运用于食品安全、生命科学、法庭科学、环境及化工等多个领域。且随着便携式拉曼光谱仪的发展,SERS技术实现了对食品非法添加物、滥用食品添加剂和农药兽药残留的现场快速检测。因此,相较于其他灵敏度高的定性和定量分析方法,SERS法在农残检测中的应用潜力巨大。文章介绍SERS法测定农残的原理及近3
基于五台山站2017年1月~2020年12月的大气CO2连续观测资料,采用平均移动过滤法(MAF)和后向轨迹分析方法,对五台山大气CO2本底浓度及源汇特征进行研究.结果表明:五台山大气CO2浓度受到区域或局地源汇的影响,筛分后的CO2本底小时浓度振幅为44.9×10-6,小于未经筛分的CO2浓度振幅94.7×10-6.2017~2020年CO2本底浓度呈逐年上升趋势,但增幅放缓;抬升浓度占比有所下
学位
内质网是蛋白折叠的重要场所,对细胞稳态的变化十分敏感。蛋白折叠的环境发生变化会导致未折叠或错误折叠蛋白的聚集并影响细胞内信号通路,如Ca2+,氧化还原,炎症,凋亡等。当内质网发生应激,未折叠蛋白反应(unfolded protein response, UPR)通过一系列适应性反应来缓解蛋白错误折叠并恢复细胞稳态,如果不能重塑稳态,则会诱导凋亡。活性氧(reactive oxygen specie
学位