基于拓扑数据分析技术的造假数据检测

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:YYXINLEI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,数据价值剧增,而数据安全问题却出现了诸多新型特征。首先是数据价值的提高,使得网络攻击者更倾向于篡改数据库中的数据,而不是盗走其中数据争取赎金等。前美国国家安全局局长基斯亚历山大指出,数据篡改将会是“网络空间战争”的最新工具。另外,由于数据信息密度低,使得有效信息定位困难,导致网络攻击者有更多的可能将造假数据隐藏于正常数据之中。除此之外,随着深度学习的发展,最近还出现了一种新型数据篡改问题--针对深度学习算法的对抗样本。对抗样本是在原始样本上施加微小扰动后使得深度学习模型作出错误判断的样本,具有与原始样本差别小、且篡改方式多样的特性。以上问题的存在使得数据真实性的校验变得更为迫切,但中国信息通信研究院在《大数据安全白皮书》中指出,目前还没有严格的数据真实性鉴别和检测于段。鉴于不能直接基于数值进行检测,本文提出利用数据的相互关系来找寻数据在小幅度、多样性篡改下都不变的本质属性。为了找到篡改数据的本质属性,本文提出将拓扑数据分析技术(Topological Data Analysis,简称TDA)引入以上的篡改数据检测。TDA是一项基于拓扑学、计算机科学、统计学和计算几何的数据处理技术。不同于关注数据值本身的常规数据处理方法,拓扑数据分析技术更为关注数据的形状特征,且这些形状特征不随数据的微小扰动而改变。本文将利用复形作为真假数据类别判断的形状载体,复形是原始数据空间的一种近似,它有着同原始数据空间相似的拓扑特征。在实际处理中,我们通过固定系统参数,使不同类别数据具有不同的复形,并在这组固定参数下进行新数据的类别推断,进而得到不被篡改影响的判别结果。本文设计了针对不同数据量的判别方法,在第三章的真假币数据集上,本文通过人工识别拓扑特征的方式,找到了能够有效判断真假数据类别且在不同篡改下保持不变的拓扑特征,并利用这些拓扑特征对造假测试集类别进行了成功推断。在第四章的CIFAR10数据集的子集上,本文通过卷积神经网络实现了大数据量情况下图片复形的自动识别,最终模型成功对该实验涉及的三种对抗样本进行了有效防御,面对不同攻击时,该模型较之对抗训练防御方法还表现出了更为通用的特性。以上实验结果均显示:1)在特定参数下,不同类别数据的复形呈现不同特征;2)数据整体上的篡改不能改变数据的复形;3)TDA的检测结果不受攻击方式的影响。这充分说明了基于TDA的检测方法的有效性和对于不同篡改方式的通用性。
其他文献
新能源、新材料的应用随着工业的发展已逐渐成为热点话题,现代工业对先进复合材料的需要日益增加,复合材料在国防领域的机械结构中所占比重越来越大,在此背景下,针对纤维增强
21世纪以来,我国的公路交通事业迎来飞速发展。在城市繁华地区修建地铁,受制于地面建筑物建筑限界,施工环境恶劣、展线非常困难,节理小净距隧道常常存在于地铁车站建设中。节理小净距隧道因其结构及地质的独特性,其受力情况十分复杂。本文采用数值模拟结合相似模型试验的方法,对节理参数对小净距隧道施工稳定性的影响以及优势节理控制下小净距地铁车站施工力学效应展开了研究。论文主要工作及结论如下:1.基于Hoek-B
随着中国城镇化和机动化的迅猛发展,以交通拥堵为首的城市问题越来越严重。多年来,尽管采取了众多交通治堵对策,我国城市交通拥堵依然呈现愈演愈烈趋势。综合对比各类措施,大力发展公共交通无疑是有效的解决方法之一。然而事实经验表明,仅考虑公共交通,而对公共交通与居民活动空间协同关系缺乏系统性认知,难以充分发挥公共交通运输优势。轨道交通作为公共交通中运输能力较强的一种运输方式,其规划和运营能否契合居民活动特征
相变材料是一类可以通过相态变化储存和释放热量并维持温度不变的材料,对电子设备的热管理有着潜在的应用价值,然而大部分相变材料导热较低,且发生固-液相变时需要外部容器进
动物在受到环境应激压力时会通过母体效应影响子代,而捕食者应激是动物最常见的环境压力之一。本论文在实验室条件下,以布氏田鼠为实验对象,以蒸馏水作为对照组气味、兔气味
一维有机材料纳米结构是高性能传感器的基本构建模块,其具有灵敏度高、响应时间快、功耗低和可携带等优点。然而,由于传统纳米制造技术的高成本、复杂的过程和与有机材料不兼
激光超声表面波技术在材料加工表面缺陷检测中的应用是近年来工业检测技术领域新的研究方向,由于其非接触、高精度、无损伤的检测特点,逐渐成为备受关注的无损检测方法之一。
研究飞机航迹的不确定性对于探究飞机冲突和解决飞机流量问题具有重大意义。通过以航迹点的不确定度为切入点,构建了航迹不确定度模型,并在不确定度模型基础上构建了航迹数据
水轮机调速器是水轮机控制系统的重要设备。抽水蓄能电站的水轮机调节系统是集机、电、液的综合系统,主要通过调速器对水轮机导叶开度的控制来调节机组转速,完成机组开机、并
目前,月球探测任务主要由着陆器和巡视器搭配完成,着陆器不具备行走能力,着陆后只能在原地探测,为克服着陆器局限,提出行走式着陆探测器,在着陆基础上增加行走功能。由于月球