【摘 要】
:
数据挖掘能够发现数据中的潜在规则模式,为辅助决策提供支撑。聚类是数据挖掘的重要基础功能,聚类过程对业务数据的访问不可避免地带来隐私泄露问题。随着人们对个人隐私的日益重视,如何在保护数据隐私的同时实现聚类成为亟待解决的问题。差分隐私是实现隐私保护的一种有效技术,近年来得到了研究者的持续关注。针对现有基于差分隐私的聚类方法在隐私安全和聚类质量方面存在的不足,提出基于差分隐私的距离矩阵扰动方法,以及基于
论文部分内容阅读
数据挖掘能够发现数据中的潜在规则模式,为辅助决策提供支撑。聚类是数据挖掘的重要基础功能,聚类过程对业务数据的访问不可避免地带来隐私泄露问题。随着人们对个人隐私的日益重视,如何在保护数据隐私的同时实现聚类成为亟待解决的问题。差分隐私是实现隐私保护的一种有效技术,近年来得到了研究者的持续关注。针对现有基于差分隐私的聚类方法在隐私安全和聚类质量方面存在的不足,提出基于差分隐私的距离矩阵扰动方法,以及基于扰动后矩阵的KQ-Means聚类方法和MCP-DBSCAN聚类方法,提升聚类结果精度,实现数据隐私安全和聚类可用性的兼顾。论文主要工作如下:(1)针对已有基于差分隐私的k-means聚类方法仅对聚类中心点的计算过程进行加噪扰动,未考虑非中心点在聚类过程中存在的隐私泄露风险问题,提出对原始数据集的数据点间距离进行加噪扰动的LDM加噪方法。通过提取原始数据集的点间距离并添加满足差分约束的噪声,构建噪声矩阵Dist M,实现对点间距离的隐私保护。将噪声矩阵提供给非可信挖掘方,进一步设计基于噪声矩阵的KQ-Means聚类方法,引入k最近邻概念,设计并改进聚簇划分方法,将数据记录分配到距其最近的q个中心点的期望区间内,减小多轮迭代过程中差分噪声累积产生的聚类误差,提升聚类效果。(2)针对已有基于差分隐私的DBSCAN聚类方法,对邻域半径参数eps设置困难,影响隐私保护聚类质量,且聚类采取逐个判定核心点并进行聚簇合并的方法,导致差分噪声严重影响聚类精度问题,提出基于差分隐私的MCP-DBSCAN聚类方法。通过计算点间距离并结合k距离升序曲线图选取合适的邻域半径参数eps,实现聚类精度的提升;通过对加噪后距离矩阵列向量进行排序构建Asc矩阵,将Asc矩阵的第Minpts行向量与邻域半径参数比较进而判定核心点,并以最远距离原则选择从多个核心点出发进行样本点的聚簇归属判定,在兼顾隐私前提下,提升隐私保护密度聚类效率和精度。理论分析与实验结果表明,所提方法能够有效地兼顾数据隐私安全与数据聚类结果的可用性。
其他文献
数据分发服务(DDS)采用以数据为中心的发布/订阅模型,域参与者之间通过发布/订阅主题实现灵活的数据传输,适用于需要进行高效数据分发的分布式系统。由于发布/订阅通信模式的松耦合特性,DDS分布式系统往往存在着未授权的发布/订阅等安全威胁,因此,迫切需要研究访问控制机制来保证系统的安全性。但目前对于DDS访问控制机制的研究往往围绕域参与者等实体资源,进行实体接入的控制,缺少对以主题为单位的数据资源作
本文研究了毫米波大规模多输入多输出系统的波束成形及物理层安全相关技术,具体如下。针对毫米波通信中的波束训练设计了新的分层码本,并基于所设计的码本提出了一种具有有限反馈特性的波束训练算法。与现有分层波束训练算法需要在码本每一层进行反馈来指明发送端的最佳码字不同,本文提出的分层波束训练算法总共只需要两次反馈。该算法将分层波束训练分为两个阶段,每个阶段只需要进行一次反馈即可。在第一阶段,利用所设计的码本
随着综合能源系统中智能量测设备的增多,数据传输过程中的信息安全问题日益严峻。量测数据的篡改和预测值的随机性大大增加了综合能源系统优化调度的难度。氢气设备的接入虽然有利于综合能源系统的新能源消纳,但氢气渗入后的易燃易爆性给综合能源系统运行提出了更高要求。因此,网络攻击和氢气渗入的双重影响给综合能源系统的安全稳定运行带来了一系列困难和挑战。在此背景下,本文首先分析了虚假数据注入攻击对综合能源系统造成的
随着大数据时代来临,数据交易对于数据价值的发挥具有不可替代的重要意义。基于UMA协议的数据交易模式使数据拥有者可以委托授权管理器对自己数据访问进行更丰富的控制,简化数据交易流程,促进数据流通。但基于UMA协议的数据交易模式还存在如下安全问题。首先,基于UMA协议的数据交易模式中的授权管理器并非完全可信,可能作为攻击方或者与攻击方共谋,对数据交易过程中关键数据进行篡改;其次,随着用户购买数据增多,大
随着物联网技术的快速发展,常见的身份认证技术如基于设备MAC地址、安全证书、身份认证指令等方式,都存在易伪冒、易被窃取的弊端。将无线设备的物理层信号特征作为设备射频指纹可以实现设备的分类与识别,这对物联网的物理层安全研究具有重要意义。本文选择LoRa设备作为研究对象,分析了LoRa信号的调制技术及其物理层帧格式,提出了3种指纹特征提取方法,并通过对8个设备进行实验,验证了所提特征的有效性和稳定性。
随着互联网的快速发展,社交媒体大大提高了信息的传播速度和传播范围。然而,社交媒体缺乏监管不受限制的特性也助长了谣言的迅速传播,网络谣言的广泛传播对公众获取真实有效的信息造成了严重的干扰,轻者影响人们对于事实的判断和认知,对个人生活造成负面影响,重者可能会造成严重的社会恐慌,影响社会的和谐稳定发展。因此准确的网络谣言检测,对于阻止谣言的广泛传播,防治网络谣言带来的危害,具有十分重要的研究价值和社会意
随着中国工信部向三大运营商发放5G(The 5th Generation,5G)商用牌照,中国正式进入5G商用元年。社会进入万物互联的时代,无线终端和数据量都呈现指数式增长,对无线通信资源的需求越来越大。大规模分布式多输入多输出(Multiple-Input and Multiple-output,MIMO)技术得到了广泛的研究,它具有显著改善系统资源配置的灵活性和大幅度提升无线资源利用率的优点。
随着移动互联网的发展,越来越多的移动应用程序(APP)在互联网上被开发和发布,各大APP应用商店也应运而生。但是现阶段网络上有诸多的含有风险的APP,它们或传播了不良信息,或侵犯用户隐私。对于网络安全分析人员来说,全面的APP信息有助于甄别APP的风险程度。每当业务人员发现一个风险APP,发现此APP的相似APP也至关重要,因为与风险APP相似的APP有极大可能存在风险。如何从大规模的APP中计算