基于隐私保护的数据建模与算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:sw440
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据在工业生产、科学研究中的广泛应用,原始数据的隐私保护已经成为十分重要的问题。本文针对原始数据的隐私保护问题,构建层次结构,并介绍了只包含分析计算结果的层次结构数据。针对传统回归分析算法,提出了具有层次结构数据的多元线性回归分析算法以及非线性回归分析算法。同时利用实际问题进行算法验证,说明具有层次结构数据的回归分析算法能在有效保证原始数据隐私的前提下,准确计算各部分的偏回归系数,为大数据的分析处理提供一种有益的尝试。本文的主要工作如下:(1)基于层次结构数据,本文提出了多元线性回归分析的偏回归系数计算方法。该方法在传统线性回归计算方法的基础上通过计算下层中每个部分的偏回归系数及上下层之间的层次结构矩阵,来计算上层的总体偏回归系数。利用统计年鉴数据以及随机数据从实际应用中证明了具有层次结构数据的多元线性回归分析算法与传统多元线性回归模型在计算偏回归系数时具有等效性,且对于偏回归系数能分区计算,提高了数据处理的效率。同时,从数据实验中可得利用层次结构数据可以避免原始数据在算法中参与传输、计算,有效地解决了原始数据的隐私保护问题。(2)针对更为复杂的非线性模型,在具有层次结构数据的多元线性回归分析算法基础上,提出了一类可线性化的非线性回归分析算法。并以柯布-道格拉斯生产函数的计算方法为例,给出了多元非线性回归分析中基于线性化方法的偏回归系数的求解方法,并利用层次结构中局部模型与整体模型之间的关系构建、计算模型各部分的偏回归系数。以统计年鉴数据进行验证,可得基于层次结构模型的结果与基于原始数据计算的结果仅存在精度误差。层次结构数据的使用有效避免了可线性化的非线性回归分析算法在计算多个部分偏回归系数时,由于原始数据参与传递导致的潜在数据泄露的情况。(3)为了满足隐私数据所构建的模型达到显著性指标,实现具有层次结构数据的多元回归分析中各层偏回归系数达到显著的目的,本文研究了底层回归算法的显著性。由于上层模型中无原始数据参与,因此底层模型的显著性将影响上层模型的显著性。因此要求底层模型构建时能克服由于大数据导致的I类错误增加的问题,本文利用基于FWER的多重假设检验,对大数据中的较易获得且具有实际意义的基因数据进行实例分析,得到结果表明多重假设检验能有效避免I类错误的出现。由此说明在层次结构的底层算法求解时进行基于大数据的多重假设检验显得尤为重要。
其他文献
体表慢性溃疡发病时间长,迁延不愈,给日常护理和经济上带来沉重负担,严重时可导致截肢,影响患者生活质量和健康。中医外治法在针对肢体慢性溃疡的治疗上有独特优势,了解中医
Developing agricultural logistics is important to farm products circulation and it is helpful to solve the problems about agriculture,rural areas and peasantry
在互联网新媒体的冲击之下,电视行业呈现下滑趋势。在中央级频道、卫视频道及城市频道的双重夹击下,恒者恒强,地面频道面临的生存压力加剧,地面频道发展存在何种现状?在电视
悠悠万古情──谈杜甫赠李白诗篇的友谊金启华李(白)杜(甫)诗篇,光耀中天。李杜友情,垂统百世,都是值得我们称述的。李白杜甫年岁不同,李白先杜甫十一年而生,杜甫后李白八岁而卒,李白当
期刊
2012年12月上旬,有关河南"桥坚强"的舆论在网络上热闹非凡。这是由图像误读造成的网络事件。究其原因,与网络图像传播的双刃剑效应,网民头脑中预先存在的"图式"以及情绪化有
文章主要研究了低压ESD保护栅型沟槽VDMOSFET的设计制造方法。首先简要分析了沟槽VDMOSFET的结构、工作原理以及ESD保护结构的理论实现。基于20V N沟道设计的主要参数指标,给
国外对隔震结构竖向地震反应的观测结果和对隔震结构竖向地震作用计算的规定,都与我国抗震规范有较大差别。本文通过反应谱和时程分析,讨论了多层隔震结构的竖向地震作用取值
<正>目前无人机产业正进入高速发展的阶段,对喜爱摄影的朋友们来说,无疑是可以站在"上帝的视角"来俯瞰世界。其中以大疆为代表的无人机品牌商,受到用户们的广泛追捧。2015年2
“洋猪”是爱好者对荷兰等国家进口而来的朱顶红的昵称,其特点是一年可数次开花,花朵硕大,花形有重瓣、单瓣、蝶瓣等变化,花色也极为丰富,有红、褐、紫、白、粉、绿以及复色
近年来,焦化行业对设备的安全等级要求不断提高。特别自动化与生产工艺相结合,其作用尤为重要,它犹如整个工厂的心脏,一旦出现故障,将会带来无法估量的损失。控制系统作为设