隐私保护的分布式数据挖掘系统

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:rockwjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来和计算机网络技术的飞速发展,在分布式环境下,如何进行有效的数据挖掘成为信息科学研究领域一个新的课题。关联规则是数据挖掘研究领域的一个重要问题,目前所面临的最大挑战是计算效率和内存问题,解决的途径之一是开发高效的分布式算法。因此本文主要从分布式的角度出发,针对关联规则的理论和方法进行了深入研究。 本论文主要研究以下三个问题 ●数据量很大,不能一次载入内存。 ●数据的安全性和隐私性。很多时候客户只愿意提供从数据中学习的结果而不是数据本身的细节。 ●数据是分布式存放的。 分布式数据挖掘的研究尚处于起步阶段,许多问题还有待于解决。其中最重要的两个问题是分布式数据挖掘系统的结构和挖掘算法。 本论文在这两个方面进行了一些有意义的探索: 先提出了一种分布式数据挖掘系统模型,用来实现大容量的数据在分布式存放情况下的数据挖掘。因为该系统模型只传送数据挖掘的中间结果,所以大大减少了网络的数据传输量,并加强了数据的安全和保密性。同时由于该系统模型采用CORBA接口编程技术,使得整个系统模型不依赖于编程语言、计算平台等。 然后在这个原型系统模型的基础上,对分布式数据挖掘算法提出了一些新的思想和好的实现方法。本论文中,主要考虑关联规则挖掘算法,从两个不同的角度从理论上探讨了分布式或并行数据挖掘:(a)由规则到规则:先由各个独立的站点生成各自的关联规则,再在这些关联规则的基础上生成总的关联规则:(b)由数据到规则:由各个独立的站点交换各自的中间结果来生成总的关联规则。然后针对第二种方法,结合安全向量计算协议,提出了一种新的保持隐私的分布式关联规则挖掘算法。 最后,本论文给出了结论,并概述了今后进一步研究的方向。
其他文献
计算机技术的发展,加速了社会的信息化。同时,计算机技术的应用也渗透到了各个领域,消防领域也不例外。 计算机技术在消防领域的应用是多方面的,本论文以现大连市的消防业务为
燃料管理是火电厂生产的核心环节,合理的燃料计划对电厂的安全生产和经济运行起着至关重要的作用,然而目前大部分燃料管理信息系统还停留在事务处理的阶段,难以为燃料计划的制定提供有效的决策支持。 针对以上事实,论文在分析电厂燃料计划客观实际的基础上,结合线性规划、整数规划、目标规划、遗传算法等方法建立了燃料计划的优化模型,在保证电厂正常生产的前提下尽可能地降低了与燃料有关的各项费用,为解决燃料计划中
由于更能体现人类的社会智能、具有更大的灵活性和适应性,多主体系统(MAS)可以广泛应用于构建开放、动态的软件系统,是人工智能研究的核心领域之一。选择适当的形式化工具描述
医学图像三维重建及其可视化技术是一种运用计算机图形学、图像处理、计算机视觉以及人机交互技术,将医学图像数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、
随着移动通信技术和互联网技术的迅速发展,人们迫切需要能在任何时候、任何地点访问所需数据。鉴于移动计算环境的复杂多变的因素,传统的分布式数据库不能有效地支持移动应用的
统计软件属于一类重要的应用软件,开发国产的统计计算软件对于推动科学计算的普及、推动经济决策的科学化、推动民族软件产业的发展,都有重要的意义。 本文在童恒庆教授的统
气体水合物法作为一种新兴的海水淡化技术正在引起人们的广泛关注。海水淡化处理过程中工艺参数最佳组合的确定问题,成为影响其处理效果的关键因素之一。传统的实验方法不仅成
碎片拼合就是要把大量的不规则的碎片重新拼接成初始的完整模型。这一问题在飞行器的失事分析、考古、古生物学以及壁画保存等方面具有广泛的应用。要从成千上万的碎片中找到
随着人类社会步入信息社会,人类面临“信息爆炸”、“混沌信息空间”和“数据过剩”带来的巨大压力。人们迫切需要一种智能代理完成多种耗时、复杂的工作。针对上述问题,本课题
视频运动目标分割是计算机视觉领域的关键技术,是运动目标跟踪、识别和分析等的基础,具有重要的研究意义和应用价值。由于背景减除法、光流法、帧间差分法这些运动目标分割的常