基于U-AHC的不确定co-location模式挖掘研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:maidouqaz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不确定数据在一些重要应用领域中是固有存在的,如传感器网络和移动物体追踪。随着数据采集和处理技术的进步,人们对数据的不确定性的认识也逐步深入。基于不确定数据进行数据挖掘和知识发现引起了很多学者的兴趣,这种更加符合客观实际的理论方法越来越成为近年来研究的热点。但是在不确定数据上使用传统的数据挖掘方法会使挖掘结果出现严重偏差,甚至是错误的,根本不能满足用户的需求。所以如何快速、方便、有效地分析不确定数据库中大量的不确定数据以发现潜在的、有价值的和人们感兴趣的信息变得越来越重要。空间co-location模式挖掘寻找给定空间对象之间的关联关系,是空间数据挖掘的重要研究方面。与在确定数据上挖掘co-location模式不同,不确定数据上的co-location模式将概率密度函数引入到数据模型中来描述不确定对象位置的不确定性,并用期望距离来衡量两个不确定对象的距离。本文首先分析和总结了不确定数据挖掘的方法,介绍当前不确定数据在聚类、分类、关联规则挖掘和异常点检测等方面的研究成果。然后介绍了co-location模式的相关概念,详细说明co-location模式挖掘的过程,并介绍了经典join-based算法和order-clique-based算法。其次在总结co-location模式挖掘方法的基础上,提出一种基于凝聚层次聚类(AHC)算法的co-location模式挖掘算法,这个算法是在聚类结果的基础上通过计算满足粗邻近关系的簇来把一部分大于距离阈值的实例进行剪枝,实验证明这种方法是正确的而且是高效的。最后是把这种算法的思想扩展到不确定数据中去,即把凝聚层次聚类算法扩展到不确定的凝聚层次聚类算法(U-AHC),并引入期望平方距离这种简化思想使计算两个不确定对象的距离时更加省时高效。再在聚类结果的基础上进一步挖掘不确定数据的co-location模式。论文最后是总结部分,在对本文主要内容作简要回顾的同时,还对未来的研究做出展望。
其他文献
过去我国把发展“数字海洋”技术列入了“十五”计划中,并策划了国家海洋科学技术发展的计划。目前,一个急需面对的问题是如何去研究和发展关于海洋界中信息技术与可视化的理
在地形三维场景的绘制过程中,传统的技术方案主要集中在图形硬件端的优化,即通过显示列表、顶点缓存对象等对客户端发送到显卡服务器的地形数据进行封包显示,严重的占用了存
可靠性从上个世纪三四十年代就受到了人们的关注,其主要原因就是当时军用产品频频出现故障,以至于人们不得不深刻的反思应该怎样对产品的可靠性进行保证。从那以后,人们便开
本系统针对林权改革实际问题和需求,以PDA为硬件,通过嵌入式编程开发,研发了基于eSuperMap的林权改革数据采集系统。该系统充分发挥了地图编辑、地图处理、GPS导航及数据采集
信息可视化(Information Visualization)是可视化研究领域的重要分支,它致力于增强人们对源于自然、科学与社会生产实践的、抽象的、大型非空间数据集认知能力的可视方法与交
运动目标的跟踪是计算机视觉、模式识别以及人工智能等学科的一个重要研究内容,广泛应用于安防监控系统中。由于目标运动的多样性和周围环境的复杂性,包括遮挡、目标变形、光照
权限管理模块是web应用系统中重复开发率较高的模块之一。基于B/S的通用权限管理系统的研建将开发人员从重复的开发中解脱出来,使其更专注于业务需求的实现。本文首先对RBAC