空间数据库中基于网格的自适应聚类算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:w370724
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着空间数据获取技术的快速发展,空间数据量呈指数级快速增长,造成了“数据丰富,知识贫乏”的现象。如何从大量的、高维的、含有多种不确定性的空间数据中挖掘隐含的、有价值的知识,是一个十分重要的前沿性课题。经过十几年的研究和实践,空间数据挖掘技术已经吸收了许多学科的最新研究成果而形成独具特色的研究分支。空间聚类分析是空间数据挖掘中一个重要的研究方向,在地理信息系统、遥感、生物、医学图像处理、环境研究等领域都有着非常重要的应用价值。 空间聚类分析就是按照某种相似性度量值,对空间数据集中的数据对象进行归类和标识成簇,使得同簇中的对象尽可能相似,而不同簇间的对象彼此不相似。典型的空间聚类算法主要有基于划分的方法、基于层次的方法、基于密度的方法、基于网格的方法和基于模型的方法。虽然其中很多算法得到成功应用,但是在某些方面仍然存在一些问题:可伸缩性问题、处理不同类型属性的问题、发现任意形状的问题、对输入顺序的敏感性问题、高维数据的处理问题、算法对输入参数的依赖性问题。针对这些问题,本文提出了一种基于网格的自适应聚类算法 SACBG。 SACBG 算法思路是将高维数据空间划分为等量的超立方体网格,把空间数据映射到相应的网格中,选择密度最大且未聚类过的网格单元为核心单元,围绕核心单元深度遍历其所有的邻接单元,把大于密度阈值的邻接单元合并为一类,如此循环直到所有的网格都被处理过。本算法能够发现任意形状的聚类问题,避免参数的输入问题,有效地解决高维数据的聚类问题。 实验分析结果表明,对于大型、高维空间数据库而言,本算法具有良好的可伸缩性,对输入顺序不敏感,可以发现任意形状的聚类,受“噪声”的影响也不明显。
其他文献
交换式多兆位数据服务(SMDS)是一种高速、无连接的分组交换服务,可接续大量的分布资源,在互联的LAN、工作站和计算机系统之间进行高速分组交换,并且具有吞吐量大和传输延迟小的
学位
基于IP核复用的系统芯片SoC是超深亚微米和纳米阶段的代表性产品,它不论在开发周期,还是在系统功能、性能方面,都体现出无可比拟的优点。然而随着集成的IP核数量的增加,芯片复杂
人工神经网络是一种模拟生物神经系统的信息处理模型,在很多领域得到了成功的应用,并在很多问题上表现出极大的优势和潜力。分类是神经网络的主要用途之一,而分类能力是人类智能
随着技术的不断进步,针对各种移动对象的服务也越来越多,移动对象的轨迹数据作为移动对象的历史活动数据,在某种程度能够体现移动对象的属性、状态、行为等内外部特征。本文以数
Web服务是近年来蓬勃兴起的一种分布式计算模型,它能够实现在不同平台上、不同程序语言编写的应用程序或者应用程序组件之间无缝的互操作。这种互操作性将传统的分布式计算带
当前,数字语音压缩技术在通信领域中获取越来越广泛应用,Voice overIP(VoIP)技术正在不断普及,中低速率(16kbps以下)的高质量的语音编码的需求越来越迫切,ITU-T(国际电信联盟标准
近年来微博呈现出爆炸式发展,已经成为人们运用互联网进行沟通的一种重要途径。在微博网络中用户是其核心,通过对微博用户特征以及其对微博信息传播所起到的作用的研究发现,少量
本文针对上述问题对车辆性能分析、配件选型辅助决策支持系统展开研究和设计,主要工作如下: (1)对决策支持系统体系结构进行了深入的研究,并基于ORM的分层系统设计理念给
现在很多计算机系统是并发系统。并发系统固有的复杂性以及对并发性的本质没有全面正确的认识使开发出的这类系统的可靠性与正确性无法得到保证。为了解释并发性的本质并在此