增量聚类算法的设计与实现

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:cx313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术和数据库技术的发展,各个领域的信息量急剧增长,需要处理的数据规模越来越大;同时,对数据集实时处理的需求不断加大。这就促使了海量动态数据的出现。目前大多数聚类算法处理海量动态数据不仅需要消耗大量的时间和空间资源,并且挖掘效果不理想,其有效性和可扩展性受到了限制。在这种情况下,增量聚类算法应运而生,有效的解决了海量动态数据的聚类问题。为了实现动态、增量聚类,首先,对基于密度和自适应密度可达聚类算法(Clustering Algorithm Based on Density and Density reachable, CADD)进行了改进:第一,为密度可达包成员设置标志值,极大的提高了聚类效率;第二,改进半径和密度的计算方式,避免了重复的计算;第三,编程实现聚类结果的可视化,可以直观的评价聚类效果。实验结果表明,改进后使得算法的复杂度明显减小。其次,在CADD算法改进的基础上重点研究了两方面内容:(1)根据CADD算法的特点,提出了基于密度可达的增量聚类算法——ICADD算法,由于该算法是非批量聚类方式,实验表明虽然聚类效果比较好,但是效率较低;(2)根据层次聚类算法BIRCH中聚类特征的概念,提出了子簇特征的概念和子簇的相似准则(包括空间位置相似性和空间分布相似性),并进一步设计、实现了基于子簇特征的增量聚类算法——ICSCF算法。此外在计算数据点密度时,还引入了抽样技术。由于ICSCF算法采用批量处理方式,理论分析和实验结果证明,该算法不仅具有较高的聚类效率,同时,通过将数据集分割、逐步动态聚类,还能实现对大型数据库的聚类分析,有良好的可扩展性,特别是在空间聚类(如图像处理)方面能够发挥重要的作用。
其他文献
[编者按]黑河市教育局副局长黄凤来在全市教育行政工作会议上就基础教育、师资队伍建设、学校体卫艺及教科研、中小学教育信息化建设等方面进行了具体部署.本刊现摘发如下:
期刊
培养和提高学生的口语表达能力,是中学语文教学的一项重要任务.新课标规定:"培养学生具有日常口语交际的基本能力,在各种交际活动中,学习倾听、表达与交流,初步学习文明地进
期刊
美国哈佛大学心理学教授霍华德·加德纳1983年在《智力的结构》一书中提出了著名的多元智力理论.这一理论为我们今天的基础教育课程改革提供了理论参考,也为教师的个性化
期刊
自主学习是当今教育研究的一个重要主题,是适应时代发展要求的一种学习方式,是当前课程改革倡导的学习方式之一.它不仅有利于学生提高学习成绩,而且是个体终身学习和毕生发展
随着科学技术的快速发展以及生产力水平的不断提高,自动化控制技术在各个领域都得到了广泛应用,在化工生产行业中,自动化控制技术的先进性和使用价值体现的更为明显。化工生
基于我国智能家居产业发展存在的问题与现状,结合物联网技术的支撑手段,探讨构建全方位的智能家居监测管理体系:家居设备可溯源与评价体系、设备运行状态监测与数据隐私保护
教育有没有终极关怀?有的,就是培养独立人格。孔子说"知者不惑,仁者不忧,勇者不惧",又说"君子不器"。孟子说:"富贵不能淫,贫贱不能移,威武不能屈。"这些观点体现了教育的终极
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技