密度峰值聚类算法改进及其应用研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:doraemon1226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代来临,海量的数据促使人们想要高效的挖掘数据和有效的利用数据。聚类算法就是一种常用的数据挖掘工具,在不具备先验知识的情况下,探究数据内在的结构信息和相似关系,通过把多个对象分成不同类簇的方式有效地处理海量数据。因此,它也被广泛应用在各个领域,如:信息提取、模式识别、图像分析、数据压缩和网络安全等。密度峰值聚类算法(Densitypeakclustering,DPC)是近年来比较热门的聚类算法,具有思想简单、能识别不同形状的类簇、聚类效果好等优点,吸引了很多科研人员的关注。虽然密度峰值聚类算法有很多优势,但是它也存在聚类结果对于截断距离dc值较为敏感,且dC值和聚类中心点需要人工选择的问题。所以本文分析了原密度峰值聚类算法,并在前人的基础上做了改进。本文主要包含以下几个方面的工作:(1)本文详细分析了原密度峰值聚类算法的思想和实现步骤,总结了原算法的不足之处。针对原算法需要人工设置参数和手动选择聚类中心的问题,设计了基于K近邻的自适应确定参数的密度峰值算法(An automatic density peak clustering algorithmbasedon K nearestneighbor,AKNN-DPC)。改进后的算法引入了 K近邻的思想,使局部密度的计算更为合理,并且归一化决策图中的γ值,通过计算选择那些令γ值有明显突变的K值参与聚类,γ值突变的拐点作为类簇中心点和非类簇中心点的分界,从而实现自动确定参数和聚类中心。(2)本文将改进后的AKNN-DPC算法与原来的DPC算法以及K-Means算法、DBSCAN算法、Mean-Shift算法等经典聚类算法进行对比,分别在多个标准数据集上进行实验,通过实验结果的对比分析及聚类评价指标的评价,发现AKNN-DPC的聚类效果优于其他算法。(3)AKNN-DPC算法可以很好地计算数据点的局部密度并进行聚类,因此本文将该算法应用于湖北省非物质文化遗产的时空分析中,计算湖北省非遗点的密度并进行聚类,从而分析湖北省非遗空间上的格局分布和时间上演变过程,对湖北省非遗的产生和发展有一个详细的刻画,对未来的保护和传承可以提供一个有力的依据,也体现了本算法有一定的实用价值。
其他文献
学位
学位
学位
随着教育信息化时代的到来,在线教育平台得到了大规模的应用。在线教育平台中学习者可以随时随地的进行学习,它打破了传统教育模式,将师生互动的空间从现实中课堂拓展到了网络虚拟空间之中。在线教育平台中,在线课程论坛是一个必不可少的功能模块,常常被用于学生之间和师生之间的交流,即在线课程论坛支持学习者随时随地发布问题,及时地反映他们在学习中遇到的问题。在线课程论坛为学习者提供了学习交流的场所,吸引了很多学习
“课程思政”是将思想政治教育融入课堂教学的各个环节中,实现思想政治教育与知识体系教育的有机统一。本研究在明确把握心理与教育测量课程的思政改革目标的基础上,论述了三种改革途径,将思政元素融入本课程教学中,以强化学生的爱国思想和文化自信、培养学生的社会责任感以及科学严谨的专业态度。为保障课程思政的教学改革效果,教师要认可课程思政价值,不断更新思政理念,以学生兴趣为导向,自然渗入思政元素,以多元教学为手
单细胞转录组测序技术以单个细胞为分辨率测量基因表达值,为解析组织内部异质性提供了机遇。组织内部异质性的研究能够发现新的细胞类型,研究细胞复杂的分化和发育轨迹,并提高对人类肿瘤等疾病的理解。为了更加准确地解析组织内部的异质性,我们需要识别组织内部包含的细胞类型。面对单次实验产生的数千甚至数百万个细胞的测序数据,目前最主流的方法是通过对给定的单细胞转录组测序数据进行聚类来识别细胞类型。虽然已有很多学者
学位
课程思政是落实立德树人任务的重要手段,可以帮助学生树立正确的人生观和价值观,践行社会主义核心价值观。生态学作为生物科学专业的一门核心课程,具有丰富的思政元素,是开展课程思政的良好载体。将OBE理念运用于生态学课程思政建设中,挖掘生态学课程内容中蕴含的思政元素,从课程思政目标优化、教学内容设计、课程教学实施和教学评价等方面构建生态学课程思政体系,并通过教学实践充分发挥生态学课程的育人效果。该课程思政
学位
前不久,住房和城乡建设部发布开展第一批城市更新试点工作的通知,全国21个城市纳入试点,城市更新试点旨在探索建立城市更新统筹谋划机制、可持续模式及配套制度政策。笔者看到,近段时间,一些试点城市公布的城市更新方案,纷纷摒弃了过去常见的“一键重启”式的大拆大建做法,城市更新的观念与行动正在经历从“拆改留”到“留改拆”的转变。
期刊