【摘 要】
:
Affinity Propagation 聚类算法是 Brendan J.Frey 和 Delbert Dueck 于 2007 年在Science 上发表的一个高性能聚类算法。它在人脸图像识别、基因外显子发现、检索最佳航空航
论文部分内容阅读
Affinity Propagation 聚类算法是 Brendan J.Frey 和 Delbert Dueck 于 2007 年在Science 上发表的一个高性能聚类算法。它在人脸图像识别、基因外显子发现、检索最佳航空航线、手写邮政编码、设施选址等领域得到了广泛的应用。但是随着其应用领域需要处理数据量的爆炸式增长,且其算法自身较高的时间复杂度,所以导致AP聚类算法在处理大规模不同类型数据集时的时间成本太大。因此设计针对大规模数据进行快速聚类的算法成为研究的热点之一。本文通过改进优化和并行AP聚类算法以实现大规模数据的快速聚类。从AP聚类算法的原理分析、AP聚类算法的改进优化以及基于CUDA平台并行AP聚类算法这三个方面展开研究。本文首先分析阐述AP聚类算法的基本原理和AP聚类算法的特点,找出其自身的局限性所在,为AP聚类算法的改进和并行做铺垫。改进优化AP聚类算法就是增加AP聚类算法的功能来更好的处理数据集。并行改进后的AP聚类算法是本文研究的核心内容。首先分析找出AP聚类算法可以并行的部分,然后在现有的硬件设备上设计基于CUDA平台的AP-CUDA聚类并行算法,然后利用CUDA提供的程序分析工具分析AP-CUDA聚类算法,找出最优的硬件设置以使程序达到最佳的运行效果,提高其性能。最后在硬件设备上运行串行AP聚类算法和AP-CUDA聚类算法进行实验收集实验数据。实验数据展示了改进优化并行后的AP-CUDA聚类算法在处理不同类型和更大规模的数据集时具有优异的性能。
其他文献
高亚洲是以青藏高原为中心的高海拔地区,是我国最大的积雪面积覆盖区,其积雪的动态变化对该区域的气候变化、水文循环、融雪模型、灾害预报以及生态环境保护等方面都有着重要
随着纳米技术的发展,纳米材料在污水处理等环境领域已获得广泛应用,将纳米材料设计出成特定的结构或特殊的表面状态,将使其对特定的污染物或在恶劣的环境下发挥更大的优势。鉴于纳米材料在有机污染物催化方面的既有研究和巨大潜力,本文基于酚类聚合物,寻找出了简便的合成方法,制备出了形貌规则、分布均匀的核壳结构复合纳米材料及多孔结构纳米材料,并初步探讨了它们对不同有机物的催化能力,为纳米材料处理有机污染物提供了新
热亚矮星是一类比较特殊的天体,被认为是处在极端水平分支阶段的恒星,所以又被称为极端水平分支星。理论上,一般认为热亚矮星是中心氦核燃烧天体,核外有极薄的包层。它们的有效温
随着计算机技术、数据库技术以及网络技术的不断发展,教育和教学活动中的至关重要曲一个环节就是考试,如何高效的人性化的让学生和教师在考试过程中进行互动以及如何保证考试信
角是动物生存时争斗与自卫的工具。但是在现代集约化养牛产业中,牛角成为个体之间争斗及伤人的工具。而人为除角又会违背动物福利且浪费人力物力,因此牛无角性状引发了高度关
传统公益慈善组织弊端的逐渐显露和网络新媒体技术的快速发展,使得大学生微公益活动顺应社会公益事业发展的需求应运而生,当前它已得到社会公众和大学生群体的广泛关注,正朝着正规化的方向不断发展,并成为微公益活动的主要代表和新生力量,也得到了党和政府的高度重视。习近平同志在出席全国高校思想政治教育工作会议时提出要把立德树人作为高校教育的中心环节,着重强调了高校思想政治教育工作的紧迫性和重要性。大学生微公益活
量子系统粒子的行为遵守测不准原理,但是在空间中特定点,粒子出现的几率不随坐标系的选择而发生变化,系统能量的期望值守恒。我们可以利用系统空间平移时,系统能量期望值不变,来讨