论文部分内容阅读
在计算机视觉中,数据聚类问题作为各种实际应用的研究基础,无论是在图像处理领域的图像分割、图像检索的特征聚类阶段,还是在模式识别领域的目标追踪、人脸识别处理过程中,都起着至关重要的作用。聚类结果的好坏,直接影响整个实验过程是否能够顺利进行。作为广泛应用的非参数聚类方法,Mean Shift首先被推广到黎曼流形的李群空间中,随后,又实现了Mean Shift在非李群的黎曼流形空间中的应用,自此,Mean Shift在各种特定流形中的应用逐渐发展起来,受到了研究人员的重视。为了探寻更一般的算法形式,2006年,Raghav提出了非线性Mean Shift的概念,并给出了黎曼流形上Mean Shift算法的通用迭代形式。在讨论了算法的理论性质的同时,证明了算法的收敛性。全文工作概括起来,主要包括以下三个方面:首先,在传统Mean Shift算法的理论基础上,针对其在数据聚类分析和图像分割中的应用,分析说明了不同核函数、核半径和阈值的选择对聚类分析和图像分割结果的影响。通过仿真实验,验证了在相同的核半径(或核带宽)及阈值的情况下,使用不同的核函数,聚类分析和图像分割的结果是不相同的。在使用同一核函数并设定相同阈值的情况下,核半径(或核带宽)的大小也会影响Mean Shift聚类分析和图像分割的效果。当核函数和核半径(或核带宽)相同时,对比分析不同合并阈值下图像分割结果的差异。其次,在计算机视觉研究中,通常会遇到复杂参数空间变量的聚类问题。此时,参数变量分布在流形空间中,而不是欧氏空间。为了解决实际应用中流形空间中变量的处理问题,通过查找文献,综述了常用的流形空间,李群、Grassmann流形、本质流形的概念和相关性质。最后,针对传统Mean Shift只能处理欧氏空间数据的局限性,介绍了黎曼流形上的非线性Mean Shift算法。在此基础上,补充证明了该改进算法的收敛性,提出了迭代点列的收敛条件,为算法的推广和应用提供理论保证。