论文部分内容阅读
作为信息系统的一项核心技术,数据库技术在新世纪得到了的快速的发展,加上存储技术的进步,人们可以对海量的数据进行存储。因此,数据以GB、TB再到PB级的方式爆炸增长。在“数据爆炸”的背景下,对数据进行有效处理以获取有用信息变得至关重要,数据挖掘就是为了解决当今时代“数据爆炸、知识匮乏”的问题而诞生的。然而,数据规模和复杂性的不断增加使得传统聚类算法面临严峻的挑战。在面对高维数据、海量数据、非结构化数据等数据时,传统数据挖掘算法显得十分乏力。另一方面,量子计算凭借着量子叠加性、纠缠性等独特的量子特性,能够自然地实现并行计算从而实现对经典算法的加速。近年来,量子计算在数据挖掘中的应用得到了广泛地关注和研究。本文对早前的量子聚类算法进行了大量研究,并在此基础上,前瞻性地融合了量子计算和博弈论思想,并将量子博弈应用到聚类算法中。本文主要做了以下几方面工作:(1)对量子计算、数据挖掘的研究进展进行了介绍,并重点探讨和分析了量子博弈,详细阐述了量子博弈在聚类算法中的应用现状。(2)将量子博弈运用于聚类问题中,提出一种基于网格的量子博弈聚类算法:QGCG。算法中,将数据点看做是博弈的参与人,通过在收益矩阵中内嵌距离函数,使相似的数据点能够获得更大的收益,从而形成聚类。此外,通过设定网格合并规则,使博弈过程得到了简化。仿真实验表明,相比于K-means等传统聚类算法,QGCG算法提高了某些数据集上的聚类质量。最后,就算法中的几个参数对算法性能的影响作出了讨论,并给出了参数选择的建议。(3)在上述基于网格的量子博弈聚类算法的基础上,进一步地将量子博弈扩展到三人同时参与的情形。在对传统三人囚徒困境模型的收益矩阵进行改进之后,提出了一种基于三人囚徒困境的量子博弈聚类算法:QGC3PD。仿真实验表明,QGC3PD算法在某些高维数据集上有比较好的聚类表现。