论文部分内容阅读
差分隐私K-means聚类算法因其能很好地兼顾数据可用性和数据隐私安全,而得到了广泛地关注和研究。目前,在许多对差分隐私K-means聚类算法的研究中,都从K-means聚类算法的初始中心点的选择上做改进来提高数据的可用性,而很少关注隐私预算的分配问题对聚类结果带来的影响。传统的隐私预算分配方法可能在K-means算法后期的迭代更新质心的过程中引入大量的噪声而造成数据聚类效果差的问题。为了解决这个问题,提出一种结合三分法和等差数列的隐私预算分配方案。该方法在差分隐私K-means聚类算法中,保证每次