论文部分内容阅读
为提高K-means聚类算法在异常检测中的效果,给出一种改进的K-means聚类算法。基于最大距离选取初始聚类中心,并引入信息熵计算各个属性的权重,用改进后的加权欧氏距离公式计算数据集中样本点间的距离。选取KDDCUP99数据集测试算法的性能。实验结果表明,本算法有助于提高异常检测的检测率和降低误报率。