论文部分内容阅读
围绕KNN算法,以寻求高精度、高效率的相似性距离度量方法为主要研究目的。根据特征参数熵变换指标的类别特点,提出一种运用熵特征变换指标设计相互类别差异量的相似性距离度量,以降低特征参数类别噪音。对熵降噪优化、熵相关度差异、类可信度计算、传统欧式距离及相同特征参数几种KNN算法进行理论分析、Letter和Pima Indians Diabetes数据集仿真实验及KDD CUP99的实际应用,均显示该算法在KNN算法中具有很好的效果。