论文部分内容阅读
在多变量模式识别领域,变量间经常会存在复共线性,复共线性不仅会影响参数估计的效果,也会使变量的敏感性出现显著异常。马田系统是以马氏距离作为测量尺度,结合正交表和信噪比实现系统降维的一种新的模式识别技术。作为数据挖掘技术的一种,以最精简的系统实现多维样品的分类和预测,由于马田系统本身的缺陷且不可避免会受到复共线性的干扰,整体的性能势必会受到影响。本文从克服复共线性入手,从测量尺度、维度约减和分类器重构三个角度改善马田系统,以降低复共线性的干扰,增强马氏距离的计算稳健性和马田系统的分类性能。本文通过研究复共线性对马氏距离和马田系统的负面影响,将岭回归的思想引入马氏距离,构建新的测量尺度,并引入敏感性分析,以条件数和偏导数确定三组指标,绘制岭参数的岭迹,并以此确定岭参数。然后基于优化思想建立马田系统二分类多目标优化模型,并引入结合外部精英保留和内部随机选择的自适应遗传算法求解pareto非支配解集,结合TOPSIS思想确定最优基准空间。最后针对马田系统硬阈值分类的不可靠性,本文基于模糊思想,采用指派法确定马田系统二分类模糊隶属度函数,通过模糊统计的思想确定参数,建立模糊阈值分类器,从而改善马田系统的硬阈值分类器,提高其分类精度和样品的类别解释能力。本文将有偏估计的思想引入协方差矩阵的估计来改善马氏距离的过敏感性,使用优化思想进行维度约减,并构建模糊阈值分类器实现分类,不仅使得马田系统能很好的处理复共线性数据,还极大的增强了其应用范围和解释能力。