论文部分内容阅读
模式识别的研究已经取得了快速的发展,它在各个领域都发挥着巨大的作用。本文主要着眼于对模式识别分类器的设计研究和在现实生活中的应用,分别从样本层面和特征层面展开。本文首先基于样本采样,将Universum学习结合多经验核学习,提出Multiple Universum-based Empirical Kernel Learning(MUEKL)算法;其次,本文将模式识别应用到一个具体的场景。基于特征选择方法,对心衰病人进行死亡率预测,同时提出了基于近邻策略的Dynamic Radius Means algorithm(DRM)算法。本文的主要贡献在于: 第一,本文将多经验核学习和Universum学习结合起来,提出了MUEKL算法。这不仅仅是简单的叠加,还在原多经验核学习框架基础上,设计了一个正则化项Runi。MUEKL算法不仅仅引入了Universum样本,加入了数据的先验知识,而且正则化项Runi的提出有助于解决不平衡问题。不平衡问题下,分类边界向少数类偏移。该正则化项的目的就是减轻分类边界向少数类偏移的程度。实验结果展示了MUEKL在平衡和不平衡数据集上都表现优秀。 第二,本文还提出了一种Universum数据生成方式Imbalanced Modified Universum(IMU)。IMU的生成方式中引入了不平衡率,更好地结合了不平衡数据的特性。实验证明,IMU比现有效果比较好的Universum生成方式更加有效。IMU虽然引入了不平衡数据集的特性,但是在平衡数据集上也同样适用。另外,IMU的提出,是独立于MUEKL框架的。因此,IMU生成方式也可应用在其他Universum学习中。 第三,本文将模式识别应用在医疗领域,对心衰病人进行心衰死亡率预测。本文基于特征选择提出了一个心衰死亡率预测模型。在心衰死亡率预测模型中,本文并不只是简单应用现有的模式识别算法,而是针对数据集的特性,对现有算法做出了改进,提出了一个新的算法Dynamic Radius Means algorithm(DRM)。实验证明,DRM比原分类模型更加有效。特征选择方法Orthogonal Relief(OR)对数据特征进行清洗和选择,保留重要的特征,以便于提高分类器的准确度。在预测模型中,本文提出了三个目标预测心衰死亡率,分别是本次住院后的死亡率预测,30天内的死亡率预测和1年内的死亡率预测。医生或专家可以根据现实情况去选择他们所需要的目标模型。因此,提出的心衰死亡率预测模型具有很强的应用性,为医生或专家提供决策支撑,辅助他们对心衰病人进行更好地治疗。 本文是以理论和实践相结合,一方面,在分类器设计方面,提出了新的算法模型,为分类器的研究和设计提供了一种新的思路。另一方面,在分类器应用上,提出了一个解决实际问题的模型,将模式识别成功应用于实践。同时,在应用过程中,还提出了一个新的算法DRM。这也为模式识别在实际中应用提供了一种方法和思路。不仅仅需要将理论应用到实践,还要根据具体的实际情况,对现有方法做出改进,更好地贴合数据。可见,本文提出的方法和思路具有很好的启发性和推广性。