基于样本采样与特征空间的分类器设计研究及应用

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:liaonianyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式识别的研究已经取得了快速的发展,它在各个领域都发挥着巨大的作用。本文主要着眼于对模式识别分类器的设计研究和在现实生活中的应用,分别从样本层面和特征层面展开。本文首先基于样本采样,将Universum学习结合多经验核学习,提出Multiple Universum-based Empirical Kernel Learning(MUEKL)算法;其次,本文将模式识别应用到一个具体的场景。基于特征选择方法,对心衰病人进行死亡率预测,同时提出了基于近邻策略的Dynamic Radius Means algorithm(DRM)算法。本文的主要贡献在于:  第一,本文将多经验核学习和Universum学习结合起来,提出了MUEKL算法。这不仅仅是简单的叠加,还在原多经验核学习框架基础上,设计了一个正则化项Runi。MUEKL算法不仅仅引入了Universum样本,加入了数据的先验知识,而且正则化项Runi的提出有助于解决不平衡问题。不平衡问题下,分类边界向少数类偏移。该正则化项的目的就是减轻分类边界向少数类偏移的程度。实验结果展示了MUEKL在平衡和不平衡数据集上都表现优秀。  第二,本文还提出了一种Universum数据生成方式Imbalanced Modified Universum(IMU)。IMU的生成方式中引入了不平衡率,更好地结合了不平衡数据的特性。实验证明,IMU比现有效果比较好的Universum生成方式更加有效。IMU虽然引入了不平衡数据集的特性,但是在平衡数据集上也同样适用。另外,IMU的提出,是独立于MUEKL框架的。因此,IMU生成方式也可应用在其他Universum学习中。  第三,本文将模式识别应用在医疗领域,对心衰病人进行心衰死亡率预测。本文基于特征选择提出了一个心衰死亡率预测模型。在心衰死亡率预测模型中,本文并不只是简单应用现有的模式识别算法,而是针对数据集的特性,对现有算法做出了改进,提出了一个新的算法Dynamic Radius Means algorithm(DRM)。实验证明,DRM比原分类模型更加有效。特征选择方法Orthogonal Relief(OR)对数据特征进行清洗和选择,保留重要的特征,以便于提高分类器的准确度。在预测模型中,本文提出了三个目标预测心衰死亡率,分别是本次住院后的死亡率预测,30天内的死亡率预测和1年内的死亡率预测。医生或专家可以根据现实情况去选择他们所需要的目标模型。因此,提出的心衰死亡率预测模型具有很强的应用性,为医生或专家提供决策支撑,辅助他们对心衰病人进行更好地治疗。  本文是以理论和实践相结合,一方面,在分类器设计方面,提出了新的算法模型,为分类器的研究和设计提供了一种新的思路。另一方面,在分类器应用上,提出了一个解决实际问题的模型,将模式识别成功应用于实践。同时,在应用过程中,还提出了一个新的算法DRM。这也为模式识别在实际中应用提供了一种方法和思路。不仅仅需要将理论应用到实践,还要根据具体的实际情况,对现有方法做出改进,更好地贴合数据。可见,本文提出的方法和思路具有很好的启发性和推广性。
其他文献
云计算是一种以有偿提供资源作为服务的商业化计算模式,其中,如何根据集群负载与用户服务水平,对资源进行合理、有效的分配是云计算研究的重要内容,但目前该领域还存在如资源使用
软件构件化是21世纪软件工业发展的大势趋,构件化思想在软件领域被广泛地应用。把网络协议结和构件思想结合在一起实现是目前网络协议体系结构发展的方向,特别是在基于通信设备
学位
随着Internet在我国广泛应用,远程教育越来越受到人们的重视。远程教学不仅仅是将教学材料在网上发布,更多的是学生与教师、教师与学生之间的充分沟通、交流。由于远程教学中教
随着信息技术的飞速发展,人类在信息处理领域面对更多新兴应用的挑战,特别是随着空间地理信息、时间信息的存储和管理的广泛应用,原有的空间数据库和时态数据库都越来越体现
目前高性能计算机和高性能服务器已逐渐使用大规模集群结构。集群文件系统是集群的一个重要组成部分,作为一种集群体系结构上的并行文件系统PVFS(Parallel Virtual File Syst
耳语音作为一种特殊的语音,是日常语音交流必不可少的一部分。随着说话人识别技术的日益成熟以及人们对耳语音关注程度的增加,耳语音说话人识别技术在信息服务、司法鉴定等方面
企业的计算机应用已经进入跨企业的信息集成,这需要依靠分布式的工作流管理技术。传统的基于CORBA的工作流系统显然已不能满足要求,其Internet ORB间协议IIOP很难穿越企业级的
根据世界上各大癌症研究中心和卫生组织的调查显示,肺癌已经成为全世界致死率最高的第一大癌症。目前胸腔扫描图像技术的应用范围越来越广泛。通过分析CT图像的特征(Computed
合法侦听是为了国家安全的需要,根据国家法律明确规定并且经过授权机构的法律授权,由具有合法侦听权的机构在法律授权范围内对通信内容进行侦听。随着我国信息化的深入,合法侦听