基于样本采样与特征空间的分类器设计研究及应用

来源 :华东理工大学 | 被引量 : 0次 | 上传用户：liaonianyou

【摘要】

：

模式识别的研究已经取得了快速的发展，它在各个领域都发挥着巨大的作用。本文主要着眼于对模式识别分类器的设计研究和在现实生活中的应用，分别从样本层面和特征层面展开。本文

【作者】

：

姚丽娟

【机构】

：

华东理工大学

【出处】

：

华东理工大学

【发表日期】

：

2018年期

【关键词】

：

模式识别分类器采样方法特征选择多经验核学习 Universum学习数据生成

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

模式识别的研究已经取得了快速的发展，它在各个领域都发挥着巨大的作用。本文主要着眼于对模式识别分类器的设计研究和在现实生活中的应用，分别从样本层面和特征层面展开。本文首先基于样本采样，将Universum学习结合多经验核学习，提出Multiple Universum-based Empirical Kernel Learning(MUEKL)算法;其次，本文将模式识别应用到一个具体的场景。基于特征选择方法，对心衰病人进行死亡率预测，同时提出了基于近邻策略的Dynamic Radius Means algorithm(DRM)算法。本文的主要贡献在于:　　第一，本文将多经验核学习和Universum学习结合起来，提出了MUEKL算法。这不仅仅是简单的叠加，还在原多经验核学习框架基础上，设计了一个正则化项Runi。MUEKL算法不仅仅引入了Universum样本，加入了数据的先验知识，而且正则化项Runi的提出有助于解决不平衡问题。不平衡问题下，分类边界向少数类偏移。该正则化项的目的就是减轻分类边界向少数类偏移的程度。实验结果展示了MUEKL在平衡和不平衡数据集上都表现优秀。　　第二，本文还提出了一种Universum数据生成方式Imbalanced Modified Universum(IMU)。IMU的生成方式中引入了不平衡率，更好地结合了不平衡数据的特性。实验证明，IMU比现有效果比较好的Universum生成方式更加有效。IMU虽然引入了不平衡数据集的特性，但是在平衡数据集上也同样适用。另外，IMU的提出，是独立于MUEKL框架的。因此，IMU生成方式也可应用在其他Universum学习中。　　第三，本文将模式识别应用在医疗领域，对心衰病人进行心衰死亡率预测。本文基于特征选择提出了一个心衰死亡率预测模型。在心衰死亡率预测模型中，本文并不只是简单应用现有的模式识别算法，而是针对数据集的特性，对现有算法做出了改进，提出了一个新的算法Dynamic Radius Means algorithm(DRM)。实验证明，DRM比原分类模型更加有效。特征选择方法Orthogonal Relief(OR)对数据特征进行清洗和选择，保留重要的特征，以便于提高分类器的准确度。在预测模型中，本文提出了三个目标预测心衰死亡率，分别是本次住院后的死亡率预测，30天内的死亡率预测和1年内的死亡率预测。医生或专家可以根据现实情况去选择他们所需要的目标模型。因此，提出的心衰死亡率预测模型具有很强的应用性，为医生或专家提供决策支撑，辅助他们对心衰病人进行更好地治疗。　　本文是以理论和实践相结合，一方面，在分类器设计方面，提出了新的算法模型，为分类器的研究和设计提供了一种新的思路。另一方面，在分类器应用上，提出了一个解决实际问题的模型，将模式识别成功应用于实践。同时，在应用过程中，还提出了一个新的算法DRM。这也为模式识别在实际中应用提供了一种方法和思路。不仅仅需要将理论应用到实践，还要根据具体的实际情况，对现有方法做出改进，更好地贴合数据。可见，本文提出的方法和思路具有很好的启发性和推广性。

其他文献

基于三支决策的云任务节能调度研究

云计算是一种以有偿提供资源作为服务的商业化计算模式，其中，如何根据集群负载与用户服务水平，对资源进行合理、有效的分配是云计算研究的重要内容，但目前该领域还存在如资源使用

学位

云计算任务调度集群负载资源整合

面向通信设备的构件化网络协议栈体系

软件构件化是21世纪软件工业发展的大势趋，构件化思想在软件领域被广泛地应用。把网络协议结和构件思想结合在一起实现是目前网络协议体系结构发展的方向，特别是在基于通信设备

学位

网络协议构件化NSPCFCBCS模型构件标准接口量化组装构件库构件开发平台

面向多元线性回归学习的异方差估计研究

学位

远程教学中自动答疑系统的研究

随着Internet在我国广泛应用，远程教育越来越受到人们的重视。远程教学不仅仅是将教学材料在网上发布，更多的是学生与教师、教师与学生之间的充分沟通、交流。由于远程教学中教

学位

自动答疑远程教育自然语言处理相似度

时空数据库的事务处理技术

随着信息技术的飞速发展,人类在信息处理领域面对更多新兴应用的挑战,特别是随着空间地理信息、时间信息的存储和管理的广泛应用,原有的空间数据库和时态数据库都越来越体现

学位

时空数据库事务模型并发控制恢复管理事务处理

基于集群文件系统的元数据容错研究

目前高性能计算机和高性能服务器已逐渐使用大规模集群结构。集群文件系统是集群的一个重要组成部分,作为一种集群体系结构上的并行文件系统PVFS(Parallel Virtual File Syst

学位

高可用性集群并行文件系统元数据容错

基于SVM的含噪耳语音说话人识别研究

耳语音作为一种特殊的语音，是日常语音交流必不可少的一部分。随着说话人识别技术的日益成熟以及人们对耳语音关注程度的增加，耳语音说话人识别技术在信息服务、司法鉴定等方面

学位

说话人识别耳语音支持向量机特征参数敏感区域

基于Web的分布式工作流管理系统的事务模型研究

企业的计算机应用已经进入跨企业的信息集成，这需要依靠分布式的工作流管理技术。传统的基于CORBA的工作流系统显然已不能满足要求，其Internet ORB间协议IIOP很难穿越企业级的

学位

分布式工作流系统Petri网事务处理事务工作流双层事务模型

肺部CT影像肺结节多维特征提取及计算机辅助诊断方法研究

根据世界上各大癌症研究中心和卫生组织的调查显示，肺癌已经成为全世界致死率最高的第一大癌症。目前胸腔扫描图像技术的应用范围越来越广泛。通过分析CT图像的特征(Computed

学位

计算机断层扫描图像肺结节特征提取计算机辅助诊断

合法侦听系统研究

合法侦听是为了国家安全的需要，根据国家法律明确规定并且经过授权机构的法律授权，由具有合法侦听权的机构在法律授权范围内对通信内容进行侦听。随着我国信息化的深入，合法侦听

学位

合法侦听合法侦听接口无线通信电路交换包交换SIPIP

基于样本采样与特征空间的分类器设计研究及应用

其他学术论文