基于核方法的纠错输出编码多类分类算法改进

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ysminnpu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是众多研究领域中的一个基本问题,如图像识别、语音识别、医疗诊断、系统辨识和控制、自然语言处理、蛋白质结构和功能预测、金融风险分析等等。诸多领域的强大需求为分类问题的算法和应用的研究带来了机遇和动力。同时,近来的统计学习理论为此提供了强大的理论支持,不断出现各种分类问题的解决思路。而随着二类分类(binary class classification)的技术逐渐成熟,最近研究人员逐渐将目光转向应用需求更加广泛的多类分类问题(multi class classification)。与二类分类问题相比,多类分类问题存在一定的难点:模型表示困难,理论支撑少,分类器训练复杂度大等。近年来,多类分类算法中一种比较流行的思想是把多类分类问题分解成若干个二类分类分类问题来求解,纠错输出编码(ECOC,Error-correcting Output Coding)是一个典型的代表。本文通过调研各种分类算法以及对ECOC的仔细分析,基于统计学习理论中的大间隔(large margin)思想提出两种了ECOC的改进策略,目标是提高ECOC框架的预测能力,提高其预测精度。本文的贡献在于:(1)基于结构风险和正则化,修改ECOC的损失函数,把局部独立损失修改为全局损失,提出了基于一致训练的ECOC算法。(2)对各个分类器基的在解码输出过程中进行加权,基于结构风险和正则化定义给权值向量的损失,通过优化这个损失函数获得一个最优的权值系数,而获得一个性能更好的分类器。本算法能进一步推广到希尔伯特空间,使得分类器的输出和权值系数在核空间进行内积操做,从而实现非线性解码(nonlinear decoding)。(3)对两种改进对应的对偶问题提出了改进的优化方法。所提出的这两种改进算法既保持了ECOC方法和核方法的良好特性,同时有效提高了多类分类预测性能。同时,本文还给出了一致学习算法的几个特例和现有算法的等价性证明。为了评估这两种改进算法的有效性,本文设计了三个实验来进行测试。(1)在UCI标准数据库上和已有算法进行多类分类预测精度(Accuracy)的比较。(2)RoboCup机器人足球仿真平台上和已有的算法进行了预测精度的比较,同时考察了本文方法在多智能体的对手建模上应用的效用。(3)在基于颜色的目标识别问题上也就识别精度进行了比较,还考察了在此问题上的鲁棒性。实验结果表明,两种方法在上述应用场合都能显著提高多类分类器的最终预测精度,同时也表明了在对手建模和目标识别上应用的有效性。
其他文献
机器人足球比赛是近年来蓬勃发展的一项高科技竞赛,它融合交叉了多种高新技术,如机器人技术、传感器技术、智能控制、通讯与计算机技术、多智能体协作等。足球机器人小车系统
随着计算机技术、无线通信技术和移动计算技术的迅猛发展和广泛应用,计算机的形态、结构、及使用环境也随之发生了根本变化。但是,传统的人机交互方式已经越来越不能适应这些
分类学习是模式识别、机器学习与数据挖掘的基础问题。随着分类学习理论及应用在深度及广度上的不断探索,新的问题与挑战亦层出不穷,其中有一个问题比较突出:对于实际的任务,
为了确保长输管道系统更加安全、可靠地运行,巡线工作效率和质量必须得以充分的保障。本文对长输管道巡线过程和巡线系统进行了研究。随着科技的发展与进步,智能手机被各行各业
现代化国家的经济发展和能源有着密切的关系,能源不足会影响国民经济的发展,甚至会造成巨大的损失。我国已成为能源进口大国,随着国民经济的飞速发展,对油、电等基础能源的需求仍
移动机器人是现代科学技术的热点研究领域,包含了多个研究分支。其中,移动机器人控制技术致力于构造机器人的“控制中枢”,具有重要的研究意义和应用价值。本文主要涉及基于数字
制造物联网的网络特征包括网络覆盖制造业全流程,有线、无线网络并存,各类传感、驱动、执行节点并存,感知节点随机部署、对象动态移动等特征,导致端到端延迟难以预测、网络实