【摘 要】
:
两分类问题是机器学习中的一类监督学习问题,Vapnik提出的处理两分类问题的支持向量机(SVM)依赖于数据样本.通常,抽样误差、建模错误和仪器误差可能降低了解输入数据的准确性,便产生了带有噪声的数据集.噪声数据导致对样本的正确特征学习不够充分,从而对新的样本点预测不精准,导致模型的泛化能力减弱.因此研究抗噪声的支持向量机分类法具有重要意义.与抗噪紧密相连的是两分类算法的损失函数,例如:hinge损
论文部分内容阅读
两分类问题是机器学习中的一类监督学习问题,Vapnik提出的处理两分类问题的支持向量机(SVM)依赖于数据样本.通常,抽样误差、建模错误和仪器误差可能降低了解输入数据的准确性,便产生了带有噪声的数据集.噪声数据导致对样本的正确特征学习不够充分,从而对新的样本点预测不精准,导致模型的泛化能力减弱.因此研究抗噪声的支持向量机分类法具有重要意义.与抗噪紧密相连的是两分类算法的损失函数,例如:hinge损失函数、最小二乘损失函数、L1-范数损失和pinball损失函数,它们在噪声数据集上表现出相对的优点与缺点.目前,解决带有噪声数据集的两分类方法有Pin-SVM、L1-LSTBSM等.其中,L1-LSTBSVM在已有的LSTBSVM基础上,用L1-范数替代最小二乘损失函数来度量距离,实验结果表明L1-范数损失可以有效抑制离群值的影响.Pin-SVM在SVM的基础上,将hinge损失函数替换成与分位数相关的pinball损失函数,实验结果表明pinball损失函数对噪声数据不敏感.因此,本文针对带噪声的两分类问题,受到Pin-SVM、L1-LSTBSM的优点的启发,提出具有抗噪的两分类算法.在-双子限定支持向量机的基础上提出基于L1-范数的-双子限定支持向量机,简称为L1-vTBSVM,通过将最小二乘损失函数替换成对噪声不敏感的L1-范数损失,避免了昂贵的矩阵逆运算且对噪声数据集有更好的泛化能力,数值实验结果表明该模型是有效的.本文还提出一种带有pinball损失函数的-双子限定支持向量机,简称为Pin-TBSVM,通过将hinge损失函数替换成pinball损失函数,使得改进的Pin-TBSVM更适合处理噪声数据集,数值实验表明它是有效的.
其他文献
加快我国制造业转型升级是推进制造强国的必由之路,也是实现高质量发展、建设现代化经济体系的战略举措。近年来,随着我国经济进入高质量发展阶段,新一轮信息技术与制造业深度融合,推动了新兴制造业的发展;制造业服务化的发展新趋势,促进了制造业发展模式的转变;创新驱动发展战略的不断深入,为制造业的发展提供了新动力。但长期以来,依赖低成本的要素投入,导致我国制造业面临“低端锁定”、“比较优势陷阱”和“被挤出价值
常减压装置是石化行业炼油最重要的设备,常减压装置防腐技术的改进能够保证设备稳定运行和提高产品质量,实现财力物力有效利用并为工作人员安全保驾护航。为常减压装置提供高效准确防腐策略和理论支持是行业亟待解决的重大热点问题,本研究通过对常减压装置海量历史数据的深入分析,为实现其有效防腐提供了具有创新性的完整腐蚀检测过程。具体主要完成的工作有以下几点:(1)通过研究分析常减压装置及其主要腐蚀机理,收集常减压
人体呼吸CO_2浓度监测是临床监测的重要内容之一,CO_2浓度的变化可以反映人体新陈代谢、循环、呼吸、气道或通气系统的功能变化,在重症监护,急救医学,远程医疗、麻醉监测等领域都有着广泛的应用。针对主流式非分散红外(NDIR)呼吸CO_2监测系统灵敏度及信噪比低下的问题,本文将复合抛物面聚光器、圆管聚光器、锥形聚光器光室结构应用于监测系统,利用ZEMAX对这三种光室结构进行了优化模拟,获取它们的模拟
随着无线传感器网络技术的高速发展,它在人们生活中的应用越来越多。无线传感器可以用于许多领域,例如医学领域,科学领域,军事作战,商业贸易,政府应用程序,天气监测等等。在无线传感器网络的研究方向中,它的定位技术是一个非常热门的研究项目。对于无线传感器网络的研究都是建立在定位的基础上的,所以对无线传感器网络定位技术的研究具有重大的意义。无线传感器定位算法分为测距和无需测距两种,DV-Hop(Distan
2018年,长三角地区的一体化战略上升为了国家战略,一体化进程再次加速。在新颁布的规划纲要指导下,长三角地区的长期建设目标是将原本已经具备良好发展态势的生产性服务业和制造业,建设成全国的一流的行业生产示范基地。同时近年来,长三角地区经济蓬勃发展,生产性服务业发展规模随之得以扩展,已经形成了一定的集聚效应。制造业总量不断扩大,但是在生产经营的过程中,原本依靠资源消耗和低廉的劳动力支撑经营的制造业企业
可交换债券是一种创新型债券,是上市公司的股东依法发行的债券,债券持有人在一定期限内依据约定的条件可以将债券转换为发行人所持有的上市公司的股份。它具有诸多优势,如:融资成本低,流程便捷,对股价冲击小等。这种相对而言更加低成本,更加便捷的融资方式受到了很多非上市公司,尤其是持有大量上市公司股权的非上市公司的青睐。截止2019年12月31日,我国资本市场共计发行274支可交换债券,规模为2122.51亿
目前,我国加大了对土壤环境保护的力度,土壤污染治理和修复成为国家研究的热点问题。重金属砷是一种常见的土壤污染要素,超富集植物蜈蚣草具有从土壤中吸收大量砷的特性,因此通过种植蜈蚣草来吸收土壤中的砷成为一种重要的土壤修复手段。蜈蚣草生长到一定时期时吸收砷的能力将达到峰值,应该及时刈割以提高土壤修复的效率,因此有效地自动判识蜈蚣草最佳刈割期具有重要应用价值。本文提出了一种应用视频流自动判识蜈蚣草最佳刈割
教师交流制度是随着近年来教育公平、教育均衡等问题逐渐被政府教育部门和教育研究者所重视后应运而生的一种新的形式,旨在通过教师流动实现教育的均衡发展和教育公平。而名师交流除了可以实现师资均衡,更重要的是它能以优促优,成为以一流师资提升教育品质的一个新的途径。名师的带动、引领不仅仅局限于“名师工作室”、“名师示范课”等形式。A市B区开展的“名师蹲点交流”活动就是名师的带动、引领的又一形式。A市B区开展“
将计算机辅助诊断系统应用于日常临床诊断可在一定程度上减轻医生的工作负担,然而传统的计算机辅助诊断系统在应对规模逐渐增大的临床数据集时已有些力不从心,深度学习技术的出现,使得利用计算机技术对大规模临床数据进行分析诊断成为了可能。医生对疾病的诊断通常要结合电子病历文本数据、医学影像数据、检查指标数据等多种结构及模态的临床数据作为判断依据,然而目前常见的基于深度学习技术的计算机辅助诊断系统大多仅使用单一
针对液晶面板这种大吞吐量制造业中存在的行业难题,从企业内部供应链信息流和产品流两方面进行研究,通过分析企业内部的需求零散、签核效率低下、供应商管理困难以及企业内部供应链中产品流的相关问题,针对性地设计相关方案对供应链流程进行优化,进而有效降低企业供应链成本。本文选取重庆惠科金渝企业作为研究对象,通过研究发现目前重庆惠科金渝主要存在如下问题:企业部门沟通壁垒大、料号描述不规范导致部门需求分散、内部流