【摘 要】
:
支持向量机是20世纪90年代由Vapnik提出的一种新型机器学习算法.而最常见且最为典型的方法是C-支持向量分类机(C-SVC)、ν-支持向量分类机(ν-SVC)与最小二乘支持向量分类机(LSSVC).我们需要比较C-SVC、ν-SVC与LSSVC三者的特点,以帮助我们更加深入地理解支持向量分类机的用法、特点,以便更好地将其应用于实际问题中.本文首先探究这三种分类机的相同之处:如果C-SVC与ν-
论文部分内容阅读
支持向量机是20世纪90年代由Vapnik提出的一种新型机器学习算法.而最常见且最为典型的方法是C-支持向量分类机(C-SVC)、ν-支持向量分类机(ν-SVC)与最小二乘支持向量分类机(LSSVC).我们需要比较C-SVC、ν-SVC与LSSVC三者的特点,以帮助我们更加深入地理解支持向量分类机的用法、特点,以便更好地将其应用于实际问题中.本文首先探究这三种分类机的相同之处:如果C-SVC与ν-SVC的参数C、ν满足一定关系时C-SVC与ν-SVC的最优分划超平面相同,两种算法分类结果一致;当我们将C-SVC中软间隔损失函数修改为二次软间隔损失函数得到二范数C-支持向量分类机(L2SVC)时,当C很大时,L2SVC与LSSVC最优分划超平面相同,两种算法分类结果一致.然后探究三种支持向量分类机的差异:(1)从算法性能上比较:当训练样本的个数增加时,三种分类算法的准确率、精确率、召回率及F1-measure都会得到提升;对于二分类问题而言,ν-SVC算法所得的准确率、精确率、召回率及F1-measure相对而言都是最好的;对不平衡的数据集,LSSVC算法的召回率较差.(2)从算法的可扩展性上比较:当样本集较小时,三种算法对应的运算时间都比较短;样本集较多时,三种算法的运算时间均有明显的增加,但LSSVC速度明显优于C-SVC与ν-SVC,LSSVC相比有较好的扩展性.(3)从算法的抗干扰性上比较:对于加入偏离比较大的野点而言,C-SVC算法的抗干扰性是最强的,不会产生任何影响;ν-SVC算法的抗干扰性也比较好,即影响也不是太大,而LSSVC算法的抗干扰性最差,但是当样本足够多时,少数几个野点对LSSVC算法影响也不会太大;对于加入中间模糊点而言,LSSVC算法与ν-SVC算法具有一定的抗干扰性,C-SVC算法的抗干扰性最差,最优分划超平面偏离较大,既使增加样本也依然会有较大的影响。
其他文献
<正>《司法鉴定文书规范》第七条第(四)检案摘要:写明委托鉴定事项涉及案件的简要情况。这段文字怎么理解,由于各人的学识、文字修养等方面的不同,会有不同的理解。笔者认为:
切换系统是一类重要混杂系统,它是由一系列连续时间系统子系统和离散时间子系统构成的,并且一个切换规则决定着子系统之间的切换.近年来,切换系统的研究已经引起了相当大的关注.这
目的:探讨胃癌组织中p53蛋白和C-erbB-2蛋白的表达与临床病理特征及预后的关系。 方法:本研究采用免疫组织化学法(S-P法),对60例在延边医院经胃癌根治术且有完整临床随访资料
随着工业的发展,农田土壤污染问题越来越严重,其中重金属污染问题尤其突出。据统计,我国耕地土壤污染总的超标率为19.4%,其中镉污染问题尤其突出。土壤受镉污染后,会通过生物富集作用进入人体,危害人体健康。目前土壤镉污染的植物修复技术是研究的热点。有研究发现,烟草对镉具有较强的富集能力且生物量大,有望用于农田土壤镉污染的修复。本研究筛选了对镉具有高富集能力的烟草品种,并研究了外源添加硫素强化烟草富集镉
背景:目前,细胞因子治疗肿瘤是目前的研究热点之一。研究发现细胞因子通常具有双重作用,既可提高机体的抗肿瘤免疫反应,又可促进肿瘤细胞生长和浸润,而后者往往被人们所忽视
目的:研究磁共振多序列联合诊断对胰腺癌的诊断价值与意义,并探讨胰头癌的特异性MRCP征象以期提高MRCP的定性诊断价值。材料与方法:对33例临床怀疑胰腺占位患者进行磁共振检
中国的改革开放已快历时四十年,随着中国经济全球化的水平不断提升,中国的教育也越来越国际化。尤其是大部分一二线城市,从幼儿园开始就开展英语夏令营之类的外教课程活动,从
本文针对在应用较广和较新的课题——模糊优化研究中,提出的多样化的模糊优化模型和其相应的解法中存在的退化、参数影响和算法效率等问题,借助于现有模糊线性规划理论和算法
近年来,由于化石能源的短缺和电力需求的快速增长,以分布式发电为基础的微电网技术在电力系统中的应用更加的广泛。微电网中分布式电源大多通过逆变器作为接口变换器连入公共耦合点,多分布式电源的接入形成了微电网中多逆变器并联的环境。下垂控制作为并联微网逆变器的主要控制方式,无需通信线路即能实现功率的合理分配,具有很高的冗余性,然而传统下垂控制是基于高压条件下线路呈感性特征得出的,在低压微电网中,并联逆变器很
目的通过测定实验大鼠肺泡内粉尘和煤矿开拓区粉尘的二氧化硅的含量、成分、分散度、形貌、产生自由的能力并进行综合分析,探讨粉尘进入机体后,其性质(尤其是致病能力)可能发生的变化。方法收集邯郸煤矿开拓区粉尘初筛后,使用400目筛子湿筛回收粉尘。大鼠分为:染尘组5组(使用收集并筛分的开拓区粉尘)、生理盐水组1组(使用生理盐水)。利用筛选得到的粉尘配置成50mg/mL的悬浊液,每次染毒剂量为粉尘悬浊液1ml