【摘 要】
:
支持向量机(Support Vector Machine,SVM)是Vapnik等人提出的一种以统计学习理论为基础、以解决有限样本为目标的机器学习新方法,因其泛化能力强等特点而广泛使用.通过转化SVM的目标函数、优化等式约束,可将其简化为最小二乘支持向量机(Least Squares SVM,LSSVM).这一改进有效的降低了计算复杂度,但是LSSVM使得几乎所有的样本点都作为支持向量参与计算,解
论文部分内容阅读
支持向量机(Support Vector Machine,SVM)是Vapnik等人提出的一种以统计学习理论为基础、以解决有限样本为目标的机器学习新方法,因其泛化能力强等特点而广泛使用.通过转化SVM的目标函数、优化等式约束,可将其简化为最小二乘支持向量机(Least Squares SVM,LSSVM).这一改进有效的降低了计算复杂度,但是LSSVM使得几乎所有的样本点都作为支持向量参与计算,解向量稀疏性的丧失将影响分类速度.因此,LSSVM模型的稀疏性问题逐渐被大家关注并研究.目前已出现一些稀疏化方法,包括L0和L1稀疏化方法,但如何高效的实现解向量的稀疏性仍是需要进一步研究的问题;同时,模型中罚参数的选择问题也是很有价值的一个研究方向.本文考虑了分类问题的对偶稀疏支持向量机模型,理论上首次给出了该分类模型中L1-罚参数选择的上界.此外,对大规模数据集给出了一种新的样本筛选方法,该方法适用于类中心连线与分类超平面较为垂直的情况.最后,利用UCI数据库中的5个数据集及双曲螺旋样本完成了初步的数值实验,并将其应用到了博文分类这一实际问题上.论文主要研究了以下四个方面的内容:1、将部分Lagrange乘子的L1-范数添加到LSSVM分类模型的对偶问题上,构建了对偶稀疏支持向量机模型,证明了该模型可等价转化为Lasso问题的形式;2、利用优化理论给出了该模型中L1罚参数选择的上界,数值实验结果支持了该理论结果;3、对于大规模的数据集,依据样本点所处的位置给出了一种样本筛选方法.将筛选后的样本直接作为训练集,再运用稀疏支持向量机求解,可实现双重稀疏化处理;4、将模型应用到了微博博文文本的二分类问题,利用UCI数据库中的5个数据集和双曲螺旋样本,使用Matlab、Python完成了初步的数值实验.数值结果表明了模型在利用的大部分数据集上均有相对较好的分类精度、较少的支持向量和计算时间.本文第1章介绍了文本分类、SVM、LSSVM及稀疏LSSVM的相关研究;第2章介绍了LSSVM、三种不同的稀疏LSSVM模型;第3章提出了基于Lasso的对偶稀疏支持向量机模型,给出了模型中罚参数的上界及大规模数据集样本筛选方法;第4章给出了数值实验结果、在博文分类问题上的实际应用.最后,总结和展望.
其他文献
目的:近年来,发展中国家迅速上升的糖尿病患病率和仍然严重的结核负担,已成为结核防控面临的重大挑战。研究表明,糖尿病(diabetes mellitus,DM)患者是发生肺结核(pulmonary tuberculosis,PTB)的高危人群,在糖尿病患者中,结核病发生风险是普通人群的2.48.3倍。已有研究发现,与正常人群比较,PTB患者、DM患者血清锌(Zn)、硒(Se)元素含量降低,血清铜(C
伴随着高级自动化课题中机器人技术的持续发展,机器人的应用越来越引人注目,其中的假肢机器人作为医疗机器人未来发展的研究方向之一,具有着重要的研究价值。这会给假肢机器人的发展带来很大的推动作用,同时也对假肢机器人的运动性能提出了更高的要求。对于假肢机器人的运动性能来说,其逆向运动学的求解与运动轨迹规划等问题就会显得尤为重要,它们将在很大程度上影响到假肢机器人的运动性能。本文就以上问题进行了研究分析,首
随着移动通信网络中移动设备数量的激增,网络中移动数据流量随之呈爆炸式增长。未来移动通信系统面临的一个重要的挑战,是使用有限的基础设施承载异常高的流量需求。为降低网络的建设成本及运维成本,无线接入网络(Radio Access Network,RAN)架构演进为基于无线单元(Radio Unit,RU)、分布式单元(Distributed Unit,DU)及中心单元(Central Unit,CU)
近些年来,随着我国智慧城市以及天网系统等项目的不断开展,视频目标跟踪技术得到了广泛的应用,如智慧城市中的智能监控,天网系统中的人脸识别以及目标跟踪等,同时也对目标跟踪技术提出了更高的要求。视频目标跟踪一直是计算机视觉领域的一个热门议题。自从2010年David SBolme第一次将相关滤波应用到视频目标跟踪领域以来,许多学者对基于相关滤波的视频目标跟踪算法进行了深入研究,以期提高视频目标跟踪的准确
区块链技术是以一种巧妙综合了多个领域技术的一种新型系统架构,具有去中心化,不可篡改,透明可追踪等特点。智能合约是一种可以自动化执行交易的计算机协议,其被提出的初衷是为了自动化交易过程,但由于缺乏可信的执行环境,智能合约发展一直止步不前。借助区块链技术所提供的可信环境,智能合约被引入区块链技术体系。用户通过把智能合约部署在区块链中,使得智能合约能够在区块链环境中执行。智能合约扩展了区块链系统的功能,
近年来装备制造企业对产品识别系统(Products Identity System,简称PIS)的重视程度越来越高,国外的知名大型企业和国内华北、华中等发达地区的企业已经完成了PIS的建立。而东北地区内众多的中小企业产品识别系统的构建工作刚刚开始,作为中国制造业起源地的东北地区,如何振兴东北地区制造业一直是各学科领域研究热点。而中小企业又是国民经济的重要组成,因此本文试图从工业设计的角度,探讨如何
大数据技术的蓬勃发展,需要对海量数据进行高效保存和处理,从而对存储系统提出更高性能需求。基于日志结构合并树(Log-Structured Merge-Tree)实现的键值存储系统,在处理写请
互联网产业的飞速发展、国家信息战略工程的不断建设带来了海量的业务流量和多样的业务类型,使得传送网的规划设计更加复杂繁琐,即使是经验丰富的专业的设计人员也需要较多的时间。传送网规划软件的出现和应用较大程度上缓解了这个问题。然而通过对目前传送网网络资源的分析,对未来工程建设的预测和5G建设对传送网提出的要求可知,传送网的网络规模一直在持续并迅速地扩大,传送网规划软件也逐渐面临规划速率低下的问题。本文立
目的:研究分析离心力竭运动后和钝挫伤后大鼠骨骼肌自噬相关因子的时相性变化。方法:8周龄雄性SD大鼠42只,分为7组,每组6只:安静对照组(C)、离心力竭运动后即刻组(E0)、离心力竭运动后24小时组(E24)、离心力竭运动后48小时组(E48)、钝挫伤后即刻组(D0)、钝挫伤后24小时组(D24)、钝挫伤后48小时组(D48)。安静对照组在安静状态下,离心力竭运动和钝挫伤分别在即刻、24小时、48