Lp正则化在支持向量机中的应用研究

被引量 : 0次 | 上传用户:tuniao1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
正则化方法用近似解来逼近原不适定问题的解,是在工程技术领域中解决不适定问题的重要数学方法。在机器学习领域中,不同的正则化方法对同一机器学习方法来说具有不同的学习性能。如何选择正则化方法是机器学习研究领域中的一个重要话题。传统统计学习方法只最小化经验风险,往往会产生过学习问题。要提高分类器的分类性能,需要增加训练样本量和凭借专家经验来选择分类函数模型。而统计机器学习方法提出了分类函数的VC维、泛化能力、泛化能力的界以及结构风险等理论,并指出,在训练分类器时同时最小化经验风险和置信范围可以降低分类函数的复杂度,解决过学习问题和小样本问题,以及提高分类器的泛化能力。当遇到有些样本的分布是线性不可分时,如果采用线性分类模型进行分类,其分类性能就会很差。此时可以利用非线性映射方法把原输入样本空间映射到更高维甚至是无限维的特征空间,在特征空间中可以实现线性分开这些样本。在实际应用中,可以利用满足Mercer定理的核函数内积来代替这种非线性映射方法。针对只遵循ERM准则的机器学习方法会产生过学习的问题,现有支持向量机在经验风险一定的情况下,通过引用Lp(p=2,p=1)正则化来降低分类函数的VC维,实现SRM准则,能够解决过学习问题和小样本问题,提高了分类器的泛化能力。本文的主要工作有:(1)对正问题、反问题、不适定问题、Moore-Penrose广义解、广义解的不稳定性、正则化原理、正则化方法、统计机器学习原理以及统计学习理论中的VC维、泛化能力、泛化能力的界、SRM准则等与支持向量机相关的基础性理论作了详细的探讨。(2)在有监督学习框架下和半监督学习框架下,探讨了Lp(p=2,p=1)正则化线性支持向量机方法和核支持向量机方法,以及流形正则化支持向量机,并利用这些方法对合成的两圆数据集和现实的四种两类数据集进行了分类性能的比较实验,验证了核支持向量机把非线性可分样本映射到高维特征空间中后,能够实现线性分开这些样本,以及引入训练样本的内蕴几何信息,可以提高支持向量机的分类性能,同时得出各数据集的分布特点以及各算法的分类性能特点和ROC曲线特征。(3)结合稀疏思想及现有平滑函数的优点,采用高斯平滑函数集来逼近Lp(p=0)正则化项,提出了平滑稀疏正则化支持向量机,详细探讨了其优化步骤。平滑稀疏正则化支持向量机可以训练出模型更简单的分类器,并具有样本特征选择的特性。并与现有支持向量机算法在5个两类和多类数据集上进行了实验比较,得出了平滑稀疏正则化支持向量机方法的有效性。同时发现,对于多类数据集来说,内在分类器模型具有一定的复杂性,而训练出来的分类器对多类数据集来说不是越简单越好。
其他文献
高考是一场没有硝烟的战争,要想让学生在高考中金榜题名,必须让他们具备过硬的专业技能、过硬的心理素质。声乐是高考的一门专业课,让学生具有扎实的声乐基础知识,具有过硬的
目的:探讨中西医结合药物保守治疗中医辨证为气滞血瘀证未破损型异位妊娠的临床疗效,通过临床病例观察,将化瘀消癥方和甲氨蝶呤(MTX)联合应用与单纯MTX的应用对病例的影响作对
在中国科技学术期刊科技新闻的发展远滞后于西方同行这一现实背景下,本文阐述科技新闻对于科技学术期刊的重要性,总结国内外著名科技学术期刊的科技新闻报道与传播经验,基于
<正>从事低年级数学教学工作多年,我深深地体会到:一二年级的孩子存在着注意力不集中、容易走神的现象。但老师们往往希望孩子们可以坐得端正,站得笔直!这样的确秩序好、易于
智能故障诊断技术为保障工程技术系统的可靠性和安全性开辟了新的途径,随着系统设备和功能的日益复杂化,发生故障的机率以及由此带来的损失越来越大,现有单一、固定的故障诊
<正>征解41结果公示1.本例诊断预激综合征伴房颤及快速心室率2.答案情况本期收到答案52份,正确答案20份1~3名:丛鹏(山东省梁山县红十字会博爱医院);邸成业(泰达国际心血管病
随着工业化进程步伐的加快,我国城市化水平不断提高,城镇生活污水和工业废水的排放量连年增加,地表水富营养化问题日益突出。为改善水环境,各地开始相继建设城镇污水处理厂。
当分配正义被广义地理解为是处理各种形式的利益与负担在人们之间如何分配的问题时,它就等同于社会正义。而狭义的分配正义则只处理经济上的利益与负担的分配问题。本文讨论
法治理念是反映法治的性质、宗旨、结构、功能和价值取向的理性观念,是人们对法治的理性认识与对法治的信仰和追求。律师文化以律师为主体、体现在律师执业过程之中、反映律师