不同损失函数的结构模糊孪生支持向量机算法研究

来源 :河北大学 | 被引量 : 1次 | 上传用户:liongliong422
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
孪生支持向量机是受广义特征值支持向量机启发而提出的一种学习算法,如今它已成为机器学习的重要研究内容之一。由于孪生支持向量机具有的良好分类性能和快速学习能力,因此,它吸引了越来越多研究人员的关注,并且对其进行了较深入的研究,提出了多种不同的孪生支持向量机算法。然而,对于提出的一些算法,为了衡量模型的优劣,它们主要采用了铰链损失(Hinge loss)函数,而此损失函数易导致噪声敏感性和重采样不稳定性。为了进一步提高孪生支持向量机的性能,本文分析研究了几种不同的损失函数,给出了这些函数存在的优点与缺点,在此基础上,基于L1损失函数与Pinball损失函数,并通过引入结构信息和模糊隶属度,对不同损失函数的结构模糊孪生支持向量机进行了研究,具体内容如下:(1)分析研究了分类和回归领域中的损失函数,主要包括0-1损失函数、铰链损失函数、Pinball损失函数、L1损失函数以及L2损失函数,并针对每种损失函数,给出了它们存在的问题以及各自的特点,同时,对L1损失函数和Pinball损失函数具有的优势进行了阐述。(2)基于L1损失的结构模糊孪生支持向量机算法的研究。在L1损失的孪生支持向量机中,为了获得两个非平行超平面,该方法只考虑了样本的类间可分性,而忽略了样本类内的潜在结构信息。另外,该算法并未考虑不同样本对分类决策面的影响,从而使得该方法的泛化性能和抗噪性能较低。为此,在L1损失的孪生支持向量机的基础上,将样本中的结构信息和不同样本的作用引入到该孪生支持向量机中,构建了基于L1损失的结构模糊孪生支持向量机模型,通过求解此模型,提出了基于L1损失的结构模糊孪生支持向量机算法。(3)基于Pinball损失的结构模糊孪生支持向量机算法的研究。为了进一步提高孪生支持向量机的性能,基于L1损失的推广函数,即Pinball损失函数,并考虑样本中的结构信息以及每个样本所起的不同作用,构建了Pinball损失的结构模糊孪生支持向量机模型,利用优化方法对模型求解,提出了基于Pinball损失的结构模糊孪生支持向量机算法,较好的解决了噪声数据对算法的敏感性,以及重取样的稳定性。(4)选取UCI标准数据集与人工数据集,通过使用五重交叉验证法,对提出的算法进行了实验,并与典型的孪生支持向量机算法进行了比较;同时,对结构信息和模糊隶属度的不同获取方法进行了实验研究。
其他文献
辽朝是契丹人于10世纪初在北迁汉人帮助下建立的政权,实行“以国制治契丹,以汉制待汉人”的“因俗而治”统治政策,对从事畜牧业生产生活的契丹、奚、室韦、乌古、阻卜、党项等民族,采取传统的以部族为基本单位进行统治。根据与辽朝中央政府亲疏关系的差异,诸多部族可以划分为五种类型:诸斡鲁朵与“辽内四部族”、契丹部族、国家控制下非契丹部族、半羁縻半控制部落、羁縻部落,不同类型的部族分布于不同的游牧区域,从事有序
监所巡视检察制度是刑事执行检察的方式之一,该制度于2012年2月由最高人民检察院监所检察部门《意见》首次确立。监所巡视检察制度是具有中国特色的一项刑事执行检察制度,该制度总体运行良好,但是也存在流于形式、检察结果不公开等固有的弊端。本文从规范和实践两个层面对该制度进行分析,梳理总结了确立的背景及取得的重大成绩,分析研究了该制度在运行中存在的问题,提出了完善该制度的具体措施,旨在对我国监所巡视检察制
近些年来,我国不少科研人员套取科研经费案件被曝光引起公众广泛关注。针对该类行为,司法实务部门和理论界学者存在两种截然不同的处理意见,第一种意见认为行为应该做非罪化处理,第二种意见认为应该进行有罪认定。科研经费的性质问题、科研人员是否具有国家工作人员身份以及科研人员在套取经费时是否存在职务便利是正确分析行为性质的争议焦点。单纯的科研活动不属于从事公务,然而纵向科研经费来源于国家或者地方财政拨款,属于
蒙古族自古以来有着立碑纪念自己的祖先以及杰出英雄的传统。留存至今的蒙古文碑刻文献不仅以独特的载体形式保存大量的书法篆刻艺术,也成为了研究当时的经济、政治、军事、文化发展的重要物证,而且对补正前贤的阙失、考订典籍的讹谬等方面有很大助益。在明代,由于佛教在蒙古地区的广泛传播,因此修建寺庙并且大量翻译佛教经典的同时出现了很多记载寺庙修建史、歌颂德高望重的活佛以及施主功德的碑刻文献。因此,本文以明代蒙古文
梁启超将中国传统学术形态按其特征依次划分为先秦诸子学、两汉经学、魏晋玄学、隋唐佛学、宋明理学以及清代考据学六个阶段。清代学术作为中国传统学术的最后形态,其风貌特质与宋明理学可谓迥异。讲求谈心论性并以形而上的主观哲理性思辨为特色的宋明理学,何以在清代被考经证史、以形而下的客观考察为究心所在的考据学所取代,引发着历代学人的思索与解释。从清末民初章太炎、梁启超提出“政治高压”说后,学界以从外缘因素分析考
气体传感器在环境监测、疾病检测、人工智能、石油化工等领域有着广泛的应用。半导体气体传感器因具有灵敏度高、稳定性好、响应速度快等特点,一直是传感器领域的研究热点之一。气敏材料的敏感特性直接影响着气体传感器的性质,目前,除掺杂、修饰等主要方法外,制作异质结也是重要的增敏方式,因而将多种材料复合形成异质结也成为了行业的热点之一。但是,现在的研究普遍集中于纳米异质结的构建,而对大面积宏观异质结的构建及气敏
随着通信和互联网技术的飞速发展,多模态数据急剧增加。海量的多模态数据在方便用户的同时,也对信息检索技术提出了新的挑战。为了更好的满足用户对模态数据检索的需求,同时使计算机具有模拟人脑对海量的多模态数据进行认知、学习以及推理决策的能力,跨模态检索技术应时而生。深度神经网络类似于多层非线性投影,拥有比浅层方法更强的映射能力,可以充分提取不同模态的多阶抽象表示。其中,生成对抗网络能有效拟合多模态数据的分
非法经营罪属于行政犯罪,空白罪状和兜底条款的立法模式使其与仅具有行政违法性的非法经营行为的界分颇有难度,进而导致此类案件行政违法和刑事犯罪衔接不畅,引发非法经营罪适用扩大化、行政规制空间被不合理压缩等问题。因而本文以行政违法与刑事犯罪的衔接问题为关注点,对非法经营案件进行研究。本文分为五个部分,除引言和结语之外共约3.1万字,主要内容概括如下:第一部分,非法经营案件行刑衔接的现实困境。非法经营案件
在当今社会,手机和个人电脑等智能终端的普及在给人们生活提供便利的同时也带来了一系列的问题。一方面,终端上出现的各种图片和视频编辑工具使得针对原始数据的篡改变得更加容易,从而导致一系列的盗版问题;另一方面,随着多媒体数据内容的多样化,针对不同类型的多媒体数据的安全保护和认证变得更加困难。其中,作为数据安全保护、认证的一项重要技术手段,数字水印技术在近十年来得到了迅速的发展,在解决版权保护、票据防伪等
《中国佬》是华裔作家汤亭亭的另一著作,讲述了汤家四代男性在美国的工作和生活经历。自出版以来,便在美国文坛取得了巨大的成功。纵观全文可见,《中国佬》无论是在语言,还是