【摘 要】
:
支持向量机基于结构风险最小化,是由Vapnik等人在统计学习理论基础上提出来的。由于SVM具有很好的泛化性能和推广能力,能够较好的解决小样本、高维数、非线性以及大规模的实
论文部分内容阅读
支持向量机基于结构风险最小化,是由Vapnik等人在统计学习理论基础上提出来的。由于SVM具有很好的泛化性能和推广能力,能够较好的解决小样本、高维数、非线性以及大规模的实际问题,因而得到了广泛的应用。随着信息时代的到来,信息产生和传播的速度迅速提高,数据库的规模也越来越大,如何从海量数据中挖掘有用的信息,已经引起人们越来越多的关注。本文在对国内外研究现状进行综合分析的基础上,进一步对大规模训练集上的SVM进行了深入研究。首先,分析了支持向量集在加入新样本后支持向量和非支持向量的转化情况。针对淘汰机制效率不高的问题,提出了一种改进的SVM增量学习淘汰算法——二次淘汰算法。该算法经过两次有效的淘汰,对分类无用的样本进行舍弃,使得新的增量训练在淘汰后的有效数据集进行,而无需在复杂难处理的整个训练数据集中进行,从而显著减少了后继训练时间。其次,在最小二乘支持向量机的基础上,根据局部核函数和全局核函数的各自优点,提出了基于一种基于最小二乘支持向量机的组合核函数方法。并且通过仿真试验实现所提算法和原有算法,与原有算法进行比较分析,该方法较原有算法体现出较好的分类性能。最后,在已经存在的二叉树多类分类方法的基础上提出了一种改进的基于二叉树多类分类算法。确定二叉树多类分类的类别分割顺序是二叉树多类分类的重点和难点,该算法通过使用Clara聚类算法确定二叉树多类分类的类别分割顺序。
其他文献
中国互联网络信息中心(CNNIC)2010年1月发布的第25次中国互联网络发展状况统计报告指出,在3.84亿网民中,约3.21亿网民使用网络音乐应用,网络音乐以83.5%的使用率高居互联网应
文本聚类是聚类方法与自然语言处理相结合在文本处理中的应用,是聚类分析领域的一个重要研究分支。随着近年来互联网新闻文本信息的急剧增多,文本聚类的方法得到了很广泛的应
图形信息处理是包装印前领域的重要组成部分。在包装印前处理的很多方面,都需要图形轮廓算法的支持。因此二维图形轮廓算法在包装印前处理领域占有重要的地位。在包装印前领
当前的电子行业竞争激烈,大部分企业为提高生产效率都进行了企业信息化建设。虽然企业越来越重视信息化建设,但还是存在信息化技术单一、各系统集成度不高、现有软件不够灵活
过程神经元网络(PNN)是人工神经元网络的一种泛化模型。一个能有效训练PNN网络结构和权函数的学习算法是发挥PNN强大逼近能力的关键。PNN的现有学习算法主要基于“正交基函数展
近年来,随着Internet的普及与多媒体技术的迅猛发展,人们面临着爆炸式增长的视频信息。在这些海量视频之中存在着的大量相似视频,一方面造成了多媒体数据库的冗余,要求更加巨
本课题重点研究基于径向基函数(RBF)神经网络的动态流量软测量建模方法及实用化技术。针对液压伺服系统中对动态流量软测量模型实时性和精确性的要求,对RBF神经网络建模算法
随着信息技术的发展,三维GIS在地质、矿山、数字城市等各个领域的应用越来越广泛,也带来了一场信息化的变革,尤其是改变了长久以来人们对于各地质对象的表达方式。
空间实
随着计算机网络、数据库、多媒体等技术的飞速发展和日益普及,越来越多的应用系统产生了海量的流式数据。这些流式数据中包含着大量的信息和知识,因此对基于流式数据的联机多维
21世纪随着信息时代的飞速发展,带来的变化也日新月异,随之而来将是愈发激烈的竞争。谋生存,求发展,将是每个企业必须关注的长久大计。一方面在这个激烈的竞争过程中,技术的更新与