基于协同聚类的支持向量机分类方法的研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:wenlimm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,数据挖掘技术越来越为人们所重视。而分类是数据挖掘领域当中一个非常重要的问题,聚类算法和支持向量机在处理分类问题上都表现地非常的出色,成了当今数据分类的两种十分有利的工具。其中,聚类算法能够把大量数据点的集合分成若干类,使得每个类中的数据之间最大程度地相似,而不同类中的数据之间最大程度地不同。而支持向量机作为目前统计学习理论的VC维理论和结构风险最小化原则的具体实现算法,它能够很好的解决传统机器学习中的维数灾难和局部极小值等问题,并且建立预测准确率高的分类器。   针对大规模数据集学习时,支持向量机难以满足实际应用的需求。针对此问题,在研究和分析目前有关算法的基础上,将支持向量机和聚类算法相结合,提出了基于协同聚类的支持向量机分类方法。并在UCI数据集上,将该分类方法与SMO算法以及RSVM算法相比较,验证了该分类方法能够有效的简约支持向量的数量,提高分类精度,减少分类时间。   本文所做的工作主要有:   (1)对最小二乘支持向量回归算法(LS—SVR)进行了改进,对LS—SVR的最优化问题作了一定的改进,得到一个线性方程组。改进后的LS—SVR只需要对这个线性方程组求解,大大简化了求解过程。   (2)提出了基于协同聚类的二类支持向量机(CC—SVM),通过协同聚类算法得到的类中心来取代简化的支持向量机(RSVM)中随机选取的候选支持向量。通过实验证明,CC—SVM算法能够有效的简约支持向量的数量,提高分类效率。同时,将分类问题进一步的推广到支持向量机的多类分类问题,提出了基于协同聚类的多类支持向量机。   (3)提出了基于协同聚类的支持向量回归机(CC—SVR),首先利用LS—SVM算法进行回归,再进行协同聚类,最后利用改进的LS—SVR进行回归。通过实验证明,基于协同聚类的支持向量回归机(CC—SVR)较之于单纯的LS—SVR回归,能够有效的简约支持向量的数量,提高分类速度。  
其他文献
随着信息技术的发展,新型的数据流模型出现在数据挖掘领域中,这使得该领域的发展出现了新的挑战。由于数据流的动态性,使得已有的针对静态数据的成熟挖掘技术无法对这种连续
随着社会对信息化的要求越来越高,嵌入式技术获得了更广阔的发展空间。嵌入式技术的发展促使各种智能移动设备广泛的应用到社会的各个方面,而PDA(Personal Digital Assistant
多网接入平台支持GSM/TD-SCDMA/TD-LTE等多网络信号覆盖,同时提供宽带接入到桌面RRU(Remote Radio Unit:射频拉远单元)模式接入,其硬件结构不同于传统的直放站,因此现有直放
人脸识别技术因具有重要的科学意义和实用价值,在近几年得到了研究者的高度重视,成为当前模式识别和人工智能领域的一个研究热点。它可以广泛地应用到安全部门、身份鉴别、电
网格是一种新型的分布式计算技术,网格充分利用互连网络中现有的软硬件资源,支持广域环境上的计算、数据、存储、信息和资源共享,消除信息孤岛,协同解决大型应用问题,以较低
无线传感器网络是一种由数量庞大的微型传感器节点构成的网络系统,这项技术逐渐成为各个国家科研机构的重点研究对象。该技术具有十分广阔的应用前景,有权威杂志和媒体就评价
测试用例是软件测试技术中的核心角色,测试用例的人工生成不能满足现代软件开发的需要,使得测试用例自动生成成为研究热点。在测试用例自动生成方法中,有基于规格说明和基于
随着大规模存储技术、互联网及数字通信业务的迅速发展,电子出版、数字图书馆、互联网网站以及移动通信正在引发着不断膨胀的文本海啸。这种快速、无序的信息增长对于信息的使
并行测试主要目的就是提高测试系统运行效率,多个测试任务同时运行,降低设备闲置时间,系统资源得以有效利用。并行测试中的任务调度的优化是并行测试技术的核心问题,建模和分