【摘 要】
:
支持向量机(Support Vector Machine,SVM)是在统计学习理论的基础上发展起来的,是一种优秀的基于数据的机器学习算法,是一种功能强大的数据分类技术,具有严格的理论和数学基
论文部分内容阅读
支持向量机(Support Vector Machine,SVM)是在统计学习理论的基础上发展起来的,是一种优秀的基于数据的机器学习算法,是一种功能强大的数据分类技术,具有严格的理论和数学基础,在文本分类、字符识别、图像识别、人脸识别、指纹识别、蛋白质结构、基因检测等邻域有着广泛的应用。本文围绕字符识别技术,对字符识别预处理算法与支持向量机分类算法进行了深入的研究。在字符图像预处理方面,重点研究了灰度图像滤波算法、图像的倾斜检测和字符分割算法;在支持向量机分类方面,提出了一种新的快速的按类分级聚类(HierarchicalClustering by Category,HCC)支持向量机算法——HCC-SVM。本文的主要研究内容与创新点如下:(1)从脉冲噪声点检测的角度出发,提出了一种新的的灰度图像滤波方法,在噪声密度较高的情况下,仍然能保持良好的滤波性能,并且算法运行速度快。(2)利用首行文本在一条直线上并且上方没有文字干扰的特性,提出了一种基于首行文本行的倾斜检测方法,能够满足纯文本图像倾斜检测的需要,而且处理速度快。(3)利用文本的行间隔特性,提出了一种基于行列的字符分割法,能够在图像质量较好时,实现文本图像中的文字分割。(4)针对传统的支持向量机在训练大数据集数据时遇到的算法运行时间长和占用内存空间大的问题,提出了HCC-SVM算法,解决在大样本环境下算法的运行时间和空间问题。与传统的SVM算法相比,HCC-SVM可以极大地提高算法的运行效率;与基于随机抽样的SVM算法相比,HCC-SVM能够得到更高的分类效果。(5)采用暴力测试法,分析SVM算法的关键参数的选取,找出适用于测试数据集的最佳参数。
其他文献
随着GSM系统的广泛应用,系统中存在的一些安全缺陷正在逐渐显露:认证过程为单向过程,有可能受中间人攻击;加密方式是点对点方式,而不是端到端,导致短消息在固网上以明文方式
随着计算机科学的发展,傅立叶变换红外光谱仪在大气和海洋的测量中应用越来越广泛,并且对测量的精度要求越来越高,因此,分析它的测量误差来优化系统设计具有重大的意义。文章
随着十一五期间国家对铁路事业的大力支持和发展,我国的铁路运输业进入了一个黄金期,业务量快速增长。同时,与之配套的铁路专网通信业务量也有了迅速的增加。现有的铁路通信
在山体滑坡监测系统中,不仅对数据采集的准确性有严格要求,对信息预警的及时性、易晓性和可靠性也有较高要求。论文在完成了MPU-6050倾角传感器的数据采集与转换、CC2530节点的
无线自组织网络是由若干无中心、分布式的无线通信设备临时自由组合形成的一种无线分组网络。具有灵活性强,展开快速且抗毁性好等优点,成为无线通信技术发展重要方向之一。但
随着现代科学技术的发展,无线通信技术的优势使其在许多领域得到了广泛应用。使用有线的传输方式,将一个区域内各个设备通过通信总线连接的方法,虽然具有传输速度快的特点,但是在
投弃式海流剖面测量仪(XCP)是一次性使用的海流剖面观测仪器,主要用来测量海水温度、水流速度和水流方向。该类仪器为海洋调查、科学研究、军事应用提供了先进的测量手段。由
随着全球化的发展,越来越多的经济,文化,教育等活动扩展到全球。跨国公司在全球寻找最优生产资源,产品售往全球每一个角落,越来越多的学者出国接受国外教育,国际学术会议促进
雷达信号的恒虚警率(Constant False Alarm Rate, CFAR)处理技术是现代雷达信号处理的重要研究内容之一,在雷达目标自动检测中占有不可或缺的重要地位。CFAR处理技术的理论研
随着通信和计算机技术的发展以及大型视频图像数据库的出现,传统的基于文本关键字的图像检索方法逐渐不能满足人们对高效信息检索的需求。如何快速准确有效的检索查询所需的