论文部分内容阅读
在科学研究和日常生活中经常会遇到高维数据,它提供了极其丰富详细的客观信息。高维数据分类是科学研究中的一项重要内容,如何提高高维数据分类的精度是分类技术中的关键问题,具有十分重要的意义。近年来,随着人工神经网络的发展,人工神经网络已成为了分类技术的一项重要工具。
本论文解决在降低计算量、确保高维数据的神经网络分类精度方面,提出了先降维后分类的两步方法。在降维方面,主要是使用主成分分析(PCA)和小波变换的方法来实现高维数据的降维。PCA是一种经常使用的数据降维/特征提取的方法。这种降维方法是通过一个标准正交线性变换将数据空间映射到较低维数的相互正交的特征空间上,使特征空间较好的保留原始数据特征的方法。小波变换是一种信号的时间一频率分析方法,它具有多分辨率分析(Multi-Resolution Analysis)的特点,而且在时域和频域都具有表征信号局部特征的能力,是一种窗口大小固定不变但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法。通过降低输入维数可以降低神经网络权值矩阵的数目。在高维数据分类方面,讨论了神经网络的BP算法和两种不同类型的BP学习方法,这两种学习方法提高了收敛误差率、提高了神经网络的分类精度。这两种学习方法是在传统的BP算法的基础上改进的——高阶微分BP学习方法、扰动BP学习方法。高阶微分学习方法是根据对误差函数的一阶求导和二阶求导相结合更新网络权值的学习方法。扰动BP学习方法是分两步来更新网络权值的方法,在该方法中,首先用传统BP算法更新网络权值,然后在此基础上,用误差函数梯度模数的导数作为扰动更新BP网络权值。这种方法极大地提高了BP网络收敛速度,增加了网络分类的样本识别能力。为了说明上述方法的有效性,进行了仿真数据的分类,并对应用传统BP、高阶微分BP和扰动BP对原始高维数据、小波降维数据和PCA降维数据的分类精度和误差收敛速度进行了讨论。仿真结果说明,先运用PCA和小波变换对数据进行将维,再进行扰动BP网络进行高维数据的分类可极大的提高数据的分类精度和训练速度,是一种较为有效的分类方法。