论文部分内容阅读
当今人类社会已经进入了大数据时代,数据大多呈现出维数高、规模大、结构复杂等特性。在大数据的研究当中,许多数据如媒体数据、遥感数据、生物医学数据、社交网络数据、金融数据等都是高维数据,尤其是在人类生产生活中,含高维数据的无解析模型或一次候选解的评价计算成本十分巨大的昂贵多目标问题,对其仿真求解势必面临维数灾难。因此,寻找合适的降维方法处理高维数据已是迫切需求。神经网络是模拟人脑的结构和功能而建立起来的分布式信息处理系统,面对高维多目标优化等非线性问题,与其他降维方法相比,神经网络具有巨大的优势,这得益于神经网络具有高度非线性、结构复杂、自学习、自适应等特点。RBF神经网络是一种新颖有效的前馈式神经网络,它具有很强的非线性映射能力,能以任意精度全局逼近一个非线性函数,而且学习速度快。利用RBF神经网络实现对高维数据的降维预处理,不仅有充分的理论依据,而且更具优越性。本文在对RBF神经网络算法进行优化研究的基础上,研究了基于数据驱动的特征选择RBF神经网络降维方法,并将其应用在高维多目标优化决策空间降维预处理及Pareto优劣性预测中。为了提高RBF神经网络的学习效率,本文首先对RBF神经网络进行改进研究。通过自适应调节RBF神经网络的学习率和动量因子,加快了RBF神经网络的收敛速度;同时,利用遗传算法对RBF神经网络的三个参数初始值进行优化设计,提出了一种遗传自适应RBF神经网络算法。将改进算法分别应用于故障诊断和UCI数据集的分类实验上,验证了改进RBF神经网络算法的有效性和优越性。针对无解析模型的高维多目标优化问题,提出了一种最大信息系数与最大相关最小冗余相结合的特征选择方法,利用遗传自适应RBF神经网络算法在高维特征空间中选取出了一个低维的特征子集,从而实现对高维特征空间的降维。通过在UCI数据集上的分类实验,证明了该降维算法在保证较好分类精度的前提下,大大减少了计算成本。为了降低高维多目标优化的维数灾难,将本文提出的基于最大冗余最小相关的遗传自适应RBF神经网络特征选择算法用于多目标优化中的决策空间降维预处理,进行Pareto优劣性预测并将其嵌入MOEAs算法。通过与NSGA-II的实验效果对比,结果证明了本文提出的遗传自适应RBF神经网络特征选择算法在保证得到一个可接受的Pareto最优解的前提下,大大减小了计算成本,避免了维数灾难。