RBF网络在数据挖掘中的应用研究及其算法改进

来源 :中山大学 | 被引量 : 0次 | 上传用户:kelly_0810
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从大量数据中挖掘出有用的信息正成为一个迫切需要解决的问题,正是这种需求推动了数据挖掘技术的发展。数据挖掘经常要面对一些有噪声、杂乱、非线性的数据,而神经网络具有良好的鲁棒性、自适应性、并行处理、分布存储和高度容错性等特点,因此神经网络非常适合用来解决数据挖掘的一些问题。 RBF网络是人工神经网络中最受关注的模型。RBF神经网络的基本思想是用径向基函数作为隐单元的“基”,构成隐含层空间,隐含层对输入矢量进行变换,将低维的模式输入数据变换到高维空问内,使得在低维空间的线性不可分问题在高维空间内线性可分。 在RBF网络中,隐含层节点的选择是一个非常重要的因素,本论文对目前RBF隐含层中心点的选择问题的几种通常的解决办法进行了介绍分析。K-均值算法是中心点选择算法中最常用的一种算法,本文重点研究该算法在RBF网络构造中的应用,对其进行了改进以使其能适用于高维和分布复杂的数据。研究工作如下: (1)介绍了目前RBF隐含层中心点选择问题的几种通常的解决办法。 (2)分析了用欧氏距离度量时K-均值算法易受噪声影响的缺点,从而引入了高斯基距离度量,并且关注初始中心点的选择,实证分析了基于距离优化的K均值RBF中心点选择法。通过实证分析,验证了高斯基距离度量比欧氏距离度量能够改进各种算法的效果,高斯基距离度量是高维复杂分布的数据的理想的距离度量方法。 (3)针对K-均值算法易受初始化中心点影响的问题,本文提出一种改进的算法,即基于分箱的K均值RBF中心点选择法。本方法将分箱思想引入聚类算法中,利用分箱函数将原数据映射到不同的单元中,然后按照单元密度的大小进行初始中心点的选择,从而对K均值算法进行改进,使其用于RBF中心点选择时可以适用于高维复杂数据。通过对各种方法进行实证分析,验证了本文提出的改进算法的有效性。
其他文献
图像插值需要把待插值像素映射到原始图像的某个“位置”,因而要通过对这个位置周围“存在”的像素应用预先定义的插值函数求取其灰度值,其本质是通过低分辨率像素的灰度值“
局部上同调理论是研究代数几何和代数拓扑的重要工具.许多数学家对局部上同调理论进行了研究,并将它进行了发展.对于有限生成模的局部上同调模,很多学者已经进行了研究并得出了很
最近,空间动力学性态在捕食被捕食系统中引起了广泛关注。本文主要研究捕食被捕食反应扩散模型的图灵斑图结构和行波解。 在第二章中,研究了基于经典Bazykin模型的反应扩散