论文部分内容阅读
野点是指集合中严重偏离大部分数据所呈现趋势的小部分数据点。在一些应用领域中,如数据库中的知识发现、机械设备运行状态监测等,野点能提供比正常数据点更多、更重要的信息,是发现新知识、确定新状态的有力手段。已有学者把支持向量机应用于野点检测中取得了一定的成果,但是它需要选择核函数、调整参数等繁琐的工作,并且对数据变化的适应能力不高。
从20世纪80年代初神经网络的研究再次复苏并形成热点以来,发展非常迅速,特别是在应用上已迅速扩展到许多重要领域。本文把人工神经网络的方法应用到野点检测中,给出一种新的野点检测的方法。
以下是本文的主要研究成果:
(1)根据GHSOM算法和GHTSOM算法的发展思想,对野点检测的SOM算法做出改进。首先,利用GHSOM算法增长的思想,让标准SOM结构增长,可以对结构简单的含有一个野点的数据分离出野点;然后,利用平均量化误差的思想,引进一个系数,可以对结构比较简单的含有多个野点的数据分离出野点,但对系数的依赖性比较大,适应能力低;最后,利用GHTSOM算法的思想进一步改进算法,在GHTSOM算法中,每个子SOM结构的神经元个数固定为三个,为了提高稳定性,本文中把每个子SOM结构的神经元个数固定为两个,可以对结构复杂的含有多个野点的数据分离出野点,并且适应性比较高。
(2)改进后的算法能够分离出野点,可以成功应用于野点检测。并且给出了不同的野点检测的例子,分析了算法的性能和扩展能力,性能比较稳定,对不同数据的适应能力比较强。
(3)与野点检测的支持向量机方法相比,该人工神经网络方法的优点有:不用选择核函数;不需要对核函数的参数不断进行调整;能很好的适应数据分布的变化。