竞争型神经网络及其在聚类分析中的应用研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:zl8232565
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘中一个重要的研究领域,传统的聚类方法在特定的情形下取得了良好的效果,但是当处理海量数据、具有复杂数据类型的数据集时,仍存在若干尚未解决的问题。 如今竞争型神经网络已经在模式识别、聚类等方面得到了广泛应用,并显示出与传统聚类方法相比所具有的优势。但是竞争型神经网络存在“死”点问题,某些神经元在竞争中可能始终未能获胜而成为“死神经元”,不仅造成神经元的浪费,而且造成训练误差偏大,无法达到训练误差的精度要求,不能很好完成它所担负的聚类或分类任务。另外神经网络受网络拓扑结构和训练样本的影响,对输入数据的冗余属性很不敏感,所以训练速度一般较慢。 粗糙集理论作为人工智能领域的一个新的研究热点,它可以弥补神经网络不能确定哪些知识是冗余的,哪些知识是有用的,训练规模过大和训练时间过于漫长的局限性。所以在数据挖掘过程中,粗糙集理论可用于数据挖掘的数据预处理部分。但是粗糙集理论只能处理离散属性,而实际生活中的数据大多数是连续的属性值,因此需要首先对数据进行离散化处理,这已成为粗糙集理论实用性的瓶颈。 本文提出利用改进的竞争型神经网络进行聚类的方法,主要研究内容和成果如下: 1.针对“死”点问题,深入探讨了LVQ神经网络并且通过引入阈值学习规则,均衡神经元获胜的机会,较好地解决了该类网络在遇到“死”点时训练误差偏大的问题。 2.针对粗糙集理论只能处理离散数据的局限性,提出了基于竞争型神经网络的连续属性离散化方法。首先使用条件属性与决策属性之间的决策关系来度量条件属性的重要性,并据此对条件属性按照重要性由小到大排序,然后利用竞争型网络分类功能找到连续属性的断点,从而实现了对连续属性的离散化。 3.根据上面提出的理论方法,首先解决了竞争型神经网络中存在的“死”点问题并对输入样本进行离散化处理,通过知识约简删除输入样本的冗余属性,简化了知识表达空间维数,然后将简化以后的样本数据作为神经网络的训练样本,从而达到了简化神经网络的输入规模和提高训练速度的目的。最后提出了一种新的基于改进型LVQ神经网络的聚类方法。 4.最后,在这些工作基础之上,作者将本文提出的聚类方法应用到河南省的土壤数据中,对土壤数据进行聚类,验证改进算法的有效性和正确性,实验结果表明该聚类方法的确很有效果。
其他文献
单核苷酸多态性(SNP,Single Nucleotide Polymorphism)的关联分析是研究复杂疾病和基因之间联系的重要方法,SNP主要是指单个核苷酸的突变而引起DNA序列改变,从而导致物种染色
图像作为重要的信息载体,是人类获取信息的重要来源,被广泛应用于人工智能、模式识别、智能交通等领域。图像品质的高低直接决定了人类能否真实准确地获取场景目标信息。在现
近年来,随着计算机应用技术的迅速发展与普遍应用,以网络和多媒体技术为基础的网络教育逐渐改变着传统的教育模式。网络多媒体教学系统是一种多媒体技术和网络技术结合的实时应
随着开放分布式计算的快速发展,面向服务的计算(SOC)和面向服务的体系结构(SOA)成为了软件领域的研究热点,SOC&SOA的核心思想是以服务为基本单位,通过服务重用和快速组合构建随
程序切片技术是一种重要的分析和理解程序的技术,具有简化程序,缩小目标范围的特点。程序切片在程序调试、软件维护、测试、度量、逆向工程等许多方面都有着广泛应用。   对
2003年,由两大国际标准化组织ISO/IEC和ITU-T联手制定的新一代国际视频编码标准H.264正式出台。H.264编码标准中采用了众多的新技术,这些新技术的使用使得编码图像的质量进一步
随着信息产业的迅速发展,人们对信息和信息技术的需要不断增加,信息安全也显得越来越重要。密码技术则是保障信息安全的一个重要手段。而公钥密码是现代密码学的核心,是目前
现代操作系统面临着各种攻击威胁,其中一种重要的攻击方式就是ROP(Return-Oriented Programming)攻击。通过篡改操作系统内核中的某个控制数据(比如函数指针或返回地址),ROP
随着网格门户应用能力不断加强,加入的网格节点会越来越多,各网格分支站点、分支工作站数量和各种分支资源数量可能会成几何级倍数增长,这时对于门户来说需要发现、管理和监视的
在大型考试中,如何准确快速的确定考生身份并防止代考现象的发生,是长期困扰各级考务管理部门的一个问题。现行确认考生身份的方法采用准考证与身份证相结合的办法,但是,证件造假