免疫遗传算法在分类中的研究及应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liguiming321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工免疫系统作为计算智能研究的一个崭新分支,已在数据挖掘、机器学习、自动控制、故障诊断等诸多领域显示出强大的信息处理和问题求解能力以及广阔的研究前景。将人工免疫算法与遗传算法相结合后而形成的免疫遗传算法的研究和应用已经成为人工免疫系统研究领域中极为重要且最活跃的研究方向,免疫遗传算法在多方面都表现出比遗传算法更为优越的性能。 分类分析作为数据挖掘中一个重要任务,长期以来都是数据挖掘研究领域中一个较活跃的研究方向。大量的研究者都致力于通过各种方法构造高准确率的、高用户兴趣度的分类器。 本文阐述了人工免疫系统及数据挖掘的研究发展现状,自然免疫系统和人工免疫系统的基本原理和研究内容,详细阐明了免疫算法的理论基础、基本算子、算法流程及算法性能。在简要阐述遗传算法的基础上,通过分析遗传算法的不足,详细阐述了免疫遗传算法的基础理论、算法流程、基本算子和特点。在这些理论基础之上,结合数据挖掘分类分析的任务,本文提出了一种基于免疫遗传算法的分类算法(CBIGA)。本文详细研究了该算法的主要原理、基础理论及流程;研究分析了该分类算法的抗原抗体编码策略、初始规则集的产生方法、规则记忆池的产生及更新方法、规则浓度和适应度的计算方法、规则的抑制与促进、交叉和变异等算子,及其对分类结果的影响;并采用数学方法严格证明了该分类算法的收敛性,分析了算法的计算复杂度。本文在Weka数据挖掘平台上利用Java语言实现了CBIGA算法,并采用多个UCI数据集使用本文所介绍的分类评价标准对ID3、C4.5、遗传算法分类器和CBIGA的分类结果进行比较,得出结论:CBIGA算法分类准确率高,鲁棒性强,在高噪声数据情况下仍然有较高的分类准确率。并且还通过实验对参数亲和系数对CBIGA分类结果的影响进行了探讨,得出结论:亲和系数对实验结果存在一定的影响,但结果反映的情况与CBIGA算法理论的分析相吻合。 最后结合某省的公路养路费征管系统,提出一个基于J2EE的数据挖掘体系结构,并应用本文提出的CBIGA算法,给出了一个实例,得到了理想的结果,进一步验证了CBIGA较好的分类预测能力。
其他文献
随着互联网短文本数据爆发式的增长,如何从短文本中找出人们关注的有价值的事件,即基于短文本的事件探测技术,成为学术研究领域的热点问题。而微博数据是短文本事件探测的典型数
在多媒体技术日益广泛的今天,图像的通信和存储占有重要的位置,数字图像包含信息量巨大的特殊性使得压缩技术成为其关键,因而探索高效图像压缩编码算法无疑将成为国际公认的
人体器官的三维重建与虚拟手术模拟是当前科学计算可视化最活跃的领域之一。肝脏作为人体最重要的器官之一,其手术也是外科手术中最复杂和失败率较高的手术之一,因此,肝脏虚拟手
随着市场竞争的加剧以及信息社会需求的发展,从大量数据中提取信息并用之于市场策略中的要求显得越来越迫切。近年来,数据仓库、OLAP和数据挖掘等面向决策支持的技术飞速发展,其
软件过程技术通过建模、运作、监控、度量过程模型,对实际的软件过程提供指导和控制,从而保证软件开发的质量、提高软件开发的效率。对软件过程的研究已经成为软件工程领域的研
学位
生物信息学是在生命科学研究中综合运用数学、计算机科学和生物学知识与工具对生物信息进行存储、检索和分析的新兴交叉学科,是当今生命科学的重大前沿领域之一,也将是21世纪自
随着国土资源部“十一五”规划的制定和开始实施,“加大对政务公开执行情况督查力度,大力推进政务信息网上公开”已成为各级国土资源管理部门“十一五”期间重点工作之一。实施
在当今竞争日益激烈的市场环境中,所有企业都希望能够从浩如烟海的商务数据中发现带来巨额利润的商机。只有那些利用先进的信息技术成功地收集、分析、理解信息并依据信息进行
学位
多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。传统的数据挖掘方法只能完成单一关系中的模式发现,多关系数据挖掘能够从复杂的结构化数据中发现涉及多个关系的复