人工免疫网络分类器的设计及其应用研究

来源 :中南大学 | 被引量 : 1次 | 上传用户:hellomfc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工免疫系统(Artificial Immune System, AIS)是一种新的软计算技术,在过去的十多年间得到了迅速的发展。由于具有强大的信息处理能力,AIS被广泛应用于各种领域,尤其是机器学习中的分类问题。在AIS的所有的模型中,免疫网络能够快速、有效地归纳训练空间,因此,基于AIS的分类器大多是采用免疫网络来设计和实现的。虽然免疫分类器在实际应用中取得了较大的成功,但是这些分类器也存在问题,限制了分类器的分类性能。这些问题包括:1、没有考虑细胞之间的相互关系对分类性能的影响,记忆细胞的确定缺乏有效的指导;2、没有对训练空间进行适当的转换,分类学习直接在输入空间中进行,限制了算法的能力;3、有些系统采用线性机制来控制抗体群体的进化,难以对抗体群体的进化产生有效的扰动,影响了算法的精细搜索能力;4、记忆细胞群体的产生过于随机,算法没有有效的细胞质量评估和淘汰机制;5、在使用批量训练方法时,抗体群体的进化缺乏有效的指导,使得抗体群体的组合空间过大而难以搜索到优化的分类器。为了改善人工免疫分类器的问题,本文提出了基于抗原对的训练方法、记忆细胞剪切方法、核空间以及模糊逻辑等方法,并结合免疫网络高效的归纳能力来设计分类器。具体细节描述如下:1、提出了一种新的训练方法,该方法利用抗原对来指导记忆细胞的生成。对于每一个训练抗原,确定与训练抗原最近且不同类的抗原为其对偶抗原,并以训练抗原为中心,抗原对距离一半为半径确定候选细胞区域。当抗体群体在进化的过程有抗体出现在该区域时结束对训练抗原的训练,并确定候选细胞区域中距离对偶抗原最近的抗体为记忆细胞。这种训练方法不仅考虑到了抗体-抗原之间的相互关系,还考虑到了细胞之间的相互位置关系对分类性能的影响,有利于搜索到更优的分类器。算法被用于6个人工数据集以及5个UCI数据集的分类,同时,该算法被应用于语音情感识别。算法的分类结果与支持向量机SVM、决策树算法C4.5、BayesNet等著名算法的分类结果进行了比较,结果显示该算法对于这些问题具有良好的分类性能。2、提出了一种基于核函数的人工免疫识别系统。在传统的人工免疫识别系统AIRS中,抗体-抗原的亲和度采用Euclidean距离来表示,这种线性空间的表示机制限制了算法的非线性能力。通过使用核函数,将训练空间由输入空间转换至高维的特征空间,改善算法的非线性能力。同时,对记忆细胞群体中的每个细胞进行质量评估,淘汰完全不能识别近邻抗原的弱细胞。算法被用于5个UCI标准数据集的分类,同时,算法被应用于肝炎和心脏病的诊断,诊断结果通过混淆矩阵和AUC指标加以评估。通过比较本文算法与其他算法的分类性能,发现本文算法获得的分类准确率不仅显著高于AIRS获得分类准确率,而且也优于参与比较的经典分类算法达到的分类准确率。3、传统AIRS采用的线性资源分配方法难以对抗体群体的进化产生有效的扰动,不利于算法对训练空间进行精细搜索。本文提出2种非线性资源分配方法来改善算法性能,即离散资源分配方法和模糊逻辑资源分配方法。离散资源分配方法将整个刺激度区间离散为若干个子区间,并为位于相同子区间的抗体分配等量资源,这样即可在资源数量不变的情况下仅通过优化子区间数量来改变资源分配结果,实现对抗体群体生成的扰动,提高算法的精细搜索能力。模糊逻辑资源分配方法将模糊逻辑表示为一个参数,这样就不需要根据不同的问题预先设计模糊逻辑,而仅通过改变参数即可实现模糊逻辑的搜索,改善算法的精细搜索能力。最后,算法对记忆细胞进行适应度评估,并通过淘汰适应度偏低的记忆细胞来进一步优化分类器。算法被应用于6个标准UCI数据集的分类测试,结果显示算法具有良好的分类性能。同时,算法被应用于心脏病、糖尿病和乳腺癌3种疾病的诊断,诊断结果通过AUC和混淆矩阵进行检验,结果显示算法对这3种疾病的诊断性能良好。最后,将算法应用于银行用户信用分析,通过比较发现算法在用户信用评估方面也有良好的性能。4、免疫网络分类算法大多采用增量式训练方法,这种方法虽然可以为每个抗原产生一个优化的记忆细胞,但不能保证获得优化的记忆细胞群体,为此,提出了一种基于禁忌搜索策略的免疫网络分类算法。算法采用批量式训练方法,该方法将抗原整体提呈给抗体群体,并通过评估抗体群体整体质量来进化分类器。为了有效减少搜索空间,类域内部区域被禁止产生同类抗体,这样,抗体的生成被主要限制在类域分界线附近。同时,评估抗体的适应度,淘汰类域分界线附近低适应度的抗体,使得抗体群体能够较好地归纳抗原空间,更好地反映抗原空间的局部特征。算法被应用于4个UCI数据集的分类测试,结果显示算法具有优良的分类性能,特别是对Wine数据集,算法的分类准确率达到了100%。同时算法被应用于语音情感识别,以及肝炎和乳腺癌的疾病诊断,结果显示算法对于这些问题具有良好的分类性能。
其他文献
利用纳米压痕法测定了Ni52.2Mn24.4Ga23.4单个晶粒内马氏体的力学性能.实验表明:加载过程中马氏体产生弹性与塑性变形,且随着载荷的增大,材料的变形方式逐渐以塑性变形为主,并
<正> 前言丝网印刷是一门新的实用技术,其应用领域越来越广。印制电路是丝网印刷中要求最高的一种,它要求尺寸精度高,尺寸稳定性好,分辨率高,尤其当印制电路向高精度、高密度
演化算法是受自然演化机制启发而提出的一大类随机优化算法的总称。它将复杂的处理对象转化为各种编码、基于自然界的群体策略搜索、模拟自然法则产生新个体、以迭代方式优化
介绍了掺氧半绝缘多晶硅(O一SIPOs)及掺氮半绝缘多晶硅(N一SIPOS)薄膜的制备方法,生长条件及其在高可靠大功率开关三极管3DK106中的应用,以及主要电参数的测试结果,并且对本工艺所带来的特点进行了初步
管理决不仅仅是一种作业性和技术性的理性经济,其最终目的,不管是用在生产肥皂,或是经营一家医院,都是为了使人们有能力实现“公益”(common good)。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
讨论了装有末端弹簧和分立励磁线圈的单相线性磁阻自感应电机,同时,分析了定子线圈的电阻,自感及末端弹簧对电机运行特性的影响。理论和实验证明上述两个参数对电机的功率和运行
通过对杨明等提出的改进的差别矩阵定义和求核方法的研究,认为所提出的不可缺少属性判定方法的证明过程中还有一些不完善的地方,需要进行修正.提出了修正方法,并证明了修正方法的
综述了当前微波集成电路(MIC)各种孔金属化工艺的基础上,根据MIC的特点,借鉴印制板电路(PCB)制做工艺,选择了与MIC工艺水平相适应的孔金属化工艺方案和先进配方,即采用先做图形后孔金属化的工艺流
介绍广西气象档案信息网的设计目标和实现过程,分析用户需求,信息网站的建设技术和方法。