论文部分内容阅读
【摘 要】文章是在生物免疫机制的基础上提出了基于人工免疫的新的半监督学习算法,新算法在ORL人脸图像上进行了实验验证。由实验结果得出,新算法具有很好的自学习能力和自适应能力,在识别率方面也取得了很好的效果。
【关键词】人工免疫系统 半监督学习
一、引言
人工免疫系统是高度复杂性系统的代表,它有着很好的自学习、自适应、自组织能力,通过对人工免疫系统的研究可以大大的促进复杂科学的发展。文章是将人工免疫系统和半监督学习算法相结合提出了一种新算法,并在ORL人脸图像上进行了实验验证,结果可以看出新算法切实可行。
二、人工免疫半监督学习算法
在人工免疫模的式识别系统中,把系统的训练阶段看作是免疫应答中的初始应答,主要是用来学习训练样本的信息从而产生记忆细胞 ,以便速响应二次应答。把系统的测试阶段看作是二次应答,借用初始应答(训练阶段)得到的训练样本信息去识别测试样本。在此基础上,我们把训练样本看作是第一类抗原模式测试样本看作是第二类抗原模式。把第一类抗原用来训练抗体集合 ,并通过进化学习算法产生成熟的检测器集合 ,把第二类抗原用来测试抗体集合 ,验证算法的有效性。
算法步骤
(一)把抗原样本分成两组,第一组训练样本集合Q,第二组测试样本集合Q1;
(二)对应训练样本集合Q,选出初始抗体集合P,此过程中假设所有类别已知,且每一类别保证有样本被标记;
(三)对已经标记的抗体集合使用免疫算法进行训练,建立起抗体记忆集合M;
(四)满足终止条件,则结束训练;
(五)从训练数据中得到成熟抗体记忆集合M’;
(六)将训练结果送入测试样本集Q1进行测试;
(七)测试结束后则得出分类结果。
三、实验结果
在此实验中使用了ORL人脸库中的样本进行分类实验。先将图像预处理降维,分解出图像特征矩阵。再把训练样本库的特征向量集合在新算法中进行抗体训练,完成以后把测试样本库的特征向量集合用来测试从而得出识别和分类结果。
实验1是在标记样本和训练样本都不变的情况下,识别率随着阈值变化而变化的情况,结果如图1;实验2是在阈值和标记样本不变的情况下,识别率随着训练样本变化而变化的情况,结果如图2;实验3是在最佳阈值下训练样本不变,标记样本数不同,识别率随着标记样本比例变化而变化的情况,结果如图3;实验4是最佳阈值情况下只标记每类样本中的前两个,训练样本数不同,得道德识别率与文献中的算法识别率进行比较,结果如图4。
四、算法性能分析
从实验中可以看出新算法在自学习、自组织、自适应方面性能较好。标记率处于20%-60%中间段时,识别率增长相对较快,标记率处于60%-100%中间段时,识别率增长相对较慢,因此我们得出,基于人工免疫的半监督学习算法在标注少量样本的情况下自学习自适应能力较好,而当标记率为100%时其学习能力则相对较差,由此我们可以得出新算法要比文献中已提出的算法更具优越性。
参考文献:
[1] Warkins,Timmis J.Artificial immune recognition system(ARIS): Revisions and refinements, In: Proceedings of ICARS, 2002. Canterbury, 2002:173
[2] 李海潮,陈强. 基于人工免疫的监督学习模型及其应用.计算技术与自动化,2006;25(2):120-123
作者简介:
李静(1984-),女,硕士研究生,研究方向:智能控制。联系方式:烟台南山学院,山东龙口。
【关键词】人工免疫系统 半监督学习
一、引言
人工免疫系统是高度复杂性系统的代表,它有着很好的自学习、自适应、自组织能力,通过对人工免疫系统的研究可以大大的促进复杂科学的发展。文章是将人工免疫系统和半监督学习算法相结合提出了一种新算法,并在ORL人脸图像上进行了实验验证,结果可以看出新算法切实可行。
二、人工免疫半监督学习算法
在人工免疫模的式识别系统中,把系统的训练阶段看作是免疫应答中的初始应答,主要是用来学习训练样本的信息从而产生记忆细胞 ,以便速响应二次应答。把系统的测试阶段看作是二次应答,借用初始应答(训练阶段)得到的训练样本信息去识别测试样本。在此基础上,我们把训练样本看作是第一类抗原模式测试样本看作是第二类抗原模式。把第一类抗原用来训练抗体集合 ,并通过进化学习算法产生成熟的检测器集合 ,把第二类抗原用来测试抗体集合 ,验证算法的有效性。
算法步骤
(一)把抗原样本分成两组,第一组训练样本集合Q,第二组测试样本集合Q1;
(二)对应训练样本集合Q,选出初始抗体集合P,此过程中假设所有类别已知,且每一类别保证有样本被标记;
(三)对已经标记的抗体集合使用免疫算法进行训练,建立起抗体记忆集合M;
(四)满足终止条件,则结束训练;
(五)从训练数据中得到成熟抗体记忆集合M’;
(六)将训练结果送入测试样本集Q1进行测试;
(七)测试结束后则得出分类结果。
三、实验结果
在此实验中使用了ORL人脸库中的样本进行分类实验。先将图像预处理降维,分解出图像特征矩阵。再把训练样本库的特征向量集合在新算法中进行抗体训练,完成以后把测试样本库的特征向量集合用来测试从而得出识别和分类结果。
实验1是在标记样本和训练样本都不变的情况下,识别率随着阈值变化而变化的情况,结果如图1;实验2是在阈值和标记样本不变的情况下,识别率随着训练样本变化而变化的情况,结果如图2;实验3是在最佳阈值下训练样本不变,标记样本数不同,识别率随着标记样本比例变化而变化的情况,结果如图3;实验4是最佳阈值情况下只标记每类样本中的前两个,训练样本数不同,得道德识别率与文献中的算法识别率进行比较,结果如图4。
四、算法性能分析
从实验中可以看出新算法在自学习、自组织、自适应方面性能较好。标记率处于20%-60%中间段时,识别率增长相对较快,标记率处于60%-100%中间段时,识别率增长相对较慢,因此我们得出,基于人工免疫的半监督学习算法在标注少量样本的情况下自学习自适应能力较好,而当标记率为100%时其学习能力则相对较差,由此我们可以得出新算法要比文献中已提出的算法更具优越性。
参考文献:
[1] Warkins,Timmis J.Artificial immune recognition system(ARIS): Revisions and refinements, In: Proceedings of ICARS, 2002. Canterbury, 2002:173
[2] 李海潮,陈强. 基于人工免疫的监督学习模型及其应用.计算技术与自动化,2006;25(2):120-123
作者简介:
李静(1984-),女,硕士研究生,研究方向:智能控制。联系方式:烟台南山学院,山东龙口。