论文部分内容阅读
该文以模式理论(模式定理和建筑模块假说)为基础,试图从GA进化动力学的角度,系 统地研究遗传算法的若干基本理论问题和遗传策略的设计问题,以及将遗传算法应用于机器学习和知识发现中的概念不习和特征提取.1)系统地是归纳和总结了遗传算法的发展阶段、基本理论、方法与特征,讨论了该领域的主要研究方向和存在的问题,提出了遗传算法的进化动力学概念.2)描述了GA的一般流程,给出了编码问题的原则和规范,分析了基于字符集{0,1}的二进制编码和译码方法,讨论了适应函数(评价函数)的定义、适应函数与目标函数 的映射关系,以及三种基本遗传算子和跗操作(选择、交叉和变异),其中针对基于GA的机器学习的需要提出了一种特殊算子----补算算子.3)分析了群体进化过程中模工在三个遗传算子作用下生存数量的一般规律,遗传算法的模式定理和建筑模块假说.讨论了GA的稳并行,并给出了一种新的推导计算方法.基于模式海明距离的定义,给出了模式空间在任意模式之间在变异算子作用下均可以相互转变的一种简单证明,论证了标准遗传算法的收敛性质.分析了基于模式理论的单调函数(和单峰函数)采用标准GA求解的强概率收敛性.4)系统研究了GA欺骗问题,提出了模式包含、竞争与关联等概念,给出了基于主竞争关系的模式欺骗性与GA欺骗问题的严格定义,包括完全欺骗问题、一致欺骗问题、序列欺骗问题和基本欺骗问题.5)全面研究了GA遗传策略中的微观策略,包括群体和遗传算子的形式设计与参数选择,及其对GA的求泛和求精能力的影响.深入研究了群体的设计问题:群体规模的设定、运行过程中群体规模的控制、多样性变化与控制等.分析了三种基本的适应值标度变换方式对个体选择概率的影响,推导了单独使用不同选择算子时群体的接管时间模型.6)系统研究了GA的宏观遗传策略,包括遗传算法结构分析与设计、混合GA等问题.提出了一种新的适应函数超曲复杂性测度方法----数据包络分析方法(DER).针对提高GA突破局部极值点和克服模式欺骗 性的能力,提出了单纯多群体GA方法,给出了详细的工作流程.针对多模态函数优化问题的研究,讨论了基于排挤模型的GA方法和基于适应共享模型的GA方法.讨论了将局部搜索方法与GA结合起来的混合GA的思想,具体研究了GA+位爬山类型的混合GA,给出了基于群体染色 体上位的多样性测度的位爬山算法启动准则,提出了一种基于位多样性测度的随机位序列集合生成方法.7)分析了描述性概念和预测性概念的基本特征及其关系,采用关系数据理论,给出了基于关系数据库的描述概念的定义,采用集合理论提出了描述概念体系构建的一种方法.采用组合数学理论,给出了预测概念(简称概念)的一般描述的优化模型(NP-完全问题) .8)简要研究了概念学习和模式识别领域的特征提取问题,提出了基于GA的特征提取的思想和方法.给出了特征提取的一般描述,定义了特征提取评价的熵函数和类内类间距离函数.研究了基于GA的特征直接提取的最佳特征子集选择问题.研究了特征间接提取的最佳线性变换矩阵获取的GA方法,以及面向非线性变换的神经网络模型结构和相应参数的GA求解方法.