遗传算法的基本理论及其在知识发现中的应用研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:baichuan817
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文以模式理论(模式定理和建筑模块假说)为基础,试图从GA进化动力学的角度,系 统地研究遗传算法的若干基本理论问题和遗传策略的设计问题,以及将遗传算法应用于机器学习和知识发现中的概念不习和特征提取.1)系统地是归纳和总结了遗传算法的发展阶段、基本理论、方法与特征,讨论了该领域的主要研究方向和存在的问题,提出了遗传算法的进化动力学概念.2)描述了GA的一般流程,给出了编码问题的原则和规范,分析了基于字符集{0,1}的二进制编码和译码方法,讨论了适应函数(评价函数)的定义、适应函数与目标函数 的映射关系,以及三种基本遗传算子和跗操作(选择、交叉和变异),其中针对基于GA的机器学习的需要提出了一种特殊算子----补算算子.3)分析了群体进化过程中模工在三个遗传算子作用下生存数量的一般规律,遗传算法的模式定理和建筑模块假说.讨论了GA的稳并行,并给出了一种新的推导计算方法.基于模式海明距离的定义,给出了模式空间在任意模式之间在变异算子作用下均可以相互转变的一种简单证明,论证了标准遗传算法的收敛性质.分析了基于模式理论的单调函数(和单峰函数)采用标准GA求解的强概率收敛性.4)系统研究了GA欺骗问题,提出了模式包含、竞争与关联等概念,给出了基于主竞争关系的模式欺骗性与GA欺骗问题的严格定义,包括完全欺骗问题、一致欺骗问题、序列欺骗问题和基本欺骗问题.5)全面研究了GA遗传策略中的微观策略,包括群体和遗传算子的形式设计与参数选择,及其对GA的求泛和求精能力的影响.深入研究了群体的设计问题:群体规模的设定、运行过程中群体规模的控制、多样性变化与控制等.分析了三种基本的适应值标度变换方式对个体选择概率的影响,推导了单独使用不同选择算子时群体的接管时间模型.6)系统研究了GA的宏观遗传策略,包括遗传算法结构分析与设计、混合GA等问题.提出了一种新的适应函数超曲复杂性测度方法----数据包络分析方法(DER).针对提高GA突破局部极值点和克服模式欺骗 性的能力,提出了单纯多群体GA方法,给出了详细的工作流程.针对多模态函数优化问题的研究,讨论了基于排挤模型的GA方法和基于适应共享模型的GA方法.讨论了将局部搜索方法与GA结合起来的混合GA的思想,具体研究了GA+位爬山类型的混合GA,给出了基于群体染色 体上位的多样性测度的位爬山算法启动准则,提出了一种基于位多样性测度的随机位序列集合生成方法.7)分析了描述性概念和预测性概念的基本特征及其关系,采用关系数据理论,给出了基于关系数据库的描述概念的定义,采用集合理论提出了描述概念体系构建的一种方法.采用组合数学理论,给出了预测概念(简称概念)的一般描述的优化模型(NP-完全问题) .8)简要研究了概念学习和模式识别领域的特征提取问题,提出了基于GA的特征提取的思想和方法.给出了特征提取的一般描述,定义了特征提取评价的熵函数和类内类间距离函数.研究了基于GA的特征直接提取的最佳特征子集选择问题.研究了特征间接提取的最佳线性变换矩阵获取的GA方法,以及面向非线性变换的神经网络模型结构和相应参数的GA求解方法.
其他文献
  地震等重大灾害在造成巨大的人员伤亡及财产损失的同时,还会导致大量居民无家可归。应急避难场所在灾害发生时充当着灾民的临时避风港,为灾民提供可抵御灾害的安全场所。本
论文从国际医药行业发展的历史、现状入手,阐述了国际医药行业的特点和发展趋势,通过从医药市场供给、需求,药品进出口总量的结构等方面对中国医药行业的现状进行了系统的比
鉴于目前中国风险投资发展所面临的种种困难,该文认为关键在于风险投资环境的培育和优化.由于风险投资相对于传统投资方式而言是一项制度创新,该文首先人新制度经济学的角度
该文的写作分为三个部分进行展开:第一部分介绍DRP(DistributionRequirementPlanning)的原理,阐述了DRP的倒排计划及其在分销网络的运行原理和运行逻辑,详细介绍了DRP在分销
该文从国有企业改革谈到建立现代企业制度,首先回顾了国有企业改革的发展史,分析了国有企业改革取得的成就、存在的问题和现状,介绍了武汉市中小型国有企业改制的基本政策和
该文主要研究内容和成果如下:1、对风险投资中的风险进行识别,并对单个项目的风险大小进行评价.2、利用当今最先进的期权理论对风险投资项目进行经济收益评价.3、提出了在考
该文第一章为绪论,在介绍了国内网络设备企业采购落后的现状后,提出了从战略高度研究网络设备采购战略的必要性.并就该文的内容、方法和意义作了简要的说明.第二章为比较研究