【摘 要】
:
随着物联网和人工智能等新兴技术和应用模式的快速发展,人类社会所获得数据的属性(或称特征)规模正以前所未有的速度增长。这其中,冗余和不相关特征的存在不仅会降低算法的学习速度,而且将明显影响其准确度。特征选择的目的是,从数据集的所有特征中选出部分特征构成一个最优特征子集,在减少学习代价的同时使设定的性能指标达到最优。然而,在处理高维数据时,现有大部分进化特征选择方法依然存在“维数灾难”和计算代价高等问
【基金项目】
:
高维数据的变粒度分割协同粒子群特征选择方法及应用,国家自然科学基金,编号:61876185;
论文部分内容阅读
随着物联网和人工智能等新兴技术和应用模式的快速发展,人类社会所获得数据的属性(或称特征)规模正以前所未有的速度增长。这其中,冗余和不相关特征的存在不仅会降低算法的学习速度,而且将明显影响其准确度。特征选择的目的是,从数据集的所有特征中选出部分特征构成一个最优特征子集,在减少学习代价的同时使设定的性能指标达到最优。然而,在处理高维数据时,现有大部分进化特征选择方法依然存在“维数灾难”和计算代价高等问题。鉴于此,本文充分考虑特征选择问题自身的领域知识,研究面向高维数据的高效粒子群优化特征选择算法。首先,针对现有粒子群特征选择算法搜索效率低的不足,提出一种特征相关性驱动的简洁粒子群特征选择算法。给出一种基于类标签相关程度的粒子群初始化方法,以加快粒子群的搜索速度;设计两种基于相关-冗余指标的粒子局部搜索策略,即增补算子和删减算子,以提升粒子群的局部探索能力;给出一种自适应变异策略,以帮助粒子群跳出局部收敛。同时,引入一种控制参数少的粒子位置更新机制,以提高算法的可操作性。其次,针对现有粒子群特征选择算法难以解决“维数灾难”的不足,提出一种特征重要程度驱动的变种群合作型协同粒子群特征选择算法。给出一种基于特征重要程度的特征空间划分机制,将高维特征空间分割为若干个低维特征子空间;采用多种群协同进化机制同时搜索多个低维特征子空间,提出一种基于特征子空间重要程度的子种群规模初始化策略,以合理分配种群计算资源;设计一种结合种群进化速度和多样性的子种群规模自适应调整机制,以适时动态调整每个子种群的规模;同时,给出一种基于聚类的粒子删除策略和一种基于特征重要性的新增粒子生成策略,以保证子种群的质量。然后,同时考虑现有粒子群特征选择算法存在的“维数灾难”和计算代价高等问题,提出一种特征聚类引导的快速混合粒子群特征选择算法。该算法将特征选择过程分为功能互补的三个阶段。第一阶段,给出一种计算代价低的自适应过滤式特征选择方法,以删除不相关或弱相关的特征;第二阶段,提出一种相关性引导的快速特征聚类策略,将相似或相冗余特征划分到一个特征类,以减少后续粒子群的搜索空间;第三阶段,设计一种改进的整型粒子群优化算法,从每个特征类中同时选择最具代表性的特征,以形成最终的特征子集。同时,引入一种适合整数编码的差异性扰动算子,以防止粒子群陷入局部最优。最后,考虑现有粒子群特征选择算法难以处理的大规模高维数据,提出一种代理样本辅助的粒子群特征选择算法。引入一种无重复均匀采样策略,将原始的大规模样本集合划分为若干小规模的样本子集合;将划分后的每个样本子集视为一个代理单元,提出一种多代理单元协作的改进特征聚类策略,以降低第5章所提聚类策略的计算代价并缩小后续粒子群的搜索空间;给出一种集成代理辅助评价的整型粒子群优化算法,以较低的个体评价代价生成最终的特征子集。同时,设计一种集成代理构建与管理策略,以保证集成代理评价粒子适应值时的精度。将所提理论与方法应用于UCI等机构提供的多个典型的实际数据集,并与已有的代表性特征选择算法相对比,实验验证了上述4种算法的可行性和有效性。上述研究成果丰富了现有特征选择理论与方法,提高了进化特征选择方法处理高维数据的性能,并为相关机器学习算法提供了一系列有效可靠的数据预处理技术。本论文共包含图17幅,表35个,参考文献166篇。
其他文献
稀土元素(镧系元素、钇和钪),属于战略性金属,由于日益增长的市场需求和传统矿石资源的供给紧张,从二次资源中回收稀土元素成为了研究热点。煤被认为是未来稀土重要来源之一,部分地区煤或煤灰中稀土元素接近或达到传统稀土矿品位。本论文研究粉煤灰中稀土元素赋存状态,揭示粉煤灰形成过程中稀土元素转化规律(赋存成因),比较多种方法对稀土元素的富集效果,开发焙烧-水洗-酸浸回收工艺,为粉煤灰中稀土元素的资源化利用提
近年来,超疏水涂层因其特有的综合性能,已经成为研究热点,并在很多领域被研究和应用。复杂的制备工艺、成本高和稳定性差等,严重限制了超疏水涂层在工程实际中的进一步应用。矿用机械表面的工况环境复杂恶劣,对机械表面综合使用性能要求非常高,在寒冷地区还要求涂层具有优异的抗结冰和除冰等特性。将超疏水和矿用机械表面涂层相结合,不仅可以提高矿用机械表面涂层综合使用性能,而且可以拓宽超疏水涂层应用领域。液滴撞击超疏
连采连充采煤方法具有采煤与充填相互独立作业的工艺优势,充填材料始终充入受保护的采场支巷约束空间内,能够有效控制采动覆岩运移,可应用于保水采煤。但目前该方法仍面临充填体长期变形规律尚不清楚,充填体长期承载能力尚不明确,以及采动覆岩阻隔水机制有待完善等问题。本文以承载充填体蠕变特征为基础,以承载充填体结构稳定为前提,以采动覆岩渗透率控制为目标,综合采用理论分析、数值模拟、实验室试验及现场调研等研究方法
锂电池电极材料的组成主要为石墨和钴酸锂粉末,二者的浮选分离是废弃锂电池二次资源循环利用工艺中的关键一环。实践中,由于电极材料的粒度远低于常规的浮选颗粒尺寸下限,应用常规的浮选技术实现二者的高效分离较为困难,论文探索了应用纳米气泡强化电极材料浮选分离的可能性。论文以纳米气泡的产生方法入手,首先考察了超声震荡、冷水升温、常温水加压和醇水替换四种方法产生纳米气泡的可能性。使用超声震荡的方法未发现纳米气泡
锂离子电池作为一种高效、环保的电能储存载体,在大规模储能装置、手机等消费电子及动力电池等领域广泛应用。随着近年来我国新能源汽车产业蓬勃发展,动力电池需求和产量不断攀升。由于锂离子电池的有限生命周期及电子产品更新换代的加剧,造成了服役后的废旧电池数量的急剧增加。废旧锂离子电池中富含锂和钴等战略金属,极具回收价值,同时电池中电解液及重金属等有害物质对环境产生潜在威胁,对其资源化回收具有重要的资源和环保
随着地下资源开采深度的增加,深部岩体动力灾害发生的频率和强度显著提高,动力灾害行为更为复杂,灾变机理至今尚不清晰,以至于工程中难以准确预测预报与精准防治。基于应力-应变关系和强度准则角度研究深部岩体动力灾害具有局限性,难以揭示深部灾害的量级、规模、剧烈程度以及灾变形式,而这些恰恰是评价分析深部动力灾害至关重要的指标。研究表明,从能量角度分析深部岩体动力灾害问题更加科学有效。本文针对岩石变形破坏过程
煤炭气化是煤炭高效与洁净转化的关键技术和重要源头,气化细渣黑水是煤气化过程的产物。气化细渣的有效脱水能够实现水资源的回收、降低滤饼处理成本并改善厂区环境,符合我国循环经济的政策要求。因此,开发高效率、低能耗的气化细渣脱水技术是亟需解决的科学问题,研究内容如下:(1)探究了气流床煤气化细渣独特的物理化学性质与水分的赋存模式的交互作用。发现气化细渣界面结构复杂,包括残碳和灰颗粒两部分且至少四种共存模式