【摘 要】
:
动态多目标优化问题无论在科学研究还是在实际应用中都广泛存在。此类问题不仅具有多目标优化问题的基本特征,主要表现在多个目标互相冲突无法同时达到最优,而且这些目标还会随着时间的变化而发生改变,如目标函数、目标函数的数目和限制条件都可能会随时间变化。这些动态变化可能引起问题的帕累托最优前沿(Pareto optimal front,PF)和帕累托最优解集(Pareto optimal set,PS)随着
论文部分内容阅读
动态多目标优化问题无论在科学研究还是在实际应用中都广泛存在。此类问题不仅具有多目标优化问题的基本特征,主要表现在多个目标互相冲突无法同时达到最优,而且这些目标还会随着时间的变化而发生改变,如目标函数、目标函数的数目和限制条件都可能会随时间变化。这些动态变化可能引起问题的帕累托最优前沿(Pareto optimal front,PF)和帕累托最优解集(Pareto optimal set,PS)随着时间发生变化,从而动态多目标优化算法必须要能跟随时间实时追踪到最新的PF和PS。因此,解决动态多目标优化问题是一项挑战。近年来,运用进化算法解决动态多目标优化问题的研究越来越多,给动态多目标优化问题的研究带来巨大进展。但动态多目标优化问题研究仍是一个较新的领域,在动态多目标优化问题、动态多目标优化算法和性能评价指标上,亟待更多且更有创造力的研究成果。同时,进化算法解决实际应用中的动态多目标优化问题的研究需要更多应用成果。因此,研究动态多目标优化问题具有理论和现实的意义。本文主要致力于动态多目标进化算法的研究。通过分析现有动态多目标进化算法和动态多目标测试问题集,找出现有算法在解决动态多目标优化问题上的优势和不足。基于这些分析,本文提出了一种改进的动态多目标进化算法。同时,本文对实际应用中的动态多目标优化问题也引入进化算法进行算法优化与分析。具体研究内容如下:1)提出了一种基于反馈的新型预测策略(A novel feedback-based prediction strategy,FPS)。FPS包含两种反馈机制,第一个是校正反馈(CF)机制,另一个是有效性反馈(EF)机制。CF用于校正初始预测模型。当环境变化时,CF会建立一个可以反映当前种群的特征的代表性个体,并根据初始预测模型计算出该个体在新环境中的预测解。然后,基于变量分类,CF引入了步长探索方法,以实现预测模型的自适应校正,从而增加预测模型的准确性,提高种群的收敛性。EF用于增强重新初始化过程的有效性。重新初始化过程包括两个阶段。在第一阶段,根据校正后的预测模型重新初始化种群中的一半个体。在第二阶段,EF根据第一阶段的重新初始化过程的有效性反馈,使用两轮轮盘赌方法重新初始化其余个体,以此来提升种群的收敛性和多样性。针对FDA、d MOP、F和JY等22个不同的测试问题,将FPS与PPS、SGEA、MOEA/D-KF、Tr-DMOEA和MOEA/D-Mo E五种最新算法相比。实验结果表明,该算法在求解DMOP方面非常有效。2)设计了一款基于带反馈策略的进化算法的三消游戏关卡自动测试机制(An automatic test mechanism for match-3 game levels based on evolutionary algorithm with feedback strategy,简称ATM-EAF)。该自动测试机制旨在通过模拟玩家的行为策略对三消类游戏进行测试,求出通过游戏关卡的一组最优行为解,从而判断玩家体验游戏时的难易程度,以此来指导开发者对游戏的迭代优化。ATM-EAF将每一个游戏关卡视为一个离散的动态多目标优化问题(Discrete dynamic multi-objective optimization problem,DDMOP),将关卡中的每一个玩家可操作的时间区间作为一个时间步,将每一个时间步中的游戏行为作为问题的解。与此同时,通过对玩家行为分析,每一步的解(游戏行为)在不同维度上的收益被抽象成该解的不同的目标函数。在当前时间步执行某个最优解后,关卡布局会发生变化,即环境发生了改变。为了避免过度寻求局部最优而无法满足全局最优,ATM-EAF引入反馈机制,首先,当环境变化时,找到一组最优解,并随机选择一个个体作为决策解。改决策解被用来消除,然后进入下一个时间步,直到完成该关卡并获得一组决策解为止;然后基于新的局部搜索策略,从关卡决策解集中选择一个解进行扰动,即在此时间步通过局部搜索重新选择执行解;最后,通过对关卡两次运行的对比反馈,更新当前的最优决策解,并且不断对最优执行解随机干扰。针对5个类型各不相同的游戏关卡,将ATM-EAF与5个算法进行对比。实验结果表明,该方法在游戏自动测试方面非常有效。
其他文献
在金融市场,股票预测一直是投资者和学术界的热门研究话题之一。随着经济全球化和股票市场的不断成熟,发展出了多种股票投资方式。近年来机器学习在多个研究领域取得了显著的成果,其中在股票预测方向除了传统的预测方法外,研究人员提出许多新的方法,并对已有的方法不断进行改进。例如利用深度学习预测股票中使用深度卷积网络、深度Q网络以及基于LSTM(长短期记忆网络)的深度循环神经网络预测股票。还有基于SVR(支持向
强化学习是一类关键的机器学习方法,普遍应用于以目标为导向的训练环境,并基于目标在环境中自发地探索最优策略。近来已在一些领域,如游戏操控、机器人操控、车辆自动驾驶等工程应用的部分问题中,获得显著的成绩,其中包括动态规划算法,应用于已知完整的马尔可夫问题模型;蒙特卡洛算法,与时间差分算法基于无模型问题进行寻策,是本文的主要研究内容。深度学习在机器学习中作为另一大热门研究技术,使用非线性的神经网络于分析
多目标优化问题广泛存在于科学研究与实际工程应用中。由于多个优化目标之间相互冲突,单个解不可能同时使所有的目标都是最优的。因此,多目标优化问题的最优解是由多个帕累托最优解组成的集合。进化算法是一种基于种群的元启发式算法,能同时优化一组解。因此,在求解多目标优化问题时,进化算法是一种非常适合的优化算法。然而,随着多目标优化问题复杂性的变化,现有的多目标进化算法越来越难以平衡种群的收敛性与多样性。因此,
目前,物联网、边缘智能和边缘计算等技术在网络边缘上生成了大量数据,而这些日益增多的数据需要在越来越复杂的深度学习算法上进行训练,以检测、分类和预测未来事件。这个趋势在未来还会继续扩大,为了加快深度学习算法的训练速度,分布式计算正变得越来越重要。然而分布式训练在主节点与计算节点间进行着频繁的梯度交换,这使得训练承受着巨大的通信开销,并且限制了分布式深度学习的训练效率。为了降低分布式深度学习的通信开销
多任务学习作为机器学习的一个重要分支,在处理多个小样本相关联任务和挖掘相关任务之间的内在联系与共享信息等方面发挥了重大的作用。其中多任务支持向量机(Multi-task Support Vector Machine,MTSVM)是多任务学习中的一个重要的发展方向。然而现有的多任务支持向量机大多并不具备特征选择的功能,在面对高维度任务或者高噪声任务并不能达到很好的效果。此外,多任务支持向量机通常假设
近年来,预测股价对国家,社会具有深远意义而引起了研究者们广泛的关注。使用深度学习算法预测股票是该领域重要的一个分支。由于股票数据集较小,不平稳,存在不稳定性,使预测股价难度增加。并且传统的算法难以有效提取股票序列的非线性特征。随着深度学习算法的发展,循环神经网络和卷积神经网络因有较好的非线性特征提取能力而逐渐在股价预测应用中崭露头角。尽管使用传统的神经网络算法预测股价能取得一定准确度,优化算法的预
近年来,随着新兴社交媒体的火热发展,越来越多的人们使用在线社交平台来获取感兴趣的信息,而随着用户网络规模的越来越大,在线社交平台上信息鱼龙混杂,真假难辨,这就导致在线信息系统的治理出现诸多问题。例如不实新闻大肆传播导致社会公信度降低,哄抬物价非法赢利,传播不当言论导致的舆情监控等问题,本文从以下两个小方面切入,旨在为在线信息系统的治理做出贡献。一是从信息的传播过程。在追踪一条信息的传播时,我们通常
准确地预测股票价格对降低投资者的风险有着十分重要的意义。投资者可以通过对股价的合理预测来确定自身的投资组合,从而规避风险,获取更大的收益。虽然深度学习已经在股票价格预测上拥有很多的研究成果与实际应用,但是,仍然存在着泛化能力较弱,训练容易导致过拟合等基本问题,模型在预测阶段的表现较差。通常,数据增强以及合理调整模型架构能够有效地避免这类情况发生。本文主要针对长短期记忆网络(LSTM)在股票价格预测
股票市场作为社会经济的重要组成部分,为我国的经济发展发挥着重要的作用。投资者可以通过准确的价格走势预测,降低投资决策的风险。然而由于股票数据的非线性和非平稳特性,股票价格走势的准确预测往往非常困难。当前基于神经网络的深度学习算法(LSTM),在股票价格预测中初步显示重要的算法优势。然而在训练过程中,仅仅采用梯度下降算法进行网络优化,预测的准确性有待提高。进化算法作为一种鲁棒性强全局寻优算法,可以用
物流行业发展面临着激烈的市场竞争压力和消费者服务要求不断升级的挑战。物流企业要在如此激烈的竞争环境中生存,提高企业的核心竞争力,物流车辆路径规划是物流管理中的关键环节之一,优化物流车辆路径规划对于减少运营成本和提高服务质量至关重要。由于车辆路径规划问题属于组合优化的NP难问题,该问题的求解存在诸多的困难,如算法的收敛速度慢,求解目标过多,问题约束苛刻等。为了平衡问题求解的时空复杂度,本文基于演化计