【摘 要】
:
传统的序列决策方法旨在对决策过程与决策步骤进行建模,以求解得到最优的决策序列。然而,传统序列决策建模过程对目标函数和决策次数的确定性、准确性要求很高,且序列搜索的算法多以盲目搜索与启发式搜索为主,大多在约束条件、目标函数不变的情景下进行全局或者局部搜索,鲜有考虑搜索过程中的随机特性。近年来,面向随机博弈环境的一类动态搜索算法-蒙特卡洛树搜索算法(Monte carlo tree search,MC
论文部分内容阅读
传统的序列决策方法旨在对决策过程与决策步骤进行建模,以求解得到最优的决策序列。然而,传统序列决策建模过程对目标函数和决策次数的确定性、准确性要求很高,且序列搜索的算法多以盲目搜索与启发式搜索为主,大多在约束条件、目标函数不变的情景下进行全局或者局部搜索,鲜有考虑搜索过程中的随机特性。近年来,面向随机博弈环境的一类动态搜索算法-蒙特卡洛树搜索算法(Monte carlo tree search,MCTS)为本文研究内容的解决提供了一条有力的途径。MCTS是一种强化学习算法框架,适合求解随机序列决策及在动态环境中的节点搜索问题,但该算法目前仅应用于博弈型搜索过程以及其他“零和问题”,鲜有探讨专家参与下的知识约束的序列决策搜索问题。此外,传统MCTS算法往往由于其随机性和树扩展性,存在搜索范围过大,收敛不及时等问题,对结果产生了很大的干扰。为此,本文首先提出一种基于改进树搜索策略的MCTS序列决策算法,优化了传统MCTS的搜索性能,给出了详细的求解流程及讨论,并将其应用于一组单机完成作业的序列流程调度问题,验证了所提方法的优势;然后,受传统MCTS的决策序列优劣评价方法启发,提出一种混合评价模块,该模块有两个部分:一是融合群决策经验型知识和部分确定型决策序列片段的混合知识作为静态约束,二是基于实际客观数据建立的评判模型作为动态约束;最后,将所提的基于混合评价模块的MCTS算法,应用于一类中风后吞咽功能障碍针灸穴位排序方案制订问题中,并与其它常见决策序列搜索算法进行对比,证明了所提方法的可行性和有效性。本文工作为专家医师的针灸诊断提供了参考,也为年轻医师的针灸方案制订的标准化培训工作奠定了理论方法基础,为智能针灸医生的建立提供了方法支撑。
其他文献
量子纠缠的研究为量子信息的发展带来了质的飞跃,其中量子克隆作为量子纠缠态的应用领域之一,受到各界广泛关注。由于三体纠缠态具有独特的纠缠结构,其应用于远程量子克隆中所带来的结果会有很大变化,因此对于该纠缠态在远程克隆方面的研究具有很重要的意义。本文首先阐述了量子隐形传态和量子克隆的理论,国内外研究现状,细述了量子纠缠的概念及计算方法,以及研究量子克隆所需的理论知识。其次,介绍了三体纠缠态1→2、1→
现代工业借助化石能源飞速发展,然而过度依赖于不可再生资源所引发的能源危机与生态污染等隐患也日渐显露出来。为了社会可持续发展,探索可再生能源来替代枯竭的化石燃料已受
为了研究介孔Ni/MgO催化水蒸气重整商用生物质油制氢的活性以及生物质油转化制氢的微观历程,制备了介孔Ni/MgO催化剂。在固定床反应器上进行了Ni/MgO催化水蒸气重整模拟生物
高熵金属间化合物(High-entropy intermetallics,HEI)是一类新型的金属间化合物,它既具有高熵合金多主元化的原子组成特点又具备传统金属间化合物长程有序的原子排列特点。本
化合物结构性质定量关系QSPR(Quantitative Structure-Property Relationships)已成为化学计量学的一个十分重要的分支,通过建立QSPR模型来预测或估计未知样本的性质,分析对化
形状记忆聚合物(Shape Memory Polymer,SMP)是刺激响应聚合物中的一类,他们具有响应外界环境刺激而改变自身形状的能力。这些材料可在特定环境下由初始形状变形为临时形状。
LINCS是近期公开的一项大数据计划,它基于典型人体细胞在小分子化合物刺激下的反应而测定,数据丰富而规整,配套处理工具完善。由于基因表达具有高度相关性,探究LINCS基因表达
目前,随着人们对基本电磁理论和实际水下环境工程应用的深入了解和交叉研究,水下低频电磁波传播特性的研究在各个领域引起了诸多科研人员和学者的关注。同时,对色散介质电磁
相比于其它检测生物物质的方法,荧光探针法因具有灵敏度高、响应时间短等优势而备受科研人员的关注。生物活性物质(三种巯基化合物(Cys,Hcy和GSH),甲基乙二醛以及一氧化氮等)在许多生命过程中起着关键作用,其浓度水平发生变化,将会引起许多生命过程的异常以及疾病的产生等。针对发射波长短、信号单一、生物相容性差等不足,设计合成性能优良、专一性检测三种巯基化合物和甲基乙二醛以及一氧化氮分子的荧光探针将具
间歇过程是重要的工业生产方式之一,具有可定制化、生产灵活、产品附加值高等优点,广泛用于精细化工、生物制药和食品加工等领域。在间歇过程生产中,传感和测量技术的快速发展和应用,提供了丰富的过程测量数据,为数据驱动的间歇过程在线监控、生产控制与优化提供了基础和保障,提高了企业的经济效益。然而,由于受生产现场环境、现场测量仪表性能衰减、故障等影响,使得过程测量数据出现异常,降低了过程测量数据的质量和间歇过