非一致有界费用MDP的强平均最优性条件

来源 :运筹学学报 | 被引量 : 0次 | 上传用户：mir_lww0

【摘要】

：

研究可数状态空间任意行动空间非一致性有界费用马氏决策过程（MDP）的强平均最优，给出了使得每个常用的平均最优策略也是强平均最优的条件，并实质性的推广了Cavazos-Cadena 和 Fer

【作者】

：

肖晴初谭杭生

【机构】

：

中南大学数学科学与计算技术学院,湖南商学院信息学院

【出处】

：

运筹学学报

【发表日期】

：

2010年1期

【关键词】

：

运筹学马氏决策过程(MDP) 强平均费用准则非一致有界费用充分条件 Operations research Markov decision proces

【基金项目】

：

本文得到湖南省自然科学基金项目（08JJ3004）,湖南省社会科学基金项目（08YBB187）的支持

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

研究可数状态空间任意行动空间非一致性有界费用马氏决策过程（MDP）的强平均最优，给出了使得每个常用的平均最优策略也是强平均最优的条件，并实质性的推广了Cavazos-Cadena 和 Fernandez-Gaucheran（Math. Meth. Oper. Res., 1996, 43： 281-300）的主要结果．

其他文献

脐带血来源干细胞神经分化的研究进展

中枢神经系统损伤后的自身修复能力有限,因而研究者致力于寻找一种合适的细胞进行移植以代替受损的神经细胞修复神经损伤.近年来的研究表明,在特定的诱导条件下,脐带血干细胞

期刊

脐带血神经分化干细胞Umbilical cord blood Neural differentiation Stem cells

高校武术教育文化传承与德育渗透的路径研究

中华武术是中国传统文化不可或缺的组成部分与载体,体现着崇德向善的道德规范精神和多方面的文化育人功能。高校武术教育要以通识教育为契机,实现武术的育人功能,传承优秀民

会议

高校武术教育文化传承德育渗透

鱼腥藻Ⅱ型果糖-1，6-二磷酸醛缩酶基因的克隆及其在大肠杆菌中的高效表达

随着更多蓝藻全基因组序列测定完成，蓝藻基因工程研究现已进入后基因组时代。2001年Kaneko等完成了鱼腥藻7120全基因组序列测定，随后人们利用生物信息学的方法对其中一些基因的

期刊

果糖-16-二磷酸醛缩酶鱼腥藻7120表达酶活Fructose-1 6-bisphosphate aldolase Anabaena PCC 7120

国内外语心理语言学研究现状的实证分析——对8种外语类核心期刊2006-2010年的统计分析

本文对2006-2010年5年间8种主要的外语类核心期刊的数据进行统计分析,总结出国内外语心理语言学研究发展的整体态势。结果显示：1）5年来心理语言学研究呈上升趋势,尤其在09年之

期刊

心理语言学实证分析外语核心期刊

奥运会奖牌预测国内、外研究动态及发展趋势

分析了国内、外相关奥运会奖牌预测研究报道,主要对夏季奥运会奖牌预测进行归纳分析。从方法学的角度,将奥运会奖牌预测研究的模型划分为三类,分别对时间序列预测模型、经验

期刊

奥运会奖牌预测研究动态趋势

高校环境艺术设计专业应用型人才培养模式的创新思考

本文从教学实践出发,首先阐述了环境艺术设计专业人才的培养现状,并对这个专业的特点以及培养应用型人才的意义进行了分析,以公共空间的课程为切入点,进行校企合作教学,从双

期刊

应用型高校环境艺术设计专业人才培养模式

慢性乙型肝炎相关慢加急性肝功能衰竭患者肾上腺功能不全的临床观察

目的研究慢性乙型肝炎慢加急性肝功能衰竭（ACLF）中肾上腺功能不全的发生率及肾上腺功能不全与疾病严重程度和预后的相关性。方法为单中心的观察性研究,纳入2013年3月至2014年11

期刊

肝炎乙型慢性肝功能衰竭慢加急性肾上腺功能不全

平原路商业街改造研析

通过新乡市平原路商业街的改造建设,改善城市商业中心区的景观风貌,塑造二十—世纪城市形象,反映城市特征,体现城市为人服务的功能,造就具有时代特征的城市文化。

期刊

城市设计：改造更新以人为本

浅谈企业内部控制的必要性

内部控制在企业建设及管理运行中发挥了非常重要的作用,在企业中上至股东大会,下到全体员工共同实施的为实现控制目标的实施全过程,建立和实施一套统一、高质量的企业内部控

期刊

企业内部控制必要性

非一致有界费用MDP的强平均最优性条件

其他学术论文