切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
学位论文
马尔可夫决策过程中的若干最小风险模型
马尔可夫决策过程中的若干最小风险模型
来源 :清华大学 | 被引量 : 0次 | 上传用户:jay36890
【摘 要】
:
该文研究离散时间、时齐的马尔可夫决策过程,其系统状态空间和行动空间均为可数集,优化准则是使累积报酬(总报酬或折扣总报酬)未超过决策者的目标值(预期值)和风险(概率)达到
【作 者】
:
伍从斌
【机 构】
:
清华大学
【出 处】
:
清华大学
【发表日期】
:
1998年期
【关键词】
:
马尔可夫决策过程
风险准则
最优策略
决策状态
目标值
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文研究离散时间、时齐的马尔可夫决策过程,其系统状态空间和行动空间均为可数集,优化准则是使累积报酬(总报酬或折扣总报酬)未超过决策者的目标值(预期值)和风险(概率)达到最小.该文目的在于解决这类模型的最优策略的存在性、结构,最优值函数的性质及求解最优策略的算法.
其他文献
虚拟现实中的实时漫游算法研究
学位
虚拟现实
实时漫游算法
最优实验设计
此文最初讨论最优设计的广义理论,接着讨论各种可能对实验设计适配的判别标准.最常用的是D-OP最优准则,在第四章中.下面几章描述了具有混料及具有对定量因子响应面的模型的拓
学位
实验设计
判别准则
最优准则
设计构造算法
任意设计域
多目标分式规划问题的最优性条件和对偶
多目标规划问题是最优化理论和应用的主要研究领域之一,这一问题的研究涉及到凸分析、非线性分析、非光滑分析等多门学科.特别的,多目标分式规划问题作为一种特殊的优化问题在
学位
多目标分式规划
最优性条件
对偶定理
数学规划
在LOGISTIC GUMBEL模型下独立性和边缘参数相等检验
通过不同方法用了渐近分布,作了独立性检验,边缘参数相等检验.有限样本大小时的模拟结果也作了.
学位
二元极值分布
Fisher矩阵
相关系数
Gumbel分布
边缘估计法
联合估计法
三维Poisson外问题的高阶局部人工边界条件
该文研究了两类三维Possion外问题的局部人工边界数值方去.通过引入人工边界,将原无界域分成有界和无界的两部分,然后考虑有界域上的数值近似解.为使有界域上偏徽分方程的提
学位
人工边界
无界区域
有限元方法
三维Possion外问题
高维非自治系统的周期解
学位
周期解
存在性
指数型二分性
不动点
常微分方程
稳定性理论
有脶坏的轮询系统
该文在Hoffman,Yechiali[1]的基础上,分别地研究了贝努利反馈下的离开门限服务、穷尽服务,无反馈时损坏时间为PH分布、有限服务及中断服务及中断服务下的 坏情况,给出了它们
学位
损坏
门限服务
穷尽服务
PH分布
有限服务
中断服务
BIR算子的紧扰动与套代数中的BIR算子
该文主要有两方面内容:一、是证明了每个谱连通算子都可加一范数充分小的紧算子后成为BIR算子.这便回答了D.A.Herrero提出的问题.另一方面,研究小组证明每个套代数中都存在BI
学位
紧算子
BIR算子
套代数
逼近定理
紧扰动
(k,l,m)-正则极大平面图
如果一个简单图G的顶点的度要么是k,要么是l,则称图G是(k,l)-正则的,若其边数ε=3n-6,那么我们称图G为(k,l)-正则极大平面图.同理,如果一个简单图G的顶点的度要么是k,要么是l,要么是m,则
学位
正则极大平面图
存在条件
连通图
不确定时滞系统及神经网络的稳定性研究
该文系统地研究了不确定时滞系统和神经网络的稳定性问题.在不确定时滞系统的研究中,分为线性和非线性两个方面.这一部分的主要结果是给出了系统渐近稳定和指数稳定的充分判
学位
不确喧性
神经网络
平衡态
时滞系统
其他学术论文