关于奇异平均场随机控制问题二阶随机最大值原理的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:yahoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究关于奇异平均场随机控制问题的二阶随机最大值原理问题。1990年Pardoux和Peng首先创立了非线性倒向随机微分方程理论。同年,Peng发现了经典随机控制问题的一阶随机最大值原理。2012年,Li将经典一阶随机最大值原理推广到平均场情况。  一个平均场容许控制(u)(·)称为在区域V上是奇异的,若V(=)U非空,并且对于几乎处处的t∈[0,1],我们有如下等式成立:E[H(t,X(t;(u)(·)),X(t;(u)(·)),(u)(t),p(t;(u)(·)),q(t;(u)(·)))]=E[H(t,X(t;(u)(·)),X(t;(u)(·)),v,p(t;(u)(·)),q(t;(u)(·)))],(V)v∈V, a.s.此时一阶随机最大值原理失效。  本文研究了状态方程为:X(t)=x0+∫10E[f(t,(Xt),Xt,vt)]dt+∫10E[σ(t,(Xt),Xt)]dWt, t∈[0,1]。代价泛函为:J(v(·))=E{E[∫10l(s,(Xs)Xs,vs)ds+h(X(1),X(1))]}。的奇异平均场控制问题。首先对状态方程的解进行先验估计,通过泰勒展式将状态变量和代价泛函展至二阶,并给出余项的精确估计。然后选取适当的一阶和二阶伴随过程,对变分不等式进行处理。最后利用针状变分和向量值测度论相关知识,得到平均场奇异控制问题的二阶随机最大值原理的充分条件。  假设如下条件成立:(A3)函数f:[0,1]×Rn×Rn×(U)→Rn,σ:[0,1]×Rn×Rn→Rn×m,l:[0,1]×Rn×Rn×U→R,h:Rn×Rn→R。关于其相应测度博雷尔可测,关于变量u连续,对于固定的(t,u)关于x,x连续可微,并且对于大于0的常数K0有下列不等式成立:(i)(1+|x|+|x|+|u|)-1|f(t,x,x,u)|+|fx(t,x,x,u)|+|fx,(t,x,x,u)|≤K0,(ii)(1+|x|+| x|)-1|σi(t,x,x)|+|σix(t,x,x)|+|σix(t,x,x)|≤K0,(iii)(1+|x|2+|x|2+|u|2)-1|l(t,x,x,u)|+(1+| x|+| x|+|u|)-1(| lx(t,x,x,u)|+|lx(t,x,x,u)|)≤K0,(iv)|hx(x,x)|+|hx(x,x)|≤K0(|1+|x|+|x|)。另外,上述所有导数均博雷尔可测,并关于x,x连续。  (A4)设f,σi,l,h的一阶导数均关于(U)中的u连续,关于x,x有连续的二阶导数,所有的二阶导数关于(t,x,x,u)均博雷尔可测,并被K0限制住,即:|φxx(t,x,x,u)|+|φxx(t,x,x,u)|+|φxx(t,x,x,u)|≤K0,φ=f,σi,l,h  本文得出的平均场二阶随机最大值原理为如下形式:  令(y(·),u(·))为最优对并且u(·)在区域V上奇异,则存在一个测度为1的子区间I0(=)[0,1],除了满足一阶最大值原理外,还成立如下的二阶最大值条件:E[△H*x(t;v)△f(t;v)+△H*x,(t;v)△f(t;v)+△f*(t;v)P(t)△f(t;v)]≥0。其中H为哈密顿函数,P(t)为二阶伴随过程,△(H)*x(t;v)=H*x(t,y,y,p,q;v)-H*x(t,y,y,p,q;u)。  最后,文章研究了在奇异平均场控制下的线性二次控制问题,给出了一阶和二阶最大值原理的形式。
其他文献
在建立风险模型时,必须考虑各类保单之间的相互关系,确定保单之间的相关性.本文主要研究,在各类风险模型中,保单之间的不同的相关性,对单个时期的保费和单个时期的理赔总量的Lundbe
在本文中,我们考虑非线性不等式约束优化问题。我们知道,梯度投影法是早期求解这类问题的重要的可行方向法之一。近二十年来,一些新的广义梯度投影法被人们所研究。另一方面,为了
本篇论文主要研究了跳扩散过程的随机变换问题与跳扩散随机控制系统的相关理论及其应用。本文主要包括了五部分内容:第一部分叙述了本论文的研究背景;第二部分研究了跳扩散过
近二十年来,随着三维数据采样设备的长足进步与复杂拓扑结构的曲面造型日益普及,细分曲面已成为计算机辅助几何设计(CAGD)和计算机图形学(CG)领域内的一个国际性研究热点之一。细
上世纪二十年代,芬兰数学家R.Nevanlinna建立了复平面C上的亚纯函数值分布理论。此理论为该世纪最为重要的数学理论之一,以两个基本定理为核心内容,即Nevanlinna第一及第二基本