论文部分内容阅读
本文主要研究关于奇异平均场随机控制问题的二阶随机最大值原理问题。1990年Pardoux和Peng首先创立了非线性倒向随机微分方程理论。同年,Peng发现了经典随机控制问题的一阶随机最大值原理。2012年,Li将经典一阶随机最大值原理推广到平均场情况。 一个平均场容许控制(u)(·)称为在区域V上是奇异的,若V(=)U非空,并且对于几乎处处的t∈[0,1],我们有如下等式成立:E[H(t,X(t;(u)(·)),X(t;(u)(·)),(u)(t),p(t;(u)(·)),q(t;(u)(·)))]=E[H(t,X(t;(u)(·)),X(t;(u)(·)),v,p(t;(u)(·)),q(t;(u)(·)))],(V)v∈V, a.s.此时一阶随机最大值原理失效。 本文研究了状态方程为:X(t)=x0+∫10E[f(t,(Xt),Xt,vt)]dt+∫10E[σ(t,(Xt),Xt)]dWt, t∈[0,1]。代价泛函为:J(v(·))=E{E[∫10l(s,(Xs)Xs,vs)ds+h(X(1),X(1))]}。的奇异平均场控制问题。首先对状态方程的解进行先验估计,通过泰勒展式将状态变量和代价泛函展至二阶,并给出余项的精确估计。然后选取适当的一阶和二阶伴随过程,对变分不等式进行处理。最后利用针状变分和向量值测度论相关知识,得到平均场奇异控制问题的二阶随机最大值原理的充分条件。 假设如下条件成立:(A3)函数f:[0,1]×Rn×Rn×(U)→Rn,σ:[0,1]×Rn×Rn→Rn×m,l:[0,1]×Rn×Rn×U→R,h:Rn×Rn→R。关于其相应测度博雷尔可测,关于变量u连续,对于固定的(t,u)关于x,x连续可微,并且对于大于0的常数K0有下列不等式成立:(i)(1+|x|+|x|+|u|)-1|f(t,x,x,u)|+|fx(t,x,x,u)|+|fx,(t,x,x,u)|≤K0,(ii)(1+|x|+| x|)-1|σi(t,x,x)|+|σix(t,x,x)|+|σix(t,x,x)|≤K0,(iii)(1+|x|2+|x|2+|u|2)-1|l(t,x,x,u)|+(1+| x|+| x|+|u|)-1(| lx(t,x,x,u)|+|lx(t,x,x,u)|)≤K0,(iv)|hx(x,x)|+|hx(x,x)|≤K0(|1+|x|+|x|)。另外,上述所有导数均博雷尔可测,并关于x,x连续。 (A4)设f,σi,l,h的一阶导数均关于(U)中的u连续,关于x,x有连续的二阶导数,所有的二阶导数关于(t,x,x,u)均博雷尔可测,并被K0限制住,即:|φxx(t,x,x,u)|+|φxx(t,x,x,u)|+|φxx(t,x,x,u)|≤K0,φ=f,σi,l,h 本文得出的平均场二阶随机最大值原理为如下形式: 令(y(·),u(·))为最优对并且u(·)在区域V上奇异,则存在一个测度为1的子区间I0(=)[0,1],除了满足一阶最大值原理外,还成立如下的二阶最大值条件:E[△H*x(t;v)△f(t;v)+△H*x,(t;v)△f(t;v)+△f*(t;v)P(t)△f(t;v)]≥0。其中H为哈密顿函数,P(t)为二阶伴随过程,△(H)*x(t;v)=H*x(t,y,y,p,q;v)-H*x(t,y,y,p,q;u)。 最后,文章研究了在奇异平均场控制下的线性二次控制问题,给出了一阶和二阶最大值原理的形式。