随机策略相关论文
本文主要研究随机环境下连续时间马尔可夫决策过程的最优控制问题.首先我们给出一些条件证明了在有限时间里最优控制策略的存在性;......
我们在使用传统的监督学习方法做分类任务时,都希望有较多的标注数据可供学习。正所谓“见多识广”。当可供训练的数据增多时,通过......
随着移动网络的快速发展,移动蜂窝网络的能量消耗成本和碳的排放量剧烈增长,能量利用率已经成为了未来绿色节能蜂窝网络的设计准则......
随着计算机网络技术的发展和进步,以及服务带宽的不断提高,人们对视频媒体业务的需求也在日益增加,网络视频服务正处于高速发展阶......
随着课程教学改革的不断深入,人才培养模式和考核方式也发生了重大变化。作为教育的重要环节——考试方法已经成为教学改革的重点,也......
本文主要在没有Isaacs条件下,研究带有不对称信息和相关信息的两人零和微分博弈以下两类问题:即上值函数的上共轭的等价形式,以及......
我们为分布式业务系统提出了一种基于模型与预测的接入控制方法.首先,使用部分可观Markov决策过程(POMDP)来为业务系统建模.接着,......
在线算法与竞争分析是研究信息不确定决策问题的一种新工具,应用该方法研究在线租赁问题是近年来国内外的一个研究热点。在前人研......
由于数据规模的快速增长,高效用序列模式挖掘算法效率严重下降.针对这种情况,提出基于Map Reduce的高效用序列模式挖掘算法Hus Ma ......
LPA中存在的随机策略,严重破坏算法的鲁棒性.随着大数据时代的来临,复杂网络的规模不断增大,从而造成算法的运算量增加,收敛速度减......
提出一种基于随机策略进行运动目标检测的方法。方法的主要创新点:(1)利用视频序列第1帧完成背景模型的初始化;(2)建立特定的运动......
对于订单具有紧交货期限且以最大化完工总收益为目标的占线订单排序问题,Woeginger提出了完工收益与订单长度满足D-收益函数的模型......
针对软件定义网络(SDN)环境下的媒体分发网络的接入控制问题,提出了一种综合考虑服务节点和传输链路服务性能优化问题的接入控制方案......
对于订单具有紧交货期限且以最大化完工总收益为目标的占线订单排序问题,Woeginger(1994)提出了完工收益与订单长度满足C——收益函数......
随着科学技术的发展和人们生活水平的提高,人类在生产过程中消耗了大量能源,其中大部分是不可再生资源,能源问题已成为现代社会最......
主要研究在网络节点和链路上均有限制条件的网络模型,并提出了一种多限制条件下的QoS路由算法。在该算法中,文章采用了预先处理链路......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
现代企业制定生产计划的主要依据是客户订单,如何对订单进行合理排序从而获得更大收益成为企业在竞争中获胜的关键。论文针对到达......
In the recent research of network sampling, some sampling concepts are misunderstood, and the variance of subnets is not......
无线传感器网络以其低廉的部署成本,较高的测量精度,以及较长的可使用时间被广泛的应用于控制监测等领域当中,具有广阔的发展前景[23]......
为了克服原始果蝇优化算法在求解多峰值函数和高维度函数时容易早熟、效率低等问题,针对原始果蝇优化算法中存在的弊端,创新性地提......
视频监控以其视觉直观、准确及时、内容信息丰富等优点在安防技术中得到广泛应用,而运动目标检测是由传统视频监控转向智能视频监控......