基于Q学习和TD误差的传感器节点任务调度算法

来源 :合肥工业大学学报(自然科学版) | 被引量 : 0次 | 上传用户:QQainigirl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有合作学习算法存在频繁通信、能量消耗过大等问题,应用目标跟踪建立任务模型,文章提出一种基于Q学习和TD误差(Q-learning and TDerror,QT)的传感器节点任务调度算法。具体包括将传感器节点任务调度问题映射成Q学习可解决的学习问题,建立邻居节点间的协作机制以及定义延迟回报、状态空间等基本学习元素。在协作机制中,QT使得传感器节点利用个体和群体的TD误差,通过动态改变自身的学习速度来平衡自身利益和群体利益。此外,QT根据Metropolis准则提高节点学习前期的探索概率,优化任务选择。
其他文献
高职高专会计专业学生的培养目标、生源层次、就业方向均与本科院校会计专业不同.目前高职高专会计专业的教学中,存在着培养目标重点不够突出、课程结构不尽合理、实训手段比
回顾会计改革的历史,追溯调整的处理有其合理性,但现在,特别是当由于追加投资而取得控制或重大影响时,由成本法转换为权益法时再采用追溯调整法,来调整长期股权投资的账面价
货币资金是企业重要的流动资产,其固有风险较高.笔者在文中探讨了有关货币资金纠错防弊的关键控制措施,愿与业界同行商榷.
经理股票期权在我国被运用得越来越广泛,关于经理股票期权的确认归属可以在'费用'里列支,也可以在'利润分配'中列支.参考美国的做法,结合我国的试点情况,本