基于深度强化学习的无线传感器网络调度与路由优化

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:Glorygwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无线传感器网络在工业生产、智能交通、环境监控等领域都有广泛的运用,主要的挑战都集中在实时、能量管理、部署与定位、路由、数据融合与压缩等,目的都是为了解决在有限的能源下最大化无线传感器网络的效用。强化学习是机器学习的三大分支之一,通过Agent不断与环境交互来进行学习,以获得在特定场景下的最佳策略。本文利用强化学习来解决无线传感器网络当中的节点调度与路由问题。无线传感器的节点调度是其研究的一个热点,即如何在满足覆盖率和检测概率的前提下,在N个节点中选取K个节点作为活跃节点,其他节点进入休眠状态以节约能量。基于Q-learning算法设计了节点调度方法,能够周期性更新调度策略,并不断学习来更新状态-动作对的Q值,在调度时通过ε-greedy函数来输出实际调度策略。路由协议也一直是无线传感器网络的热点研究方向,网络延迟、负载平衡、生存周期、能耗均衡是路由协议需要解决的问题。基于深度强化学习算法-DQN来规划路由路径,当节点的本地缓存区满时,通过多跳的方式向基站传输数据。强化学习的直接奖励主要考虑步进距离、单跳能量消耗、相邻节点的能耗均衡、和重传可能带来的负面影响。实验采用Python开发了仿真环境和强化学习训练环境,并与现有方案在相关指标上进行了比较。节点调度优化实验中证明基于协同强化学习的调度方法比随机、最短距离方法在覆盖率和能耗均衡上取得了更好的效果。在路由实验中,对节点的Q值进行实验分析证明了算法的收敛,并与LEACH、FTIEE等协议进行比较,证明了路由算法能有效延长网络生存周期,并实现负载均衡。
其他文献
针对辣素类似物防污剂通过混合加入到防污涂料中释放速度过快的问题,本实验将N-(4-羟基-3-甲氧基)苄基丙烯酰胺(HMBA)通过共聚合的方法引入到丙烯酸树脂中以延长其防污期效。
近年来,随着科学技术的发展,焦化产业的市场需求逐渐减少。因其产能利用率比较低,再加上节能减排约束的加大,企业的资金和效益呈现严重的下滑趋势。然而在困境中艰难发展的焦化企
回顾了国内外有关商业银行IT投资对其绩效影响的研究,在传统共谋假说验证模型的基础上,加入IT投资变量,并应用ATM安装数量作为IT投资的衡量变量,对我国银行业中有代表性的14家商
为研究轻质合金药型罩的侵彻性能,采用X光照相技术对两种大锥角钛合金药型罩的射流成型及其对钢靶的侵彻行为进行了实验研究.结果表明,140°锥角药型罩产生的射流近似为EFP,
<正>白血病抑制因子(leukemia inhibitory factor,LIF)是60年代末发现的一种多功能的细胞因子,因能抑制小鼠M1型髓样白血病细胞增殖并诱导其向正常Mφ样细胞分化而得名。研究
在模拟氨氮废水中进行磷酸铵镁(MAP)沉淀实验,研究回收MAP的适宜条件.结果表明:在pH值8.0~11.0之间时生成的沉淀主要成分为MAP;当pH值为10.0,离子配比n(NH4+)∶n(Mg2+)∶n(PO4
本文讨论的是客家研究的基本单位问题。在梳理人类学、社会学以及客家研究领域诸多观点的基础上,依据客家领域的研究成果以及田野作业经验,从构成村落的主体、村落运作的制度化
由于受特别权力关系理论及行政诉讼受案范围的影响,只有部分类型的高校与学生纠纷案件可以进入司法审查程序。因此,学生权利救济的受保障程度不高。学生申诉是一种非诉讼类的行
厥,是商周时期海岱地区的一个东夷小国,由于传世文献奇缺,人们对其历史和文化面貌知之甚少。据甲骨文和金文知其在商代已经建国,西周被封为子爵国,大约存有400年以上的历史。
棱镜机构是实现对位的关键部件.为提高对位精度,在棱镜的棱脊倾斜和偏转状态下,应用动态光学理论推导出反射光线实际出射方向与理想出射方向的角度偏差以及实际图像与理想图