一种基于示例轨迹的抽象动作树构造方法

来源 :计算机与现代化 | 被引量 : 1次 | 上传用户:kevinlpr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动构造抽象动作一直是分层强化学习研究中的关键技术之一。抽象动作链接算法是目前连续任务中自主发现抽象动作的典型算法,但是抽象动作链接算法需要进行很多次的迭代计算,收敛速度较慢。本文提出一种基于示例轨迹的抽象动作树构造算法(ACADT),通过使用一种变点侦测方法,ACADT把每一个轨迹分割成一个抽象动作链。这些从轨迹中分割得到的抽象动作链随后被合并成一棵抽象动作树。实验表明ACADT可以构造成一棵抽象动作树并能够更快收敛。
其他文献
跨站脚本攻击(Cross-site scripting,XSS)是一种危害严重的Web漏洞,其中反射型XSS是最常见的一种XSS,对于反射型XSS的检测尤为重要。然而反射型XSS变种繁多,基于规则的传统XS
受益权转让信托融资是商业银行为满足部分中高端客户的融资需求,自主设计融资方案并发行理财产品,利用信托公司认可的信托计划设计交易结构,在不占用信贷规模的前提下,将理财资金
报纸