«上一篇/Previous Article|本期目录/Table of Contents|下一篇/Next Article»

[1]庞士焕朱相冰张琦[] 汤萍萍[].基于MAXQ方法的分层强化学习[J].计算机技术与发展,2009,(04):154-156.
　PANG Shi-huan,ZHU Xiang-bing,ZHANG Qi,et al.Hierarchical Reinforcement Learning with MAXQ Method[J].,2009,(04):154-156.
点击复制

基于MAXQ方法的分层强化学习()

分享到：

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:: 2009年04期

页码:: 154-156

栏目:: 智能、算法、系统工程

出版日期:: 1900-01-01

文章信息/Info

Title:: Hierarchical Reinforcement Learning with MAXQ Method

文章编号:: 1673-629X（2009）04-0154-03

作者:: 庞士焕¹ 朱相冰² 张琦[3] 汤萍萍[4]; [1]安徽师范大学教育科学学院[2]安徽师范大学物理与电子信息工程学院[3]西北大学软件学院[4]东南大学计算机学院

Author(s):: PANG Shi-huan; ZHU Xiang-bing; ZHANG Qi; TANG Ping-ping

关键词:: 分层强化学习; MAXQ; MDP

Keywords:: hierarchical reinforcement learning; MAXQ; MDP

分类号:: TP393

文献标志码:: A

摘要:: 强化学习是机器学习领域的一个重要分支，但在强化学习系统中，学习的数量会随着状态变量的个数成指数级增长，从而形成“维数灾”。为此提出了一种基于MAxQ的分层强化学习方法，通过引入抽象机制将强化学习任务分解到不同层次上来分别实现，使得每层上的学习任务仅需在较小的空间中进行，从而大大减少了学习的数量和规模。并给出具体算法——MAXQ—RLA

Abstract:: Reinforcement learning is an important branch of machine learning. In the system of reinforcement learning,the learning stategies increase exponentially along with the number of state variables, which is called ＂dimensions disaster＂. Here a hierarchical r

备注/Memo

备注/Memo:: 安徽省教育重点项目（KJ2008A142C）;安徽省自然科学基金项目（KJ20078061）庞士焕（1955-），女，安徽芜湖人，实验师，研究方向为计算机科学。

常用功能

工具/Tools

统计/Statistics

摘要浏览/Viewed566
全文下载/Downloads400
评论/Comments

更新日期/Last Update: 1900-01-01