[1]庞士焕 朱相冰 张琦[] 汤萍萍[].基于MAXQ方法的分层强化学习[J].计算机技术与发展,2009,(04):154-156.
PANG Shi-huan,ZHU Xiang-bing,ZHANG Qi,et al.Hierarchical Reinforcement Learning with MAXQ Method[J].,2009,(04):154-156.
点击复制
基于MAXQ方法的分层强化学习(
)
《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]
- 卷:
-
- 期数:
-
2009年04期
- 页码:
-
154-156
- 栏目:
-
智能、算法、系统工程
- 出版日期:
-
1900-01-01
文章信息/Info
- Title:
-
Hierarchical Reinforcement Learning with MAXQ Method
- 文章编号:
-
1673-629X(2009)04-0154-03
- 作者:
-
庞士焕1 朱相冰2 张琦[3] 汤萍萍[4]
-
[1]安徽师范大学教育科学学院[2]安徽师范大学物理与电子信息工程学院[3]西北大学软件学院[4]东南大学计算机学院
- Author(s):
-
PANG Shi-huan; ZHU Xiang-bing; ZHANG Qi; TANG Ping-ping
-
-
- 关键词:
-
分层强化学习; MAXQ; MDP
- Keywords:
-
hierarchical reinforcement learning; MAXQ; MDP
- 分类号:
-
TP393
- 文献标志码:
-
A
- 摘要:
-
强化学习是机器学习领域的一个重要分支,但在强化学习系统中,学习的数量会随着状态变量的个数成指数级增长,从而形成“维数灾”。为此提出了一种基于MAxQ的分层强化学习方法,通过引入抽象机制将强化学习任务分解到不同层次上来分别实现,使得每层上的学习任务仅需在较小的空间中进行,从而大大减少了学习的数量和规模。并给出具体算法——MAXQ—RLA
- Abstract:
-
Reinforcement learning is an important branch of machine learning. In the system of reinforcement learning,the learning stategies increase exponentially along with the number of state variables, which is called "dimensions disaster". Here a hierarchical r
备注/Memo
- 备注/Memo:
-
安徽省教育重点项目(KJ2008A142C);安徽省自然科学基金项目(KJ20078061)庞士焕(1955-),女,安徽芜湖人,实验师,研究方向为计算机科学。
更新日期/Last Update:
1900-01-01