[1]庞士焕 朱相冰 张琦[] 汤萍萍[].基于MAXQ方法的分层强化学习[J].计算机技术与发展,2009,(04):154-156.
 PANG Shi-huan,ZHU Xiang-bing,ZHANG Qi,et al.Hierarchical Reinforcement Learning with MAXQ Method[J].,2009,(04):154-156.
点击复制

基于MAXQ方法的分层强化学习()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年04期
页码:
154-156
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Hierarchical Reinforcement Learning with MAXQ Method
文章编号:
1673-629X(2009)04-0154-03
作者:
庞士焕1 朱相冰2 张琦[3] 汤萍萍[4]
[1]安徽师范大学教育科学学院[2]安徽师范大学物理与电子信息工程学院[3]西北大学软件学院[4]东南大学计算机学院
Author(s):
PANG Shi-huan ZHU Xiang-bing ZHANG Qi TANG Ping-ping
关键词:
分层强化学习MAXQMDP
Keywords:
hierarchical reinforcement learning MAXQ MDP
分类号:
TP393
文献标志码:
A
摘要:
强化学习是机器学习领域的一个重要分支,但在强化学习系统中,学习的数量会随着状态变量的个数成指数级增长,从而形成“维数灾”。为此提出了一种基于MAxQ的分层强化学习方法,通过引入抽象机制将强化学习任务分解到不同层次上来分别实现,使得每层上的学习任务仅需在较小的空间中进行,从而大大减少了学习的数量和规模。并给出具体算法——MAXQ—RLA
Abstract:
Reinforcement learning is an important branch of machine learning. In the system of reinforcement learning,the learning stategies increase exponentially along with the number of state variables, which is called "dimensions disaster". Here a hierarchical r

备注/Memo

备注/Memo:
安徽省教育重点项目(KJ2008A142C);安徽省自然科学基金项目(KJ20078061)庞士焕(1955-),女,安徽芜湖人,实验师,研究方向为计算机科学。
更新日期/Last Update: 1900-01-01