[1]马勇 李龙澍 李学俊.基于Q学习的Agent智能防守策略研究与应用[J].计算机技术与发展,2008,(12):106-108.
 MA Yong,LI Long-shu,LI Xue-jun.Research and Application about Defensive Strategy Based on Q Learning[J].,2008,(12):106-108.
点击复制

基于Q学习的Agent智能防守策略研究与应用()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2008年12期
页码:
106-108
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research and Application about Defensive Strategy Based on Q Learning
文章编号:
1673-629X(2008)12-0106-03
作者:
马勇12 李龙澍12 李学俊12
[1]安徽大学计算智能与信号处理教育部重点实验室[2]安徽大学计算机科学与技术学院
Author(s):
MA Yong LI Long-shu LI Xue-jun
Ministry of Education Key Lab. of IC & SP at Anhui University,Hefei 230039,China; School of Computer Science and Technology,Anhui University
关键词:
Q学习智能体机器人足球比赛防守策略
Keywords:
Q learning agent RoboCup defensive strategy
分类号:
TP18
文献标志码:
A
摘要:
模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个通用的实验平台,通过它可以来评价各种理论、算法和框架等,已经成为人工智能的研究热点。针对RoboCup仿真中的守门员防守问题,基于Q学习算法,描述了在特定场景中应用Q学习训练守门员的方法和过程。在RobCup中验证了该算法,实现了守门员防守策略的优化
Abstract:
As a representative experimental platform of multiagent system, RoboCup(Robot World Cup) by which various theories, algorithms and architectures can be evaluated, has become the research center of artificial intelligence. To rcsolve the problem about defe

相似文献/References:

[1]李龙澍 葛瑞峰 王慧萍.基于神经网络的批强化学习在Robocup中的应用[J].计算机技术与发展,2009,(07):98.
 LI Long-shu,GE Rui-feng,WANG Hui-ping.Application of Batch Reinforcement Learning Based on NN to Robocup[J].,2009,(12):98.
[2]马勇 李龙澍 李学俊.基于动态目标驱动的RoboCup进攻策略的研究[J].计算机技术与发展,2008,(01):84.
 MA Yong,LI Long-shu,LI Xue-jun.Research about Offensive Strategy Based on Dynamic Goal- Driven in RoboCup[J].,2008,(12):84.
[3]于东超 耿祥义 刘泮青.5vs5仿真机器人足球比赛——防守算法研究[J].计算机技术与发展,2008,(02):59.
 YU Dong-chao,GENG Xiang-yi,LIU Pan-qing.5vs5 Simulation Robot Soccer Competition: Defence Algorithm Research[J].,2008,(12):59.
[4]朱志强 王建元 王芳.基于Agent的核心计算机操作机制研究[J].计算机技术与发展,2007,(07):8.
 ZHU Zhi-qiang,WANG Jian-yuan,WANG Fang.Agent - Based Research of Operational Mechanism for Core Computer[J].,2007,(12):8.
[5]刘丹 谢益武.面向智能体的信息系统开发方法研究[J].计算机技术与发展,2006,(03):101.
 LIU Dan,XIE Yi-wu.Research on Development Methods in Agent-Oriented IS[J].,2006,(12):101.
[6]吴智威 刘东峰 程昱 孙粤辉.基于智能体方法的人群疏散三维仿真[J].计算机技术与发展,2012,(11):108.
 WU Zhi-wei,LIU Dong-feng,CHENG Yu,et al.Three-dimensional Crowd Simulation of Agent,based Method[J].,2012,(12):108.
[7]聂建强,徐大林.基于模糊Q学习的分布式自适应交通信号控制[J].计算机技术与发展,2013,(03):171.
 NIE Jian-qiang,XU Da-lin.Distributed Adaptive Traffic Signal Control Based on Fuzzy Q-Learning[J].,2013,(12):171.
[8]李文振,万晓冬,李育岭,等.基于XML的作战仿真想定的研究与实现[J].计算机技术与发展,2013,(06):183.
 LI Wen-zhen,WAN Xiao-dong,LI Yu-ling,et al.Research and Implementation of Operation Simulation Scenario Based on XML[J].,2013,(12):183.
[9]赵莉,李蜀瑜.基于DEC_POMDP的Web服务组合优化算法[J].计算机技术与发展,2014,24(03):74.
 ZHAO Li,LI Shu-yu.Web Service Composition Optimization Algorithm Based on DEC_POMDP[J].,2014,24(12):74.
[10]赵春,方敏. 基于区域分割的交通仿真死锁处理算法研究[J].计算机技术与发展,2017,27(05):25.
 ZHAO Chun,FANG Min. Investigation on Deadlock Resolution Algorithm for Traffic Simulation with Region Segmentation[J].,2017,27(12):25.
[11]周勇 刘锋.基于改进的Q学习的RoboCup传球策略研究[J].计算机技术与发展,2008,(04):63.
 ZHOU Yong,LIU Feng.Research of RoboCup Pass Strategy Based on Improved Q- Learning[J].,2008,(12):63.

备注/Memo

备注/Memo:
国家自然科学基金(60273043);安徽省自然科学基金(050420204);安徽省教育厅自然科学研究项目(KJ20078153)马勇(1980-),男,安徽和县人,硕士研究生,研究方向为机器学习、智能软件;李龙澍,博导,教授,研究方向为智能软件、知识工程、软件体系结构
更新日期/Last Update: 1900-01-01