«上一篇/Previous Article|本期目录/Table of Contents|下一篇/Next Article»

[1]马勇李龙澍李学俊.基于Q学习的Agent智能防守策略研究与应用[J].计算机技术与发展,2008,(12):106-108.
　MA Yong,LI Long-shu,LI Xue-jun.Research and Application about Defensive Strategy Based on Q Learning[J].,2008,(12):106-108.
点击复制

基于Q学习的Agent智能防守策略研究与应用()

分享到：

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:: 2008年12期

页码:: 106-108

栏目:: 智能、算法、系统工程

出版日期:: 1900-01-01

文章信息/Info

Title:: Research and Application about Defensive Strategy Based on Q Learning

文章编号:: 1673-629X（2008）12-0106-03

作者:: 马勇¹; 2 李龙澍¹; 2 李学俊¹; 2; [1]安徽大学计算智能与信号处理教育部重点实验室[2]安徽大学计算机科学与技术学院

Author(s):: MA Yong; LI Long-shu; LI Xue-jun; Ministry of Education Key Lab. of IC ＆ SP at Anhui University,Hefei 230039,China; School of Computer Science and Technology,Anhui University

关键词:: Q学习; 智能体; 机器人足球比赛; 防守策略

Keywords:: Q learning; agent; RoboCup; defensive strategy

分类号:: TP18

文献标志码:: A

摘要:: 模拟机器人足球比赛（Robot World Cup，RoboCup）作为多Agent系统的一个通用的实验平台，通过它可以来评价各种理论、算法和框架等，已经成为人工智能的研究热点。针对RoboCup仿真中的守门员防守问题，基于Q学习算法，描述了在特定场景中应用Q学习训练守门员的方法和过程。在RobCup中验证了该算法，实现了守门员防守策略的优化

Abstract:: As a representative experimental platform of multiagent system, RoboCup（Robot World Cup） by which various theories, algorithms and architectures can be evaluated, has become the research center of artificial intelligence. To rcsolve the problem about defe

相似文献/References:

[1]李龙澍葛瑞峰王慧萍.基于神经网络的批强化学习在Robocup中的应用[J].计算机技术与发展,2009,(07):98.
　LI Long-shu,GE Rui-feng,WANG Hui-ping.Application of Batch Reinforcement Learning Based on NN to Robocup[J].,2009,(12):98.
[2]马勇李龙澍李学俊.基于动态目标驱动的RoboCup进攻策略的研究[J].计算机技术与发展,2008,(01):84.
　MA Yong,LI Long-shu,LI Xue-jun.Research about Offensive Strategy Based on Dynamic Goal- Driven in RoboCup[J].,2008,(12):84.
[3]于东超耿祥义刘泮青.5vs5仿真机器人足球比赛——防守算法研究[J].计算机技术与发展,2008,(02):59.
　YU Dong-chao,GENG Xiang-yi,LIU Pan-qing.5vs5 Simulation Robot Soccer Competition： Defence Algorithm Research[J].,2008,(12):59.
[4]朱志强王建元王芳.基于Agent的核心计算机操作机制研究[J].计算机技术与发展,2007,(07):8.
　ZHU Zhi-qiang,WANG Jian-yuan,WANG Fang.Agent - Based Research of Operational Mechanism for Core Computer[J].,2007,(12):8.
[5]刘丹谢益武.面向智能体的信息系统开发方法研究[J].计算机技术与发展,2006,(03):101.
　LIU Dan,XIE Yi-wu.Research on Development Methods in Agent-Oriented IS[J].,2006,(12):101.
[6]吴智威刘东峰程昱孙粤辉.基于智能体方法的人群疏散三维仿真[J].计算机技术与发展,2012,(11):108.
　WU Zhi-wei,LIU Dong-feng,CHENG Yu,et al.Three-dimensional Crowd Simulation of Agent,based Method[J].,2012,(12):108.
[7]聂建强,徐大林.基于模糊Q学习的分布式自适应交通信号控制[J].计算机技术与发展,2013,(03):171.
　NIE Jian-qiang,XU Da-lin.Distributed Adaptive Traffic Signal Control Based on Fuzzy Q-Learning[J].,2013,(12):171.
[8]李文振,万晓冬,李育岭,等.基于XML的作战仿真想定的研究与实现[J].计算机技术与发展,2013,(06):183.
　LI Wen-zhen,WAN Xiao-dong,LI Yu-ling,et al.Research and Implementation of Operation Simulation Scenario Based on XML[J].,2013,(12):183.
[9]赵莉,李蜀瑜.基于DEC_POMDP的Web服务组合优化算法[J].计算机技术与发展,2014,24(03):74.
　ZHAO Li,LI Shu-yu.Web Service Composition Optimization Algorithm Based on DEC_POMDP[J].,2014,24(12):74.
[10]赵春,方敏. 基于区域分割的交通仿真死锁处理算法研究[J].计算机技术与发展,2017,27(05):25.
　ZHAO Chun,FANG Min. Investigation on Deadlock Resolution Algorithm for Traffic Simulation with Region Segmentation[J].,2017,27(12):25.
[11]周勇刘锋.基于改进的Q学习的RoboCup传球策略研究[J].计算机技术与发展,2008,(04):63.
　ZHOU Yong,LIU Feng.Research of RoboCup Pass Strategy Based on Improved Q- Learning[J].,2008,(12):63.

备注/Memo

备注/Memo:: 国家自然科学基金（60273043）;安徽省自然科学基金（050420204）;安徽省教育厅自然科学研究项目（KJ20078153）马勇（1980-），男，安徽和县人，硕士研究生，研究方向为机器学习、智能软件；李龙澍，博导，教授，研究方向为智能软件、知识工程、软件体系结构

常用功能

工具/Tools

统计/Statistics

摘要浏览/Viewed711
全文下载/Downloads306
评论/Comments

更新日期/Last Update: 1900-01-01