[1]周勇 刘锋.基于改进的Q学习的RoboCup传球策略研究[J].计算机技术与发展,2008,(04):63-66.
 ZHOU Yong,LIU Feng.Research of RoboCup Pass Strategy Based on Improved Q- Learning[J].,2008,(04):63-66.
点击复制

基于改进的Q学习的RoboCup传球策略研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2008年04期
页码:
63-66
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research of RoboCup Pass Strategy Based on Improved Q- Learning
文章编号:
1673-629X(2008)04-0063-04
作者:
周勇 刘锋
安徽大学计算机科学与技术学院
Author(s):
ZHOU Yong LIU Feng
School of Computer ,Science and Engineering, Anhui University
关键词:
RoboCup神经网络Q学习智能体传球策略
Keywords:
RoboCup neural network Q-learning agent pass strategy
分类号:
TP242.6
文献标志码:
A
摘要:
模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个理想的实验平台,已经成为人工智能的研究热点。传统的Q学习已被有效地应用于处理RoboCup中传球策略问题,但是它仅能简单地离散化连续的状态、动作空间。提出将神经网络应用于Q学习,系统只需学习部分状态一动作的Q值即可获得近似连续的Q值,就可以有效地提高泛化能力。然后将改进的Q学习应用于优化传球策略,最后在RoboCup中实现测试了该算法,实验结果表明改进的Q学习在RoboCup传球策略中的应用,可以有效提高传球的成
Abstract:
As the ideal experimental platform of multi-agent system, RoboCup(Robot World Cup) has become the research center of artificial intelligence. Traditional Q-learning dispersed sequential state and action simply on resolving the problem about pass strategy

相似文献/References:

[1]路川 胡欣杰.区域航空市场航线客流量预测研究[J].计算机技术与发展,2010,(04):84.
 LU Chuan,HU Xin-jie.Analysis of Regional Airline Passenger Forecast Title[J].,2010,(04):84.
[2]高峥 陈蜀宇 李国勇.混合入侵检测系统的研究[J].计算机技术与发展,2010,(06):148.
 GAO Zheng,CHEN Shu-yu,LI Guo-yong.Research of a Hybrid Intrusion Detection System[J].,2010,(04):148.
[3]包力伟 周俊.铸锻企业生产质量控制系统的开发[J].计算机技术与发展,2008,(04):174.
 BAO Li-wei,ZHOU Jun.Development of a Manufacture Quality Control System in Casting Company[J].,2008,(04):174.
[4]李志俊 程家兴 金奎 饶玉佳.基于样本期望训练数的BP神经网络改进研究[J].计算机技术与发展,2009,(05):103.
 LI Zhi-jun,CHENG Jia-xing,JIN Kui,et al.BP Algorithm Improvement Based on Sample Expected Training Number[J].,2009,(04):103.
[5]李龙澍 葛瑞峰 王慧萍.基于神经网络的批强化学习在Robocup中的应用[J].计算机技术与发展,2009,(07):98.
 LI Long-shu,GE Rui-feng,WANG Hui-ping.Application of Batch Reinforcement Learning Based on NN to Robocup[J].,2009,(04):98.
[6]贾志先.神经网络在空白试卷识别中的应用[J].计算机技术与发展,2009,(08):208.
 JIA Zhi-xian.Application of Neural Network in Recognization Blank Examination Paper[J].,2009,(04):208.
[7]肖宜龙 路游 亓永刚.基于神经网络的NURBS曲面重建[J].计算机技术与发展,2009,(09):65.
 XIAO Yi-long,LU You,QI Yong-gang.NURBS Surface Reconstruction Based on Neural Network[J].,2009,(04):65.
[8]蔡秋茹 罗烨 柳益君 叶飞跃.企业资信的BP神经网络评估模型研究[J].计算机技术与发展,2009,(10):117.
 CAI Qiu-ru,LUO Ye,LIU Yi-jun,et al.Research on BP Neural Network Model for Corporation Credit Rating[J].,2009,(04):117.
[9]王晓敏 刘希玉 戴芬.BP神经网络预测算法的改进及应用[J].计算机技术与发展,2009,(11):64.
 WANG Xiao-min,LIU Xi-yu,DAI Fen.Improvement and Application of BP Neural Network Forecasting Algorithm[J].,2009,(04):64.
[10]崔海青 刘希玉.基于粒子群算法的RBF网络参数优化算法[J].计算机技术与发展,2009,(12):117.
 CUI Hai-qing,LIU Xi-yu.Parameter Optimization Algorithm of RBF Neural Network Based on PSO Algorithm[J].,2009,(04):117.

备注/Memo

备注/Memo:
国家自然科学基金(60273043);安徽省自然科学基金(050420204)周勇(1967-),男,安徽合肥人,硕士,讲师,研究方向为机器学习、Agent;刘锋,博士,教授,研究方向为并行分布计算、计算机网络
更新日期/Last Update: 1900-01-01