[1]李龙澍 葛瑞峰 王慧萍.基于神经网络的批强化学习在Robocup中的应用[J].计算机技术与发展,2009,(07):98-101.
 LI Long-shu,GE Rui-feng,WANG Hui-ping.Application of Batch Reinforcement Learning Based on NN to Robocup[J].,2009,(07):98-101.
点击复制

基于神经网络的批强化学习在Robocup中的应用()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年07期
页码:
98-101
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Application of Batch Reinforcement Learning Based on NN to Robocup
文章编号:
1673-629X(2009)07-0098-04
作者:
李龙澍12 葛瑞峰12 王慧萍12
[1]安徽大学计算机科学与技术学院[2]安徽大学计算智能与信号处理教育部重点实验室
Author(s):
LI Long-shu GE Rui-feng WANG Hui-ping
[1]School of Computer Science and Technology,Anhui University[2]Ministry of Education Key Lab. of IC & SP at Anhui University
关键词:
批Q-学习神经网络智能体机器人足球比赛
Keywords:
batch Q-learning neural networkagentRoboCup
分类号:
TP183
文献标志码:
A
摘要:
模拟机器人足球比赛(RobotWorld Cup,Robo3Cup)作为多智能体系统的一个通用的实验平台.通过它可以来检验各种理论、算法和框架等,已经成为人工智能的研究热点。针对在复杂条件下的使用传统Q学习方法所产生的收敛速度缓慢和泛化能力不强的问题,文中使用人工化能力,缩短了学习的时间。并最终将其运用到仿真组比赛的Keepaway模型中,以此验证了该方法的有效性
Abstract:
As a representative experimental platform of multi - agent system, RoboCup(Robot World Cup) by which various theories, algorithms and architectures can be evaluated, has become the research center of artificial intelligence. For the converge slowly and ti

相似文献/References:

[1]路川 胡欣杰.区域航空市场航线客流量预测研究[J].计算机技术与发展,2010,(04):84.
 LU Chuan,HU Xin-jie.Analysis of Regional Airline Passenger Forecast Title[J].,2010,(07):84.
[2]高峥 陈蜀宇 李国勇.混合入侵检测系统的研究[J].计算机技术与发展,2010,(06):148.
 GAO Zheng,CHEN Shu-yu,LI Guo-yong.Research of a Hybrid Intrusion Detection System[J].,2010,(07):148.
[3]包力伟 周俊.铸锻企业生产质量控制系统的开发[J].计算机技术与发展,2008,(04):174.
 BAO Li-wei,ZHOU Jun.Development of a Manufacture Quality Control System in Casting Company[J].,2008,(07):174.
[4]李志俊 程家兴 金奎 饶玉佳.基于样本期望训练数的BP神经网络改进研究[J].计算机技术与发展,2009,(05):103.
 LI Zhi-jun,CHENG Jia-xing,JIN Kui,et al.BP Algorithm Improvement Based on Sample Expected Training Number[J].,2009,(07):103.
[5]贾志先.神经网络在空白试卷识别中的应用[J].计算机技术与发展,2009,(08):208.
 JIA Zhi-xian.Application of Neural Network in Recognization Blank Examination Paper[J].,2009,(07):208.
[6]肖宜龙 路游 亓永刚.基于神经网络的NURBS曲面重建[J].计算机技术与发展,2009,(09):65.
 XIAO Yi-long,LU You,QI Yong-gang.NURBS Surface Reconstruction Based on Neural Network[J].,2009,(07):65.
[7]蔡秋茹 罗烨 柳益君 叶飞跃.企业资信的BP神经网络评估模型研究[J].计算机技术与发展,2009,(10):117.
 CAI Qiu-ru,LUO Ye,LIU Yi-jun,et al.Research on BP Neural Network Model for Corporation Credit Rating[J].,2009,(07):117.
[8]王晓敏 刘希玉 戴芬.BP神经网络预测算法的改进及应用[J].计算机技术与发展,2009,(11):64.
 WANG Xiao-min,LIU Xi-yu,DAI Fen.Improvement and Application of BP Neural Network Forecasting Algorithm[J].,2009,(07):64.
[9]崔海青 刘希玉.基于粒子群算法的RBF网络参数优化算法[J].计算机技术与发展,2009,(12):117.
 CUI Hai-qing,LIU Xi-yu.Parameter Optimization Algorithm of RBF Neural Network Based on PSO Algorithm[J].,2009,(07):117.
[10]张莉 姜浩 蒲安建.基于广义径向基函数的神经网络分类预测[J].计算机技术与发展,2009,(03):106.
 ZHANG Li,JIANG Hao,PU An-jian.Classification and Prediction of Neural Network Based on Generalized Radial Basis Function[J].,2009,(07):106.

备注/Memo

备注/Memo:
安徽省自然科学基金(050420204);安徽省高校拔尖人才基金(05025102);安徽省自然科学研究项目(2006KJ098B)李龙澍(1956-),男,教授,博士生导师,研究方向为智能软件和知识工程。
更新日期/Last Update: 1900-01-01