相似文献/References:
[1]卢 涛,万凌峰,李 妍,等.基于 V2X 的智能网联交叉口信号控制系统设计[J].计算机技术与发展,2021,31(10):161.[doi:10. 3969 / j. issn. 1673-629X. 2021. 10. 027]
LU Tao,WAN Ling-feng,LI Yan,et al.Design of Intelligent Signal Control System of Intersections Based on V2X[J].,2021,31(11):161.[doi:10. 3969 / j. issn. 1673-629X. 2021. 10. 027]
[2]彭云建,梁 进.基于探索-利用权衡优化的 Q 学习路径规划[J].计算机技术与发展,2022,32(04):1.[doi:10. 3969 / j. issn. 1673-629X. 2022. 04. 001]
PENG Yun-jian,LIANG Jin.Q-learning Path Planning Based on Exploration / Exploitation Tradeoff Optimization[J].,2022,32(11):1.[doi:10. 3969 / j. issn. 1673-629X. 2022. 04. 001]
[3]乔 通,周 洲,程 鑫,等.基于 Q-学习的底盘测功机自适应 PID 控制模型[J].计算机技术与发展,2022,32(05):117.[doi:10. 3969 / j. issn. 1673-629X. 2022. 05. 020]
QIAO Tong,ZHOU Zhou,CHENG Xin,et al.Adaptive PID Control Model of Chassis Dynamometer Based on Q-Learning[J].,2022,32(11):117.[doi:10. 3969 / j. issn. 1673-629X. 2022. 05. 020]
[4]刘晓峰 *,刘智斌,董兆安.基于记忆启发的强化学习方法研究[J].计算机技术与发展,2023,33(06):168.[doi:10. 3969 / j. issn. 1673-629X. 2023. 06. 025]
LIU Xiao-feng *,LIU Zhi-bin,DONG Zhao-an.Research on Memory Heuristic Reinforcement Learning[J].,2023,33(11):168.[doi:10. 3969 / j. issn. 1673-629X. 2023. 06. 025]