1.国防科技大学 智能科学学院, 湖南 长沙 410073 ; 2.装备状态感知与敏捷保障全国重点实验室, 湖南 长沙 410073 ;3.国防科技大学 空天科学学院, 湖南 长沙 410073
任君凯(1991—),男,河北石家庄人,副教授,博士,硕士生导师,E-mail:jk.ren@nudt.edu.cn
TP249
国家自然科学基金资助项目(62373201);国防科技大学自主创新科学基金资助项目(ZK2023-30,24-ZZCX-GZZ-11)
1.College of Intelligence Science and Technology, National University of Defense Technology, Changsha 410073 , China ;2.National Key Laboratory of Equipment State Sensing and Smart Support, Changsha 410073 , China ; 3.College of Aerospace Science and Engineering, National University of Defense Technology, Changsha 410073 , China
任君凯, 瞿宇珂, 罗嘉威, 等. 面向长序列自主作业的非对称Actor-Critic强化学习方法[J]. 国防科技大学学报, 2025, 47(4): 111-122.
复制