(1. 国防科技大学 第六十三研究所, 江苏 南京 210007;2. 浙江财经大学 经济学院, 浙江 杭州 310018;3. 国防科技大学 系统工程学院, 湖南 长沙 410073;4. 西南电子电信技术研究所, 四川 成都 610041)
张骁雄(1990—),男,江苏淮安人,高级工程师,博士,硕士生导师,E-mail:zxxandxx@163.com
O22; N94
国家自然科学基金资助项目(71901215,71901191);国防科技大学校科研计划资助项目(ZK20-46)
(1. The Sixty-third Research Institute, National University of Defense Technology, Nanjing 210007, China;2. School of Economics, Zhejiang University of Finance & Economics, Hangzhou 310018, China;3. College of Systems Engineering, National University of Defense Technology, Changsha 410073, China;4. Southwest Electronics and Telecommunication Technology Research Institute, Chengdu 610041, China)
张骁雄,丁松,李明浩,等.强化学习在多阶段装备组合规划问题中的应用[J].国防科技大学学报,2021,43(5):127-136.
ZHANG Xiaoxiong, DING Song, LI Minghao, et al. Application of reinforcement learning in multi-period weapon portfolio planning problems[J]. Journal of National University of Defense Technology,2021,43(5):127-136.