(1. 国防科技大学 计算机学院, 湖南 长沙 410073;2. 国防科技大学 并行与分布计算全国重点实验室, 湖南 长沙 410073)
何源宏(1998—),男,湖南宁乡人,硕士研究生,E-mail:heyuanhongcs@nudt.edu.cn
TP18
重点实验室稳定支持重点资助项目(WDZC20215250103)
(1. College of Computer Science and Technology, National University of Defense Technology, Changsha 410073, China;2. National Key Laboratory of Paralle and Distributed Computing, National University of Defense Technology, Changsha 410073, China)
何源宏,姜晶菲,许金伟.注意力机制量化剪枝优化方法[J].国防科技大学学报,2024,46(1):113-120.
HE Yuanhong, JIANG Jingfei, XU Jinwei. Quantization and pruning optimization method for attention mechanism[J]. Journal of National University of Defense Technology,2024,46(1):113-120.