<![CDATA[国防科技大学学报编辑部 -->高性能计算与人工智能]]>

<![CDATA[国防科技大学学报编辑部 -->高性能计算与人工智能]]> <![CDATA[面向众核处理器的阴阳<i>K</i>-means算法优化]]> K-means算法处理大规模聚类问题时计算开销十分昂贵。针对典型众核处理器的体系结构特征,提出了一种阴阳K-means算法高效并行加速实现。该实现基于一种新内存数据布局,采用众核处理器中的向量单元来加速阴阳K-means中的距离计算,并面向非一致内存访问(non-unified memory access, NUMA)特性进行了针对性的访存优化。与阴阳K-means算法的开源多线程实现相比,该实现在ARMv8和x86众核平台上分别获得了最高约5.6与8.7的加速比。因此上述优化方法在众核处理器上成功实现了对阴阳K-means算法的加速。]]> 2024/1/28 0:00:00 6true <![CDATA[多核数字信号处理卷积算法并行优化]]> 2024/1/28 0:00:00 5true <![CDATA[注意力机制量化剪枝优化方法]]> 2024/1/28 0:00:00 4true <![CDATA[长向量处理器高效RNN推理方法]]> 2024/1/28 0:00:00 3true <![CDATA[高性能异构加速器MiniGo算子优化方法]]> 2024/1/28 0:00:00 2true <![CDATA[面向GPU的5G新型无线电的高吞吐率LDPC译码器]]> 2024/1/28 0:00:00 1true