期刊目录
2024年  第46卷  第5期 刊出日期 2024-10-28   目次   上一期   下一期
     
封面和目次
计算机科学与技术
  • 时间敏感网络延时组成的精确分析与测量方法
  • 付文文,全巍,姜旭艳,孙寅涵,孙志刚
  • 2024,46 (5):189-199[摘要](1072) [PDF  8335K](522)
    在依据时间敏感网络(time-sensitive networking, TSN)标准估算相邻节点之间的最大传输延迟Δt时,将不可避免地引入额外的无效等待时间,这种等待时间被称为“泡沫延时”。分析了泡沫延时对增加端到端延时和降低规划成功率的负面影响,并通过细粒度地分析Δt的延时组成,首次提出Δt的精确测量方法。基于精确的Δt,消除了TSN规划时产生的泡沫延时。基于两款定制的TSN交换设备搭建了真实的测试环境,测试结果显示,泡沫延时至少占端到端延时的26.4%,并且消除泡沫延时后规划成功率提升了8.9%~39.1%。
  • 网络切片可编程数据平面模型
  • 刘忠沛,吕高锋,王继昌,杨翔瑞
  • 2024,46 (5):200-208[摘要](980) [PDF  7769K](496)
    可重构匹配表(reconfigurable match table, RMT)是一种可编程的数据包处理流水线架构。为了实现可编程数据平面对更多不同网络协议的支持,在该架构的基础上扩展逆解析器,使用扩展后的逆解析器以及两个RMT流水线组成一个协议无关的网络切片可编程数据平面模型。由于RMT架构中采用精简指令集,扩展后的逆解析器采用复杂指令集,因此称扩展后的架构为混合指令RMT(hybrid-instruction RMT, HiRMT)。HiRMT能够支持基于IPv6转发平面的段路由、SID(segment ID)的多语义、微分段技术、多协议标签交换技术,以及虚拟扩展局域网技术。该架构具有广阔的应用场景。在Corundum原型平台上进行了逆解析器模块的性能测试,结果表明扩展后的逆解析器能够使用较少的资源在数据包大小达到512 B时以100 Gbit/s的吞吐量进行处理。
  • 面向大规模异构计算平台的MiniGo高效训练方法
  • 李荣春,贺周雨,乔鹏,姜晶菲,窦勇,李东升
  • 2024,46 (5):209-218[摘要](1008) [PDF  3543K](479)
    提出一种适用于大规模异构计算平台训练MiniGo智能体的高效多级并行训练方法,包括节点间任务级并行、中央处理器-数字信号处理器(central processing unit-digital signal processor, CPU-DSP)异构并行、DSP核内并行。实现了高效的输入/输出部署,消除网络通信瓶颈。提出了面向CPU-DSP共享内存结构的异构计算内存管理,减少异构设备间的数据搬运。实现了共享内存编程优化,并利用DSP实现密集卷积计算算子加速优化。结果表明,与16核CPU计算相比,单核DSP算子加速最大加速比达16.44;该方法实现计算节点规模从1 067扩展至4 139,得到达到给定终止条件所需时间从43.02 h降至16.05 h,可扩展效率为69.1%。评估表明,该方法能够实现MiniGo在大规模异构计算平台的高效并行训练。
  • 通过包络面重构的大规模粒子并行绘制算法
  • 王华维,艾志玮,曹轶
  • 2024,46 (5):219-227[摘要](926) [PDF  10117K](439)
    针对大规模粒子高表现可视化需求,提出基于包络面重构的大规模粒子并行绘制算法。该算法以连续曲面的形式表示,绘制大规模粒子的团簇表面及其物理量分布。对算法进行了分布式并行化,从而可以通过大规模并行来处理亿以上规模的粒子数据。在算法实现上,还解决了并行计算时的块间裂缝问题,并提出了快速查找邻域粒子的方法,同时,基于可见性对粒子数据进行剔除,提高了绘制效率。由此,可以通过带光照效果的光滑曲面来高表现展示大规模粒子数据中的团簇结构及其物理量分布。实验结果表明,该算法在512核上可在5 s内完成上亿粒子的绘制,并行效率可达60%。该算法已成功应用到大规模并行非平衡分子动力学模拟等实际模拟应用中。