快速检索         高级检索
2022年  第44卷  第5期      刊出日期 2022-10-28   目次   上一期   下一期  
     
封面和目次
专栏:高性能计算
  • 高性能互连网络中端口阻塞故障预测方法
  • 徐佳庆,胡小弢,杨汉芝,王强,张磊,唐付桥
  • 2022, 44 (5):1-12[摘要](23)  [PDF  12352KB](67)
    随着系统规模、芯片功耗和链路速率的提升,高性能互连网络的整体故障率也不断上升,传统运维方式将难以为继,给高性能计算系统整体可靠性和可用性带来了巨大挑战。针对网络端口阻塞这类严重网络故障,提出无监督算法的预测模型。该模型从历史信息中挖掘征兆性规律并形成新的特征向量,应用K-means聚类算法对特征向量进行学习归类。在预测时,结合端口当前状态,利用二次指数平滑算法对未来状态进行预测,将得到的新特征向量使用K-means算法预判是否会发生阻塞故障。利用拓扑结构信息,分别对叶交换机和根交换机构建预测子模型,进而提升预测的精确率。结果表明,该预测模型能保持在召回率为88.2%的前提下,达到65.2%的准确率,可为运维人员提供有效的辅助。
  • 作业名层次化聚类算法预测作业运行时间
  • 周隆放,杨文祥,韩永国,张晓蓉,喻杰,冯景华,张健,李宇奇,鲜港,吴亚东,王桂娟
  • 2022, 44 (5):13-23[摘要](14)  [PDF  9689KB](29)
    预测作业的运行时间有益于提升系统的调度性能,而聚类有助于训练出更好的预测模型。传统的聚类算法很难将相似的作业名聚类,为了将相似的作业更好地聚类,通过分析其组成成分的语义重要性,构建字母-结构-数字的作业名层次化聚类算法。以两台超级计算机的真实数据为例,实验结果发现,应用此算法聚类后的数据训练模型的预测精度相较传统方法有一定的提升,整体预测精度为70%~80%。
  • 面向GPU的非结构网格有限体积计算流体力学的图染色方法优化
  • 张曦,孙旭,郭晓虎,杜云飞,卢宇彤,刘杨
  • 2022, 44 (5):24-34[摘要](15)  [PDF  8233KB](24)
    采用图染色方法解决通量累加和局部最大压力计算引起的两种典型资源竞争问题,并通过共享内存的使用、体编号和面编号的重排、面数据的重排三种策略优化图染色方法。针对应用在空气动力学多种规模的三维网格,分别采用双精度和单精度操作数,在Nvidia Tesla V100和K80 GPU上,展开性能测试。结果表明:共享内存的优化效果不明显;体编号和面编号重排降低了图染色方法的计算性能;面数据重排可以有效地优化图染色方法;计算性能在V100上提高20%左右,在K80上提高15%左右。
  • 面向计算流体力学的图形处理器资源管理
  • 翁跃,张献伟,张曦,卢宇彤
  • 2022, 44 (5):35-44[摘要](18)  [PDF  8754KB](31)
    针对求解计算流体力学过程中图形处理器资源利用率低的问题,提出面向计算流体力学的图形处理器资源优化管理方案。基于计算流体力学的算法特性和同时运行任务的执行特点,设计合理的调度方案。通过动态改变不同任务的启动规模和启动时间,在减少资源竞争的同时提高图形处理器资源的有效使用。实验结果表明:本文提出的资源管理方案相比基线方法在不同任务规模下的平均加速比达到 1.64,对图形处理器的硬件资源使用也有了显著的提升。
  • 并行程序运行故障原因识别
  • 刘轶,高玉林,张国振
  • 2022, 44 (5):45-52[摘要](16)  [PDF  5385KB](28)
    高性能计算系统的复杂性和规模的不断增长使得系统的平均无故障时间越来越短,因此系统的硬软件故障导致并行程序运行出错的概率随之增加。此外,并行程序本身可能存在的编程错误也会导致运行出错。由于处理上述两类故障原因的措施迥异,所以在程序运行出现故障时,用户需要关注故障原因的类别。针对这一问题,设计和实现了一种基于作业管理系统Slurm的并行程序运行故障原因识别系统。通过对Slurm进行扩展,监控作业状态,重提交和重运行作业。根据作业运行结果,区分故障原因类别。故障注入方式进行的实验表明,该系统具有较高的识别准确率。
  • 基于差分和神经网络的同步辐射光源图像压缩方法
  • 符世园,汪璐,程耀东,陈刚
  • 2022, 44 (5):53-62[摘要](16)  [PDF  8629KB](19)
    针对常见的图像无损压缩方法效果不佳问题,提出了一种基于图像差分和神经网络的同步辐射光源图像无损压缩方法。通过图像差分以减少图像序列内部的线性相关性,训练神经网络模型以学习图像序列内部的非线性相关性,得到预测概率分布,结合算术编码压缩。为加速预测和编码过程,将像素值按位分裂为两部分进行并行处理。基于上海同步辐射光源图像的测试表明,相较于便携式网络图形、JPEG2000和自由无损图像格式等,该方法可将压缩率提升20%以上,像素位分裂可以缩短30%的模型预测和编码时间。
  • 基于作业记账日志的并行作业特征分析工具 JobCAT
  • 田鸿运,刘旭,武林平,罗红兵,莫则尧
  • 2022, 44 (5):63-70[摘要](16)  [PDF  7589KB](44)
    并行作业特征分析是负载分析的重要基础。作业记账日志是开展作业特征分析的重要数据源。由于作业记账日志中没有记录应用名称,现有工具无法按应用名称开展作业特征分析。提出基于关键字模糊匹配的作业记账日志标记方法,设计通用的作业数据模型和柔性可扩展软件架构,集成实现并行作业特征分析工具JobCAT。通过某超级计算机系统百万量级作业记账日志数据测试验证,JobCAT的作业记账日志标记率大于95%。JobCAT支持7个插件、29项统计报表,可一键生成应用的作业特征分析报告,对负载分析研究具有实用价值。
  • 面向混部云失败批处理作业的预测算法
  • 林伟伟,石方,李毓睿,刘发贵,刘捷,彭绍亮,王子骏
  • 2022, 44 (5):71-79[摘要](14)  [PDF  8780KB](24)
    为了降低混部云失败批处理作业的风险,使用K-means聚类算法将批处理作业分为四类,在分类的基础上提出了二层嵌套分类模型(two-layer nested classification model, TLNM),实现了基于TLNM的预测算法。基于Ali Trace 2018数据集上的实验结果表明,该算法的接受者操作特性(receiver operating characteristic, ROC)曲线明显优于其他常用分类器,ROC曲线下面积(即AUC)可以达到0.978,表明该算法具有良好的分类性能。同时召回率可以达到0.951,通过混淆矩阵可以看出TLNM算法能够准确预测出执行失败的批处理作业。
  • 并行规约与扫描原语在ReRAM架构上的性能优化
  • 金洲,段懿洳,伊恩鑫,戢昊男,刘伟峰
  • 2022, 44 (5):80-91[摘要](16)  [PDF  20226KB](20)
    规约与扫描是并行计算中的核心原语,其并行加速至关重要。然而,冯·诺依曼体系结构下无法避免的数据移动使其面临“存储墙”等性能与功耗瓶颈。近来,基于ReRAM等非易失存储器的存算一体架构支持的原位计算可一步实现矩阵-向量乘,已在机器学习与图计算等应用中展现了巨大的潜力。提出面向忆阻器存算一体架构的规约与扫描的并行加速方法,重点阐述基于矩阵-向量乘运算的计算流程和在忆阻器架构上的映射方法,实现软硬件协同设计,降低功耗并提高性能。相比于GPU,所提规约与扫描原语可实现高达两个数量级的加速,平均加速比也可达到两个数量级。分段规约与扫描最大可达到五个(平均四个)数量级的加速,并将功耗降低79%。
  • 并行程序中同步瓶颈的检测和优化方法
  • 张杨,李柳旭
  • 2022, 44 (5):92-101[摘要](20)  [PDF  7117KB](25)
    针对并发程序中锁的不当使用可能导致性能瓶颈的问题,提出检测和优化并发程序中同步瓶颈的方法IdeSync。IdeSync使用静态分析方法获取同步方法和同步块,构建静态同步依赖图,采用基于执行路径的动态分析技术进行同步依赖关系分析,构建同步依赖图。为了暴露性能瓶颈,在同步依赖图上通过增加程序工作负载的方式,监测临界区的性能变化,并针对检测到的同步瓶颈给出优化建议。在实验中通过HSQLDB、SPECjbb2005和RxJava等12个大型实际应用程序对IdeSync的有效性进行验证,共检测到72个同步瓶颈,根据优化建议进行优化后程序性能均有所提升。实验表明,IdeSync能够有效地检测和优化同步瓶颈。
  • 分布式异构集群中节点优先级调优算法
  • 胡亚红,邱圆圆,毛家发
  • 2022, 44 (5):102-113[摘要](12)  [PDF  9405KB](26)
    节点优先级常用于评价异构集群中节点的性能,因此节点优先级评价指标权重的选择非常重要。采用层次分析法(analytic hierarchy process, AHP)建立了节点优先级评价指标体系,计算得到各指标的初始权重,并使用BP神经网络对初始权重进行优化。训练时,BP网络输入为集群运行中采集的节点实时资源数据,输出为节点的优先级。分析网络训练完成后得到的权重矩阵可以获得各优先级评价指标的优化权重。实验表明,基于AHP和BP的节点优先级评价模型可以更加准确地分析节点性能。相比于Spark默认算法和权重未优化的对照算法,使用调优后的节点优先级可以有效提高集群性能。运行不同工作量的相同负载时,集群平均性能分别提高了16.64%和9.76%;处理相同工作量的不同负载时,集群的平均性能分别提高了12.49%和6.54%。
  • 利用深度学习的硬件计数器复用估计算法
  • 王一超,王鎏振,林新华
  • 2022, 44 (5):114-123[摘要](14)  [PDF  8427KB](23)
    利用深度学习方法,为硬件计数器复用(multiplexing,MPX)提供结果精度更高的估计模型。通过对MPX估计得到的结果与实际采集的真实数据进行相似性分析,证明相同程序多次运行之间得到的硬件计数值是线性相关的。采用神经网络多层感知器(multilayer perceptron,MLP)和双向门控神经网络(bidirectional gated recurrent unit, Bi-GRU)这2种深度学习模型,对MPX数据进行拟合。基于动态时间规整(dynamic time warping, DTW),提出一个全新的评估MPX数据精度的指标DTW-cost。实验结果表明,同时收集15个硬件事件数据时,MLP方法拟合得到的13个高性能计算应用平均准确率比现有使用最广的固定插值法高出10.53%,最多可提升19.8%;而在MLP表现较差的事件上,Bi-GRU方法得到的平均准确率提升了28.8%。
  • 支持工人能力模糊度量和角色协同的软件众包任务分配
  • 马华,陈跃鹏,黄卓轩,唐文胜,娄小平
  • 2022, 44 (5):124-133[摘要](22)  [PDF  7008KB](25)
    现有众包任务分配研究缺乏考虑对工人能力不确定性的度量,也未从众包平台的角度实现任务和工人间多对多模式下的协同分配。由此,提出支持工人能力模糊度量和角色协同的软件众包任务分配方法。该方法结合工人的历史表现和任务的需求期望,以模糊区间数评估工人的多属性能力匹配度,使用模糊层次分析法计算工人的综合胜任能力。引入基于角色协同理论,将多对多型任务分配建模为涉及一组任务与相关工人的组合优化问题,综合考虑任务权重、工人数量、潜在冲突等约束,以提高任务分配的效率和成功率,并给出一种基于CPLEX的问题求解方法。仿真实验结果表明,在确保获得全局任务集最佳完成质量的前提下,该方法能高效准确实现多对多模式下的任务分配。
航天工程·光学工程·信息与通信工程
  • 波浪作用下水下航行体出水成功概率预报
  • 孙龙泉,任泽宇,李志鹏,马贵辉,赵建洲
  • 2022, 44 (5):134-141[摘要](18)  [PDF  6922KB](24)
    为了实现实测波浪作用下水下航行体出水成功概率预报,为潜艇作战提供一种水下发射的快速预报方法,基于边界元方法建立了水下航行体出水姿态计算模型,对不同波浪条件下水下航行体出水姿态参数进行了计算。同时,将不同波浪条件下的出水姿态参数进行集成,形成了规则波浪数据库。以渤海湾某时间段的实测海况作为发射环境,建立符合瑞利分布的波高概率分布模型,将尾部触水俯仰角作为判定条件,对实测波浪下水下航行体出水成功概率进行预报。计算结果表明,在考虑最恶劣工况下,相对于静水条件下的出水俯仰角偏差随着波高的增加而减小;相同波高下,受到出水相位的影响,出水俯仰角偏差呈余弦变化规律。该预报方法对于潜艇作战判定发射时机具有一定参考价值,为水下发射的成功概率预报提供参考。
  • 零彗差自由点条件下的失调光学系统波像差特性分析
  • 吴伟,于乃辉,罗自荣,白向娟,尚建忠
  • 2022, 44 (5):142-149[摘要](19)  [PDF  6460KB](31)
    基于矢量像差理论,对反射式光学系统的一类特殊失调状态——满足零彗差自由点条件展开研究,分析了该特殊失调下三阶彗差和三阶像散的全视场波像差特性,建立了三阶像散双节点位置的解析计算公式,研究发现该类失调不会引入三阶彗差,并且会导致三阶像散的一个节点位于中心视场附近,揭示了当前传统装调方法中仅采用轴上彗差为零作为系统完善装调的弊端,并基于像差特性分析提出了一种仅根据轴上视场引入定量失调误差前后的像差变化来评估系统完善装调的方法。利用CODE V(Version 10.2)对两反式光学系统进行了仿真分析,结果表明文中建立的模型和方法可定量分析三阶像散双节点的位置及该类失调对系统波像差的影响规律,并验证了所提出系统完善装调方法的有效性。
  • BaGa4Se7与KTiOAsO4光参量振荡输出3.5 μm激光性能对比
  • 孔辉,卞进田,叶庆,徐海萍,孙晓泉
  • 2022, 44 (5):150-157[摘要](13)  [PDF  6017KB](21)
    为对比新型非线性晶体BaGa4Se7(简称 BGSe)和成熟商用非线性晶体KTiOAsO4(简称 KTA) 所输出的中红外激光性能,使用1.06 μm激光泵浦BGSe(56.3°,0°,type-Ⅰ)和KTA(90°, 0°,type-Ⅱ-A)输出3.5 μm激光。在泵浦光波长为1 064 nm、脉宽为13 ns、光斑直径为4 mm、光参量振荡腔长为90 mm的条件下,实验测得KTA(L=20 mm)和BGSe(L=15 mm)的泵浦振荡阈值分别为52.6 mJ(理论值为46.11 mJ)和20.6 mJ(理论值为18.32 mJ);BGSe输出波长与温度的变化率Δλ2/ΔT为3.20 nm/℃(理论值为2.49 nm/℃),KTA的Δλ2/ΔT为0.073 nm/℃(理论值为0.077 nm/℃);实验测得BGSe的输出线宽为4.71 nm,KTA为2.45 nm。BGSe和KTA的泵浦阈值和温度调谐在理论和实验上吻合得较好,且结果表明:BGSe在这两个方面优于KTA;但KTA在输出窄线宽方面优于BGSe晶体。实验结果表明,BGSe是一种具有广泛应用前景的中远红外非线性晶体。
  • 非椭圆扩展目标联合跟踪与分类算法
  • 占荣辉,王丽萍
  • 2022, 44 (5):158-170[摘要](16)  [PDF  13554KB](51)
    充分利用目标尺寸和形状信息,提出了一种基于星凸随机超曲面模型(random hypersurface model, RHM)的非椭圆扩展目标联合跟踪与分类(joint tracking and classification, JTC)算法。将目标空间扩展状态建模为星凸形状,通过目标类别相关先验信息的矢量化建模,建立起其与目标瞬时扩展状态的关系,并在统一的贝叶斯滤波框架下,实现跟踪与分类的一体化处理;进一步对目标运动学状态和扩展状态单独进行建模,并通过构建扩展状态的似然函数,利用粒子滤波实现目标类别概率算式的递推处理。仿真结果表明:与基于椭圆形状的扩展目标JTC算法相比,所提算法能对尺寸相近、形状不同的目标进行准确分类,同时可改善目标状态的估计效果;与基于星凸RHM的扩展目标跟踪算法相比,所提算法能大幅提高目标状态的估计性能。
  • 高速互连网络中基于网卡的归约计算硬件卸载机制
  • 常俊胜,熊泽宇,徐金波
  • 2022, 44 (5):171-179[摘要](17)  [PDF  6477KB](29)
    聚合通信广泛应用于高性能计算的研究和工程领域。在大规模的科学和工程计算中,聚合通信开销占据很大比例,有时甚至可达到全部消息传递开销的80%,是高性能计算系统的性能瓶颈。因此提出了一种基于网卡的归约计算硬件卸载机制,通过在网卡上嵌入归约操作逻辑部件,实现了数据在传输过程中的计算,减轻了CPU的负担,降低了通信延迟。通过FPGA平台实现了16节点的归约操作实验,并基于xNetSimPlus模拟器模拟了不同节点规模的归约操作。实验证明,卸载机制能有效减少聚合通信中归约操作的时间,所提支持归约计算的网卡卸载机制最高可以加速归约操作2.71倍。
  • 高超声速圆柱绕流中驻点热流的稀薄效应
  • 李宪开,张志雨,何淼生,朱斌镔,柳军
  • 2022, 44 (5):180-186[摘要](16)  [PDF  4979KB](31)
    采用Fay-Riddell关系式、直接模拟Monte Carlo方法和基于直接模拟Monte Carlo流场温度的Fourier传热三种热流表达方式,分别对比研究了不同来流克努森数(Kn)和不同来流马赫数(Ma)的结果,以期从微观视角给出经典连续方法在稀薄流区高估驻点热流的新理解。结果表明,驻点热流的稀薄效应体现在三个方面:一是温度跳跃,削弱温度梯度导致驻点热流降低;二是壁面附近平动非平衡,导致Fourier热传导定律失效且高估热流;三是壁面约束,致使Fourier热传导定律在距壁面3倍分子平均自由程内高估热流。
机械工程·控制科学与工程·管理科学与工程
  • 基于超分辨率超声图像的缺陷量化方法
  • 樊程广,余孙全,高斌,杨磊
  • 2022, 44 (5):187-192[摘要](17)  [PDF  5785KB](28)
    以相位相干多信号分类(phase-coherent multiple signal classification, PC-MUSIC)方法为例,研究基于超分辨率超声图像的缺陷量化方法。利用全矩阵采集方法从被测对象获取超声阵列数据,对数据进行时域预处理,提取缺陷散射信号;利用PC-MUSIC方法处理缺陷散射信号,获取超分辨率超声图像;分析超声图像特征,提取横向强度曲线,定义-6 dB主瓣宽度作为缺陷的评估长度。搭建实验系统,选择铝试块作为被测对象,在其内部加工1个长度为10 mm的刻槽作为缺陷。实验结果表明,在信号子空间维度选择合适的情况下,PC-MUSIC方法能够准确评估缺陷长度,误差在10%以内。
  • 陶瓷/薄钢板复合结构靶板抗高速侵彻性能研究
  • 陈长海,万昌召,张瑞刚,程远胜
  • 2022, 44 (5):193-200[摘要](21)  [PDF  7389KB](26)
    为探讨陶瓷/薄钢板复合结构靶板(ceramic/thin steel targets,CS靶板)的抗高速侵彻机理,通过弹道试验,分析了3 mm厚SiC陶瓷层和0.6 mm厚钢板层的CS靶板的破坏模式和抗侵彻性能,并与面密度基本相同的纯钢板进行了比较。在此基础上,基于能量守恒原理,建立了CS靶板抗高速侵彻的理论预测模型,并与试验结果进行了对比。结果表明,CS靶板中前陶瓷层的存在,使得后钢板层的破坏模式由剪切冲塞转变为花瓣开裂,大大提升了后钢板层的抗侵彻吸能效率,从而使得CS靶板的整体抗侵彻性能高于等面密度的纯钢板,CS靶板的整体抗侵彻效率较等面密度纯钢板提升15%以上;弹体穿透CS靶板后的剩余速度理论预测值与试验结果吻合较好,相对误差均在5%以内,验证了理论模型的合理性和有效性。
  • 分段履带式水陆两栖车减阻增速试验及数值仿真
  • 孙承亮,徐小军,唐源江,郝军
  • 2022, 44 (5):201-208[摘要](19)  [PDF  11236KB](35)
    为了研究分段履带式水陆两栖车的水动力性能,实现减阻增速,将尾翼板安装到水陆两栖车的方艉部,并开展了水池试验和仿真研究,两者的研究结果具有较好的一致性。通过仿真研究了车体的纵向重心位置、尾翼板的长度和角度对水陆两栖车阻力性能的影响,并分析了阻力成分的变化趋势。研究结果表明:车体纵向重心位置在540~560 mm 时,车体所受水阻力最小;在速度为3~5 m/s时,长度为156 mm,与水平面夹角为10°的尾翼板减阻效果最明显,相比于原裸车体的阻力,减阻率达到34.3%;加装尾翼板可以增加车体的尾部中空区长度,相当于增加了水线长,增大了长宽比。该研究表明:适当调节重心位置和优化尾翼板参数,可以有效实现水陆两栖车的减阻增速。
  • 面向无人环境的机器人生态圈自主任务决策方法
  • 刘红卫,徐磊,李泰博,陈小前,张育林
  • 2022, 44 (5):209-219[摘要](19)  [PDF  11516KB](59)
    借鉴自然界生态系统的典型特征,提出机器人生态圈概念。通过使集群机器人进行智能协同与复杂演化,涌现自我维持、自我复制与自我进化等生命特征,实现无人条件下的长期生存、繁衍与进化,并执行特定的任务。针对机器人生态圈典型任务场景的自主任务决策需求,分析不同机器学习任务决策方法的特点,建立机器人生态圈自主任务决策的决策树模型和神经网络模型。分析表明,两种模型的正确率均在80%~90%,且均具有良好的稳定性。这说明,机器人生态圈自主任务决策问题可以通过决策树、神经网络等机器学习方法来很好地加以解决,从而为面向无人化场景的任务应用提供技术支持。
  • 装备预研管理数字化转型研究——数字孪生装备预研
  • 马亮,陈立栋,刘思恺,赵岩,王原,徐小平
  • 2022, 44 (5):220-230[摘要](27)  [PDF  10058KB](46)
    数字经济时代,装备预研管理应积极面对数字化转型趋势,构建与数字经济发展相适应的管理体系。结合数字经济的变革属性,借鉴民口科技计划管理数字化实践经验做法,总结和分析当前装备预研管理数字化面临的主要问题及紧迫需求,提出未来装备预研管理发展的一种新范式——数字孪生装备预研,即利用数字孪生助力装备预研管理的数字化转型,并从组成、理想特征和能力、关键技术以及发展路径四个方面对数字孪生装备预研的概念内涵进行了深化阐述,以期对当前装备预研管理的创新起到参考和促进作用。
扫一扫关注公众号
国际标准连续出版物号
ISSN 1001-2486
国内统一连续出版物号
CN 43-1067/T
主管单位
国防科技大学
主办单位
国防科技大学教研保障中心
论文下载排行更多>>
论文点击排行更多>>
友情链接