<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005">
<channel xmlns:cfi="http://www.microsoft.com/schemas/rss/core/2005/internal" cfi:lastdownloaderror="None">
<title cf:type="text"><![CDATA[国防科技大学学报编辑部 -->专栏：高性能计算]]></title>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[高性能互连网络中端口阻塞故障预测方法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205001]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[随着系统规模、芯片功耗和链路速率的提升,高性能互连网络的整体故障率也不断上升,传统运维方式将难以为继,给高性能计算系统整体可靠性和可用性带来了巨大挑战。针对网络端口阻塞这类严重网络故障,提出无监督算法的预测模型。该模型从历史信息中挖掘征兆性规律并形成新的特征向量,应用K-means聚类算法对特征向量进行学习归类。在预测时,结合端口当前状态,利用二次指数平滑算法对未来状态进行预测,将得到的新特征向量使用K-means算法预判是否会发生阻塞故障。利用拓扑结构信息,分别对叶交换机和根交换机构建预测子模型,进而提升预测的精确率。结果表明,该预测模型能保持在召回率为88.2%的前提下,达到65.2%的准确率,可为运维人员提供有效的辅助。]]></description>
<pubDate>2022/9/28 0:00:00</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[徐佳庆，胡小弢，杨汉芝，王强，张磊，唐付桥]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205001]]></guid><cfi:id>13</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[作业名层次化聚类算法预测作业运行时间]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205002]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[预测作业的运行时间有益于提升系统的调度性能,而聚类有助于训练出更好的预测模型。传统的聚类算法很难将相似的作业名聚类,为了将相似的作业更好地聚类,通过分析其组成成分的语义重要性,构建字母-结构-数字的作业名层次化聚类算法。以两台超级计算机的真实数据为例,实验结果发现,应用此算法聚类后的数据训练模型的预测精度相较传统方法有一定的提升,整体预测精度为70%～80%。]]></description>
<pubDate>2022/9/28 9:42:10</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[周隆放，杨文祥，韩永国，张晓蓉，喻杰，冯景华，张健，李宇奇，鲜港，吴亚东，王桂娟]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205002]]></guid><cfi:id>12</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向GPU的非结构网格有限体积计算流体力学的图染色方法优化]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205003]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[采用图染色方法解决通量累加和局部最大压力计算引起的两种典型资源竞争问题,并通过共享内存的使用、体编号和面编号的重排、面数据的重排三种策略优化图染色方法。针对应用在空气动力学多种规模的三维网格,分别采用双精度和单精度操作数,在Nvidia Tesla V100和K80 GPU上,展开性能测试。结果表明:共享内存的优化效果不明显；体编号和面编号重排降低了图染色方法的计算性能；面数据重排可以有效地优化图染色方法；计算性能在V100上提高20%左右,在K80上提高15%左右。]]></description>
<pubDate>2022/9/28 9:42:10</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[张曦，孙旭，郭晓虎，杜云飞，卢宇彤，刘杨]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205003]]></guid><cfi:id>11</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向计算流体力学的图形处理器资源管理]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205004]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[针对求解计算流体力学过程中图形处理器资源利用率低的问题,提出面向计算流体力学的图形处理器资源优化管理方案。基于计算流体力学的算法特性和同时运行任务的执行特点,设计合理的调度方案。通过动态改变不同任务的启动规模和启动时间,在减少资源竞争的同时提高图形处理器资源的有效使用。实验结果表明:本文提出的资源管理方案相比基线方法在不同任务规模下的平均加速比达到 1.64,对图形处理器的硬件资源使用也有了显著的提升。]]></description>
<pubDate>2022/9/28 9:42:11</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[翁跃，张献伟，张曦，卢宇彤]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205004]]></guid><cfi:id>10</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[并行程序运行故障原因识别]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205005]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[高性能计算系统的复杂性和规模的不断增长使得系统的平均无故障时间越来越短,因此系统的硬软件故障导致并行程序运行出错的概率随之增加。此外,并行程序本身可能存在的编程错误也会导致运行出错。由于处理上述两类故障原因的措施迥异,所以在程序运行出现故障时,用户需要关注故障原因的类别。针对这一问题,设计和实现了一种基于作业管理系统Slurm的并行程序运行故障原因识别系统。通过对Slurm进行扩展,监控作业状态,重提交和重运行作业。根据作业运行结果,区分故障原因类别。故障注入方式进行的实验表明,该系统具有较高的识别准确率。]]></description>
<pubDate>2022/9/28 9:42:11</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[刘轶，高玉林，张国振]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205005]]></guid><cfi:id>9</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于差分和神经网络的同步辐射光源图像压缩方法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205006]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[针对常见的图像无损压缩方法效果不佳问题,提出了一种基于图像差分和神经网络的同步辐射光源图像无损压缩方法。通过图像差分以减少图像序列内部的线性相关性,训练神经网络模型以学习图像序列内部的非线性相关性,得到预测概率分布,结合算术编码压缩。为加速预测和编码过程,将像素值按位分裂为两部分进行并行处理。基于上海同步辐射光源图像的测试表明,相较于便携式网络图形、JPEG2000和自由无损图像格式等,该方法可将压缩率提升20%以上,像素位分裂可以缩短30%的模型预测和编码时间。]]></description>
<pubDate>2022/9/28 9:42:11</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[符世园，汪璐，程耀东，陈刚]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205006]]></guid><cfi:id>8</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[基于作业记账日志的并行作业特征分析工具 JobCAT]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205007]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[并行作业特征分析是负载分析的重要基础。作业记账日志是开展作业特征分析的重要数据源。由于作业记账日志中没有记录应用名称,现有工具无法按应用名称开展作业特征分析。提出基于关键字模糊匹配的作业记账日志标记方法,设计通用的作业数据模型和柔性可扩展软件架构,集成实现并行作业特征分析工具JobCAT。通过某超级计算机系统百万量级作业记账日志数据测试验证,JobCAT的作业记账日志标记率大于95%。JobCAT支持7个插件、29项统计报表,可一键生成应用的作业特征分析报告,对负载分析研究具有实用价值。]]></description>
<pubDate>2022/9/28 9:42:11</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[田鸿运，刘旭，武林平，罗红兵，莫则尧]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205007]]></guid><cfi:id>7</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向混部云失败批处理作业的预测算法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205008]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[为了降低混部云失败批处理作业的风险,使用K-means聚类算法将批处理作业分为四类,在分类的基础上提出了二层嵌套分类模型(two-layer nested classification model, TLNM),实现了基于TLNM的预测算法。基于Ali Trace 2018数据集上的实验结果表明,该算法的接受者操作特性(receiver operating characteristic, ROC)曲线明显优于其他常用分类器,ROC曲线下面积(即AUC)可以达到0.978,表明该算法具有良好的分类性能。同时召回率可以达到0.951,通过混淆矩阵可以看出TLNM算法能够准确预测出执行失败的批处理作业。]]></description>
<pubDate>2022/9/28 9:42:11</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[林伟伟，石方，李毓睿，刘发贵，刘捷，彭绍亮，王子骏]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205008]]></guid><cfi:id>6</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[并行规约与扫描原语在ReRAM架构上的性能优化]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205009]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[规约与扫描是并行计算中的核心原语,其并行加速至关重要。然而,冯·诺依曼体系结构下无法避免的数据移动使其面临“存储墙”等性能与功耗瓶颈。近来,基于ReRAM等非易失存储器的存算一体架构支持的原位计算可一步实现矩阵-向量乘,已在机器学习与图计算等应用中展现了巨大的潜力。提出面向忆阻器存算一体架构的规约与扫描的并行加速方法,重点阐述基于矩阵-向量乘运算的计算流程和在忆阻器架构上的映射方法,实现软硬件协同设计,降低功耗并提高性能。相比于GPU,所提规约与扫描原语可实现高达两个数量级的加速,平均加速比也可达到两个数量级。分段规约与扫描最大可达到五个(平均四个)数量级的加速,并将功耗降低79%。]]></description>
<pubDate>2022/9/28 9:42:11</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[金洲，段懿洳，伊恩鑫，戢昊男，刘伟峰]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205009]]></guid><cfi:id>5</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[并行程序中同步瓶颈的检测和优化方法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205010]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[针对并发程序中锁的不当使用可能导致性能瓶颈的问题,提出检测和优化并发程序中同步瓶颈的方法IdeSync。IdeSync使用静态分析方法获取同步方法和同步块,构建静态同步依赖图,采用基于执行路径的动态分析技术进行同步依赖关系分析,构建同步依赖图。为了暴露性能瓶颈,在同步依赖图上通过增加程序工作负载的方式,监测临界区的性能变化,并针对检测到的同步瓶颈给出优化建议。在实验中通过HSQLDB、SPECjbb2005和RxJava等12个大型实际应用程序对IdeSync的有效性进行验证,共检测到72个同步瓶颈,根据优化建议进行优化后程序性能均有所提升。实验表明,IdeSync能够有效地检测和优化同步瓶颈。]]></description>
<pubDate>2022/9/28 0:00:00</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[张杨，李柳旭]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205010]]></guid><cfi:id>4</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[分布式异构集群中节点优先级调优算法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205011]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[节点优先级常用于评价异构集群中节点的性能,因此节点优先级评价指标权重的选择非常重要。采用层次分析法(analytic hierarchy process, AHP)建立了节点优先级评价指标体系,计算得到各指标的初始权重,并使用BP神经网络对初始权重进行优化。训练时,BP网络输入为集群运行中采集的节点实时资源数据,输出为节点的优先级。分析网络训练完成后得到的权重矩阵可以获得各优先级评价指标的优化权重。实验表明,基于AHP和BP的节点优先级评价模型可以更加准确地分析节点性能。相比于Spark默认算法和权重未优化的对照算法,使用调优后的节点优先级可以有效提高集群性能。运行不同工作量的相同负载时,集群平均性能分别提高了16.64%和9.76%；处理相同工作量的不同负载时,集群的平均性能分别提高了12.49%和6.54%。]]></description>
<pubDate>2022/9/28 9:42:11</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[胡亚红，邱圆圆，毛家发]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205011]]></guid><cfi:id>3</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[利用深度学习的硬件计数器复用估计算法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205012]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[利用深度学习方法,为硬件计数器复用(multiplexing,MPX)提供结果精度更高的估计模型。通过对MPX估计得到的结果与实际采集的真实数据进行相似性分析,证明相同程序多次运行之间得到的硬件计数值是线性相关的。采用神经网络多层感知器(multilayer perceptron,MLP)和双向门控神经网络(bidirectional gated recurrent unit, Bi-GRU)这2种深度学习模型,对MPX数据进行拟合。基于动态时间规整(dynamic time warping, DTW),提出一个全新的评估MPX数据精度的指标DTW-cost。实验结果表明,同时收集15个硬件事件数据时,MLP方法拟合得到的13个高性能计算应用平均准确率比现有使用最广的固定插值法高出10.53%,最多可提升19.8%；而在MLP表现较差的事件上,Bi-GRU方法得到的平均准确率提升了28.8%。]]></description>
<pubDate>2022/9/28 9:42:11</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[王一超，王鎏振，林新华]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205012]]></guid><cfi:id>2</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[支持工人能力模糊度量和角色协同的软件众包任务分配]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205013]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[现有众包任务分配研究缺乏考虑对工人能力不确定性的度量,也未从众包平台的角度实现任务和工人间多对多模式下的协同分配。由此,提出支持工人能力模糊度量和角色协同的软件众包任务分配方法。该方法结合工人的历史表现和任务的需求期望,以模糊区间数评估工人的多属性能力匹配度,使用模糊层次分析法计算工人的综合胜任能力。引入基于角色协同理论,将多对多型任务分配建模为涉及一组任务与相关工人的组合优化问题,综合考虑任务权重、工人数量、潜在冲突等约束,以提高任务分配的效率和成功率,并给出一种基于CPLEX的问题求解方法。仿真实验结果表明,在确保获得全局任务集最佳完成质量的前提下,该方法能高效准确实现多对多模式下的任务分配。]]></description>
<pubDate>2022/9/28 9:42:11</pubDate>
<category><![CDATA[专栏：高性能计算]]></category>
<author><![CDATA[马华，陈跃鹏，黄卓轩，唐文胜，娄小平]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202205013]]></guid><cfi:id>1</cfi:id><cfi:read>true</cfi:read></item>
</channel>
</rss>