<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005">
<channel xmlns:cfi="http://www.microsoft.com/schemas/rss/core/2005/internal" cfi:lastdownloaderror="None">
<title cf:type="text"><![CDATA[国防科技大学学报编辑部 -->专题：高性能计算]]></title>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[大规模科学数据体绘制技术综述]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002001]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[体绘制是刻画大规模科学数据中复杂物理特征的有效途径,然而,数据量极大、特征难以捕捉等问题依然是目前体绘制研究的主要挑战。为此,研究者们从三个方面对体绘制算法进行了深入研究,以提高大规模数据体绘制的效率和效果。一方面,依托硬件通过多处理器核来分担计算,降低单处理器核所要完成的计算量,是提高体绘制效率的一个有效途径。另一方面,充分发掘数据场内在特性对三维数据场进行约简,大幅减少绘制处理数据量从而降低算法开销,也是提高体绘制效率的一个有效途径。同时,在体绘制算法中融入特征分析和特征增强方法,让复杂物理特征从数据场中突显出来,以实现对科学数据的高质量绘制。本文对国内外体绘制技术相关研究进展进行了调研、综述,并分析了不同的研究方法,最后展望了未来体绘制技术研究的可能发展方向,包括应用驱动的特征体绘制、基于特征的约简体绘制、适应硬件的体绘制多级加速以及原位智能化体绘制等。]]></description>
<pubDate>2020/4/29 0:00:00</pubDate>
<category><![CDATA[专题：高性能计算]]></category>
<author><![CDATA[王华维，何柳，曹轶，肖丽]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002001]]></guid><cfi:id>8</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向图计算应用的处理器访存通路优化设计与实现]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002002]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[针对图计算应用的访存特点,提出并实现一种支持高并发、乱序和异步访存的高并发访存模块(High Concurrency and high Performance Fetcher, HCPF)。通过软-硬件协同的设计方法,HCPF可同时处理192条共8种类型的内存访问请求,且访存粒度可由用户定义,满足图计算应用对海量低延迟细粒度数据访问的需求。同时,HCPF扩展了基于内存语义的跨计算节点定制互连技术,支持远程内存的细粒度直接访问,为后续实现分布式图计算框架提供技术基础。结合上述两个核心研究内容,基于流水线RISC-V处理器核,设计并实现了可支持HCPF的RISC-V片上系统(System-on-Chip,SoC)架构,搭建基于FPGA的原型验证平台,并使用自研测试程序对HCPF进行初步性能评测。实验结果表明,HCPF相比原有访存通路,最高可将基于数组和随机地址的两种随机内存访问性能分别提升至3.5倍和2.7倍。远程内存直接访问4 Byte数据的延时仅为1.63 μs。]]></description>
<pubDate>2020/4/29 0:00:00</pubDate>
<category><![CDATA[专题：高性能计算]]></category>
<author><![CDATA[张旭，常轶松，张科，陈明宇]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002002]]></guid><cfi:id>7</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向大规模集群的并行I/O用户层配置优化策略]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002003]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[影响应用I/O性能的关键因素主要有三个层次:包括应用的I/O接口实现、体系结构和文件系统组件的性能以及应用的I/O参数配置。从应用I/O配置优化的视角,分析了大规模集群并行I/O的配置调优空间,在此基础上,给出了一套大规模集群并行I/O性能特征测试分析方法。基于该方法,在某国产超级计算集群上开展了一系列I/O测试分析来刻画系统的I/O性能特征,进而指导并行应用程序的I/O配置优化。基于优化后的配置参数,在两类典型的并行I/O场景中,针对某类生产应用程序,8192进程下的重启动数据写操作时间下降了15%,4096核的程序作业加载时间从10 min缩短到了5 s。]]></description>
<pubDate>2020/4/29 0:00:00</pubDate>
<category><![CDATA[专题：高性能计算]]></category>
<author><![CDATA[田鸿运，武林平，董勇，景翠萍，罗红兵，莫则尧]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002003]]></guid><cfi:id>6</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[高精度CFD程序的内外子区域划分异构并行算法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002004]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[对计算流体力学(Computational Fluid Dynamics, CFD)程序CNS提出一种Offload模式下对任务内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格-库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在“CPU(Intel Haswell Xeon E5-2670 12 cores ×2)＋加速器(Xeon Phi 7120A ×2)”的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升至5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速至1.27倍,使用双加速器加速至1.45倍。讨论和分析了性能瓶颈与存在的问题。]]></description>
<pubDate>2020/4/29 0:00:00</pubDate>
<category><![CDATA[专题：高性能计算]]></category>
<author><![CDATA[王巍，徐传福，车永刚]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002004]]></guid><cfi:id>5</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[流水的浮点倒数近似值运算部件的设计与实现]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002005]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[在部分低精度浮点运算应用中,需要流水的浮点倒数近似值运算。本文基于SRT-4算法设计并实现了一种流水的浮点倒数近似值运算部件。该部件采用6级流水线结构,运算结果精度至少为8位有效尾数。为了支持对非规格化浮点数的硬件处理,还设计并实现了改进版,有利于进一步提高浮点倒数近似值运算的性能。改进版采用8级流水线结构,新增了源操作数预规格化和结果后规格化功能模块,可以实现对非规格化浮点数的硬件处理。经过逻辑综合评估,改进版的硬件开销是面积在合理范围内增加19.23％,且对时序没有明显影响,可以满足预期的1.6 GHz频率设计目标。]]></description>
<pubDate>2020/4/29 0:00:00</pubDate>
<category><![CDATA[专题：高性能计算]]></category>
<author><![CDATA[何军，王丽]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002005]]></guid><cfi:id>4</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[MPI并行程序中通信等待问题的诊断方法及其应用]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002006]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[随着并行规模的扩大,现有通信等待问题的诊断方法存在内存开销大、测量时间开销大等问题。通过对现有通信等待问题诊断方法的深入分析,同时考虑测量开销可控的实际需求,建立基于热点函数的通信等待问题诊断模型。基于上述模型,总结出一种更精简、更实用的通信等待问题诊断方法。将该诊断方法分别应用到二维LARED集成、LARED-S、LAP3D等大规模MPI并行程序的通信等待问题诊断过程,应用效果表明本诊断方法可精确定位导致通信等待问题的关键代码段,给出的优化方案及性能提升空间对于后续的程序改进具有参考价值,其中根据诊断结果优化后的LARED-S程序性能提升32%,通信等待时间减少44%。]]></description>
<pubDate>2020/4/29 0:00:00</pubDate>
<category><![CDATA[专题：高性能计算]]></category>
<author><![CDATA[武林平，景翠萍，刘旭，田鸿运]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002006]]></guid><cfi:id>3</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[高铁大风预警模式挖掘]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002007]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[高铁大风预警的传统方法基于风速预测,当瞬时值高于限速阈值时触发报警,存在大量的误报警,不必要的限速控制影响了高铁行车效率。创新地提出了基于序列模式的预警方法,旨在挖掘报警事件前序数据中的频繁模式,找出报警事件的变化规律,通过滤除与非预警序列共有的频繁模式,得到预警序列独有的序列特征,构建了预警模式库。经兰新高铁沿线的监测数据验证,该方法在提高预测准确率的基础上降低了漏报率,同时有效地减少了模式匹配所需的时间,为提前预警预留充分的时间窗口,更加符合实际应用的需求。]]></description>
<pubDate>2020/4/29 0:00:00</pubDate>
<category><![CDATA[专题：高性能计算]]></category>
<author><![CDATA[滕飞，刘鉴竹，祝锦烨，勾红叶]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002007]]></guid><cfi:id>2</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[异构混合存储的软硬件协同数据放置策略]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002008]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[分析比较当前大数据中心典型混合存储架构,针对其不能综合运用存储管理系统和存储设备优势的问题,提出软硬件协同的数据放置策略,同时考虑软件层混合存储管理系统和硬件层混合存储设备的特点,根据应用特性为数据选择合适的存储管理系统和设备。面向不同应用场景,提出运行前规划存储路径的静态放置模式和运行中规划存储路径的动态放置模式。基于存储管理系统和设备性能参数建模,采用仿真方法实现各数据放置策略,并运行实际应用中的三类负载进行实验测试,结果表明采用软硬件协同的数据放置策略相比只考虑存储管理系统和存储设备的数据放置策略,性能可以提高近30%。]]></description>
<pubDate>2020/4/29 0:00:00</pubDate>
<category><![CDATA[专题：高性能计算]]></category>
<author><![CDATA[李鸿飞，杜溢墨，曾熠，王磊]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/202002008]]></guid><cfi:id>1</cfi:id><cfi:read>true</cfi:read></item>
</channel>
</rss>