<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005">
<channel xmlns:cfi="http://www.microsoft.com/schemas/rss/core/2005/internal" cfi:lastdownloaderror="None">
<title cf:type="text"><![CDATA[国防科技大学学报编辑部 -->计算机系统与技术]]></title>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[新型算控网络架构与关键技术研究进展]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250601]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[面向高端装备开放交互环境带来组件间高效数据交互的新型网络通信问题，提出了一种新型算控网络。针对高效、实时、灵活以及安全方面的极致需求，算控网络在协议体系、规划、应用及安全设计方面进行智简性设计，为异构资源间的强实时协同融合提供高效能和高灵活性的基础网络支撑。在详细调研相关研究工作基础上，探讨数据链路层增强、传感控制器远程内存直接获取接入、面向服务的感控中间件等新型算控网络关键技术，介绍国防科技大学网络芯片与系统团队算控网络关键技术攻关及测试评估情况，并展望未来挑战和研究方向，助力我国在高端装备体系和创新生态方面获得领先优势。]]></description>
<pubDate>2025/12/2 0:00:00</pubDate>
<category><![CDATA[计算机系统与技术]]></category>
<author><![CDATA[杨惠，董德尊，荀鹏，刘汝霖，厉俊男，唐竹，吕高锋，全巍，钟金诚，李韬]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250601]]></guid><cfi:id>7</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向集合通信硬件卸载的维序触发机制和数据缓存方法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250602]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[为了对“天河”网络中基于网卡的集合通信硬件卸载功能进行进一步优化，以支持更多类型的集合通信算法以及更大的消息尺寸，研究了面向集合通信硬件卸载的维序触发机制和数据缓存方法。提出面向多任务并发的维序触发机制，既满足了期望的集合通信语义，又确保了浮点计算操作结果的可复现性；提出基于哈希表和脉冲信用流控的网络数据动态缓存方法，以缓解有限的硬件缓存资源和多任务并发的大量网络数据缓存需求之间的矛盾问题。实验结果表明，与基于软件方式的集合通信操作相比，该方法可以支持多种典型集合通信操作的多种算法的硬件卸载，且性能提升效果显著，同时，硬件实现代价较低，尤其是在缓存资源方面具有较高的利用率。]]></description>
<pubDate>2025/12/2 0:00:00</pubDate>
<category><![CDATA[计算机系统与技术]]></category>
<author><![CDATA[徐金波，董德尊，李宝峰，张伟，邢建英，张鹏]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250602]]></guid><cfi:id>6</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[增强随机集成的混合核<i>K</i>近邻算法的基站网络流量模型]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250603]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[面向5G/6G超密集组网的基站网络流量预测需求，提出一种增强随机集成混合核<i>K</i>近邻算法（enhanced random ensemble-based mixed kernel K-nearest neighbor algorithm，ER-MKKNN）。通过融合径向基函数与白噪声核构建混合核函数，突破了单一核函数在非线性关联建模与噪声抑制间的平衡瓶颈。创新性地引入样本-特征双重随机子采样与超参数区间随机化策略，显著提升了高维稀疏场景的泛化稳定性。基于袋外误差反演的动态权重分配机制，提升了算法对流量突变的鲁棒响应能力。配套设计的多级并行化架构，为超密集组网提供了可扩展的预测解决方案。实验表明，ER-MKKNN在均方根误差、平均绝对百分比误差和平均绝对误差三项指标上均优于所对比深度学习模型，为智能网络运维提供了新的技术路径。]]></description>
<pubDate>2025/12/2 0:00:00</pubDate>
<category><![CDATA[计算机系统与技术]]></category>
<author><![CDATA[孙宁，李卓轩，时欣利，孙霈翀，许明杰，曹进德]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250603]]></guid><cfi:id>5</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[面向加速粒子输运随机模拟的概率可调真随机数生成器]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250604]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[粒子输运问题的随机模拟在传统冯·诺依曼架构上面临随机事件分支和不规则访存带来的挑战，其根源在于随机算法与确定性硬件之间的不匹配。为此，设计了一种基于自旋和铁电器件的概率可调真随机数生成器。基于自旋器件的物理随机性，为架构提供物理随机源，并通过优化的控制逻辑和写入机制提高随机比特吞吐率；基于铁电器件的忆阻特性，设计了可编程和具有非易失连续存储权重的概率可调突触。实验表明，该设计求解示例输运问题时性能相比通用处理器提高171~1 028倍。进一步地，相较现有的基于自旋转移矩磁隧道结的真随机数生成器，其不仅唯一具有生成可调概率随机采样的能力，且产生均匀分布随机序列时吞吐率达到303 Mbit/s，具有更高的随机比特吞吐率。]]></description>
<pubDate>2025/12/2 0:00:00</pubDate>
<category><![CDATA[计算机系统与技术]]></category>
<author><![CDATA[傅思清，黎铁军，吴利舟，张春元，马胜，张建民，任睿轩]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250604]]></guid><cfi:id>4</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[深度强化学习和负载中心性理论融合的分段路由优化算法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250605]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[结合软件定义网络与分段路由（segment routing，SR）可优化网络性能，但在大规模动态网络中，其关键节点链路利用率过高会导致队列延迟激增。为此，提出深度强化学习与负载中心性理论融合的分段路由优化算法（segment routing optimization algorithm fusing deep reinforcement learning and load centrality theory，SROD-LC）。通过负载中心性理论量化网络节点重要性，识别关键节点并监控其链路负载状态；利用多智能体强化学习框架，在关键节点部署分布式深度强化学习智能体，通过共享奖励机制协调路由决策，实现链路负载的主动优化。同时结合SR的灵活性，动态调整段标识列表快速重路由部分流量，降低本地链路利用率并规避潜在拥塞。基于真实网络拓扑的模拟实验结果表明：当SR关键节点比例在0.3~0.5范围时，SROD-LC优化效果显著，与基准算法相比，可将网络最大链路利用率降低21%~35%。]]></description>
<pubDate>2025/12/2 0:00:00</pubDate>
<category><![CDATA[计算机系统与技术]]></category>
<author><![CDATA[曹继军，吴宗明，汤强，李小玉]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250605]]></guid><cfi:id>3</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[资源受限场景下基于算子感知的大模型推理张量卸载方法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250606]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[在一些资源受限场景下，大语言模型的高效推理部署面临严峻挑战。当前主流的模型推理优化技术，虽然在一定程度上提高了模型推理效率，但是仍然存在部署粒度较为粗糙、推理精度较差等问题。根据不同算子对GPU亲和度不同的发现，提出算子感知张量卸载（operator-aware tensor offloading，OATO）方法。OATO能够提取算子的语义知识，并基于此设计了智能算子调度算法，可以生成全局最优模型部署方案。同时，将OATO方法集成进最新的大模型推理框架Llama.cpp中，实现了算子感知的张量卸载增强推理引擎OALlama.cpp。实验结果表明，相比于业内最先进的推理引擎Llama.cpp和FlexGen，OALlama.cpp在3种大模型上均取得最好的推理性能，尤其是在LlaMA3-8B模型GPU加载75%权重的场景下，OALlama.cpp的首词生成速度相比FlexGen和Llama.cpp提升近1倍。]]></description>
<pubDate>2025/12/2 0:00:00</pubDate>
<category><![CDATA[计算机系统与技术]]></category>
<author><![CDATA[张建锋，谢栋，蹇松雷，李宝，王晓川，郭勇，余杰]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250606]]></guid><cfi:id>2</cfi:id><cfi:read>true</cfi:read></item>
<item>
<title xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="text"><![CDATA[针对控制流计算图的内存优化方法]]></title>
<link><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250607]]></link>
<description xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" cf:type="html"><![CDATA[AI芯片在深度学习应用中受限于片上内存容量，当前主流内存优化方法针对静态计算图，对动态计算图的内存优化存在进一步的优化空间。针对该问题，提出一种控制流计算图模型的内存优化框架，在子图内部实现内存复用的基础上，结合控制流特性递归进行子图间的内存复用。针对片上与片外内存的内存墙问题，针对控制流计算图的权重数据提出一种有效的乒乓缓存实现策略，在子图内部实现访存和计算操作的重叠执行。基于国产LUNA AI芯片进行验证，结果表明，该内存优化框架实现了控制流计算图的片上内存优化使用，相比原有方法进一步提升5.9%。该策略有效解决了内存墙问题，减少了片上片外内存的数据传输时间，计算图的执行效率最高提升29%。]]></description>
<pubDate>2025/12/2 0:00:00</pubDate>
<category><![CDATA[计算机系统与技术]]></category>
<author><![CDATA[王向前，申彧昊，景琨，吕亚飞]]></author>
<guid><![CDATA[http://journal.nudt.edu.cn/gfkjdxxb/article/abstract/20250607]]></guid><cfi:id>1</cfi:id><cfi:read>true</cfi:read></item>
</channel>
</rss>