doi:10.11887/j.cn.202402011

http://journal. nudt. edu. cn

# 轻量级 SpaceFibre 节点高速传输系统的优化设计

郑静雅<sup>1,2</sup>,安军社<sup>1\*</sup>

(1. 中国科学院国家空间科学中心 复杂航天系统电子信息技术重点实验室,北京 100190;
 2. 中国科学院大学 计算机科学与技术学院,北京 100049)

摘 要:为满足卫星有效载荷间 SpaceFibre 链路的高带宽、高可靠性和轻量化的应用需求,提出一种 SpaceFibre 节点传输系统的优化设计。该设计采用基于帧累计的增量化计算方法减少了计算电路的冗余;通 过四级流水架构满足了错误检测操作的时序要求,使用循环冗余校验共享机制平衡了硬件资源的使用;采取 基于完整应答的双层控制策略提升了系统的可靠性,通过构建面向资源优化的控制状态机和存储架构简化 了确认重传算法的实现逻辑。使用型号为 XC7Z100FFC900 - 2 的 FPGA 搭建双节点系统,板级验证表明:该 设计满足协议规范,与同类设计方案相比,最高工作频率提高1.5 倍,支持最高 6.25 Gbit/s 的传输速率,查找 表资源和存储资源降低,寄存器资源相近,为开发具有自主知识产权的高速可靠 SpaceFibre 编解码器提供了 参考。

关键词:超高速 SpaceFibre;现场可编程门阵列;性能优化;错误恢复;服务质量 中图分类号:TP336 文献标志码:A 开放科学(资源服务)标识码(OSID): 文章编号:1001-2486(2024)02-104-11



# Optimal design for the high-speed and lightweight transmission system of SpaceFibre node

ZHENG Jingy $a^{1,2}$ , AN Junsh $e^{1*}$ 

(1. Key Laboratory of Electronics and Information Technology for Space Systems, National Space Science Center,

Chinese Academy of Sciences,  $\operatorname{Beijing} 100190\,,$  China;

2. School of Computer Science and Technology, University of Chinese Academy of Sciences, Beijing 100049, China)

Abstract: An optimal design of SpaceFibre node transmission system was proposed to meet the high bandwidth, high reliability and light weight requirements for the SpaceFiber link between satellite payloads. This design adopts an incremental calculation method based on frame accumulation to reduce the redundancy of computing circuits, and satisfies the timing requirements for error detection operations through a four-stage pipeline architecture. The module balances the use of hardware resources by sharing CRC(cyclic redundancy check). To improve reliability, the design adopts a two-layer control strategy with complete response. Resource-optimized FSM(finite-state machine) and storage architecture are built to simplify the implementation of the retransmission algorithm. A verification system at board-level with two nodes was implemented in XC7Z100FFG900 – 2 FPGA(field programmable gate array). The results show that the design satisfies the functions stipulated by the standard. Compared with similar design schemes, the maximum frequency is increased by 1.5 times, and supports up to 6.25 Gbit/s transmission rate. And resources of lookup tables and storage are reduced, while register resources are similar. The design provides a reference for the development of high-speed and reliable SpaceFibre codecs with independent intellectual property rights.

Keywords: high-speed SpaceFibre; FPGA; performance optimizing; error recovery; quality of service

随着空间探测任务的日益繁重,星载数据处 理系统<sup>[1]</sup> 呈现多样化、复杂化和超高速化的趋势。已有的1553B、控制器局域网总线(controller area network, CAN)和SpaceWire 等<sup>[2-4]</sup>技术已不 能支持吉比特级的超高速有效载荷。为此,欧洲 航天局提出 SpaceFibre 技术<sup>[5]</sup>以组建超高速星载 数据网络,该技术单通道节点的运行速率最高可 达 6.25 Gbit/s,多通道编解码器具有高达 100 Gbit/s的传输速率。此外,该技术支持全双工 数据传输,可提供服务质量(quality of service,

收稿日期:2021-12-02

基金项目:中国科学院战略性先导科技专项基金资助项目(XDA15020205)

第一作者:郑静雅(1995一),女,山东德州人,博士研究生,E-mail:zhengjingya@nssc.ac.cn

<sup>\*</sup>通信作者:安军社(1969一),男,陕西渭南人,研究员,博士,博士生导师,E-mail:anjunshe@nssc.ac.cn

QoS)、错误检测隔离与恢复(failure detection isolation and recovery,FDIR)和流量控制等功能。

针对 SpaceFibre 单通道节点传输系统,国内 外研究人员进行了相关研究:英国邓迪公司实现 了支持完整协议栈的单通道 SpaceFibre 节点系 统<sup>[6-8]</sup>,并完成了抗辐照单通道节点芯片的设计 和流片<sup>[9]</sup>。德国比勒费尔德大学将其完善为具 有高级可扩展接口(advanced extensible interface, AXI)的可重构节点系统<sup>[10]</sup>。瑞典的科巴姆公 司<sup>[11]</sup>开发了具有高度灵活性的单通道节点系统。 但上述研究并未给出具体的实现方案,且商用知 识产权(intellectual property, IP)核的价格高昂,不 能满足我国航天工程应用的国产化需求。文 献[12]提出了一种简化版本的单通道 SpaceFibre 编解码器,该编解码器去除了 FDIR 功能以及 QoS 的部分功能,且限制虚拟通道数目最多为2。由 于关键功能的简化,该编解码器仅适用于特定的 应用场景。文献[13]完成了具有完整功能的单 通道编解码器并在不同的开发平台上经过了板级 验证,但该设计仅支持不大于 3.125 Gbit/s 的传 输速率。文献[14]实现了自主化单通道编解码 器的基础设计并进行了初步的功能仿真,但该设 计功能的完整性有待补充,且最高工作频率相对 较低、资源占用率较高。

为满足 SpaceFibre 技术在国产通用化航天应 用场景中的高带宽、高可靠和低面积的传输需求, 本文提出了采用优化技术的 SpaceFibre 单通道节 点传输系统,该系统能够稳定支持协议规范的各 项功能,可占用轻量级的电路面积支持更高的传 输速率,为开发高效 SpaceFibre 节点系统提供了 具有积极意义的思路。

# 1 SpaceFibre 协议栈

SpaceFibre 协议栈包含管理层、网络层、数据 链路层、多通道层、通道层和物理层。网络层提供 数据包传输和广播服务,该层功能的实现主体为 路由器。管理层负责各层的管理和监测,与数据 链路层、通道层和物理层共同构成 SpaceFibre 单 通道节点。

数据链路层主要负责提供 QoS、FDIR 和流量 控制功能。数据链路层通过虚拟通道(virtual channel,VC)管理来自不同数据源的数据包。多 条 VC 竞争链路资源时,数据链路层采用预留带 宽、优先级和调度三种服务质量机制仲裁各条 VC 的数据发送权。

数据包在数据链路层需要以数据帧形式继续

传输。如图 1 所示,单通道节点的数据帧以数据 帧帧头(start of data frame,SDF)控制字开始、数据 帧帧尾(end of data frame,EDF)控制字结束,帧头 和帧尾之间包含  $N(N \le 64)$ 个数据字。SDF 控制 字主要包含四部分:字标识码、SDF 识别码、虚拟 通道号和保留字段。EDF 控制字由 EDF 识别码、 序列号和 16 bit 循环冗余校验(cyclic redundancy check, CRC)组成。双字长的广播消息被封装成 广播帧,广播帧格式与数据帧格式类似。

|            | 24 31     | 16 23  | 8 15    | 0 7       |
|------------|-----------|--------|---------|-----------|
| SDF<br>控制字 | RESERVED  | VC     | SDF     | COMMA     |
|            | DATA 1 MS | DATA 1 | DATA 1  | DATA 1 LS |
| 数据印        | DATA 2 MS | DATA 2 | DATA 2  | DATA 2 LS |
| 30.0642    | :         | :      | :       | :         |
|            | DATA N MS | DATA N | DATA N  | DATA N LS |
| EDF<br>控制字 | CRC_MS    | CRC_LS | SEQ_NUM | EDF       |

#### 图1 单通道节点数据帧格式

Fig. 1 Data frame format for a single lane node

数据链路层采用如图 2 所示的空闲帧填充空 闲链路,该帧包含空闲帧帧头(start of idle frame, SIF)控制字和伪随机数。SIF 控制字由字标识 码、SIF 识别码、序列号和单字节循环冗余校验四 个字段组成。

|            | 24 31     | 16 23   | 8 15   | 0 7       |
|------------|-----------|---------|--------|-----------|
| SIF<br>控制字 | CRC       | SEQ_NUM | SIF    | COMMA     |
|            | PRBS 1 MS | PRBS 1  | PRBS 1 | PRBS 1 LS |
| 伪随机        | PRBS 2 MS | PRBS 2  | PRBS 2 | PRBS 2 LS |
| 数据段        | :         | :       | :      | :         |
|            | PRBS N MS | PRBS N  | PRBS N | PRBS N LS |

#### 图 2 单通道节点空闲帧格式

Fig. 2 Idle frame format for a single lane node

数据链路层通过确认重传算法<sup>[5]</sup>提供错误 恢复功能,该功能涉及确认控制字 (acknowledgement, ACK)、否定确认控制字 (negative acknowledgement, NACK)、满控制字 (full control word, FULL)和重试控制字(retry control word, RETRY)等。除字标识码不同外,反 馈信息控制字 ACK/NACK 和缓冲区满控制字 FULL 的格式与 SIF 控制字相同。错误恢复过程 中,RETRY 控制字用于链路近端向远端通知本端 已接收到 NACK 并开始重发错误恢复缓冲区中 的数据。

数据链路层使用基于信用的流量控制机制, 链路远端通过流控信令字(flow control token, FCT)向近端通知存储空间的剩余情况,该控制字 的四个字段分别为字识别码、流控信息、序列号和 8 bit CRC 校验。

通道层主要用于8B/10B编解码、字符同步、 时钟补偿、通道状态控制和通道初始化。物理层 负责在光纤和电缆等物理介质上进行串行数据的 收发。

# 2 系统优化与设计

通过对 SpaceFibre 协议栈进行分析,本文提 出如图 3 所示的轻量级高速单通道节点传输系 统,轻量级是指面积轻量化、占用逻辑资源较少。 图 3 中,数据链路层包含 n 条虚拟通道的缓冲区 和流控模块,用于实现数据的缓存和流控机制。 该架构不局限于具体的虚拟通道数目,可根据实 际应用需求进行 VC 数目的选择,具有一定的可 扩展性。介质访问控制(media access control, MAC)子系统负责实现服务质量机制。广播消息 缓冲区、广播流控和广播帧生成模块共同组成广 播子系统。数据帧生成模块将通过 MAC 仲裁的 数据段封装成指定的帧格式,进行错误恢复的数 据帧需经过该模块进行帧尾控制字的更新。错 误检测子系统主要根据接收数据的循环冗余校 验和序列号校验结果进行错误检测。错误恢复 子系统主要用于数据的备份和重发操作。物理 层的主体为高速收发器 IP 核,该层还实现了通 道层的 8B/10B 编解码、字符同步和时钟补偿功 能。通道层包含控制字生成、链路初始化和字 识别模块。



图 3 SpaceFibre 节点系统架构 Fig. 3 Architecture of the system of SpaceFibre node

#### 2.1 基于帧累计增量计算的介质访问控制子系统

介质访问控制子系统主要用来实现优先级、 预留带宽和调度三种服务质量。如图4所示,该 子系统主要分为优先级优先权计算、带宽信用计 算、优先权计算、调度和带宽状态记录模块。

任意虚拟通道经过 MAC 仲裁发送数据段后, 带宽信用计算模块需按式(1)所示<sup>[5]</sup>分别计算各 虚拟通道的带宽信用值 *C<sub>i</sub>*。已用带宽 *U* 指带宽 信用更新后, VC<sub>i</sub> 发送的数据字数目。可用带宽 *A* 则为链路上所有虚拟通道发送的数据字数目总 和。标准化期望带宽 *N* 指 VC<sub>i</sub> 所分配带宽占链 路总带宽的比例。

$$C_{i} = \sum_{n} \left[ A(n) - U(n) N_{i}^{-1} \right]$$
 (1)

式(1)最直观的硬件实现方法是分别计算减





Fig.4 MAC architecture based on incremental calculation 号前后两部分再相减、累加。单通道编解码器的 最高速率为 6.25 Gbit/s,假设带宽信用记忆时间

为1 ms,若以字为单位进行带宽信用的计算,则带

宽信用的数据宽度需满足 W<sub>c</sub>≥18 bit,已用带宽 和可用带宽的数据宽度与 W<sub>c</sub> 相同。因此,若直 接按式(1)计算会引入大位宽的加法和乘法,带 来大量的计算资源消耗。此外,带宽信用、可用带 宽和已用带宽不一定同时达饱和态,所以此方法 不易处理带宽信用达带宽信用限制的情况。

针对上述问题,本文提出基于帧累计的增量 化带宽信用计算方法。由式(1)推导得:经过 MAC 仲裁获得数据发送权的 VC<sub>i</sub>和未被调度的 虚拟通道的带宽信用变化量  $\Delta C$  如式(2)所示。 该方法对虚拟通道发送的数据帧而非数据字进行 统计,将带宽信用的位宽  $W_c$ 减少了 33%。带宽 信用计算模块更新带宽信用时,仅需在现有数值 的基础上增加  $\Delta C$ 。可见,帧累计增量化计算方法 有效避免了大位宽加法操作,消除了乘法操作,仅 需处理带宽信用的饱和态,简化了带宽信用的更 新流程,减少了计算电路的冗余设计。

$$\begin{cases} \Delta C^{\rm Sch} = 1 - N_i^{-1} \\ \Delta C^{\rm UnSch} = 1 \end{cases}$$
(2)

图 5 为 n 路基于帧累计的增量化计算基本单元,该结构中各虚拟通道根据预留带宽计算带宽信用变化量。虚拟通道发送使能信号用于选择变化量,当其为0时选择  $\Delta C^{\text{UnSch}}$ 进行后续操作,为1时选择  $\Delta C^{\text{Sch}}$ 。该结构具有逻辑简单、占用资源较少、易于扩展等特点。





为保证带宽分配的合理性,若带宽信用超出 限制阈值,则相应优先级优先权暂为0。帧累计 方案通过降低 W<sub>c</sub>,降低了带宽信用与带宽信用阈 值比较电路的复杂度。

各虚拟通道拥有相应的调度表,表中记录的 是本虚拟通道在各时隙是否被允许调度。当同一 时隙中被允许的多条 VC 共同请求发送数据时, 调度模块需根据优先权大小仲裁数据发送权。其 中,优先权为优先级优先权和带宽信用之和。随 着 W<sub>c</sub> 降低,优先权位宽也减少,因此以帧为单位 的计算方法为调度模块的高效仲裁打下了基础。

在保证运算结果正确的情况下,增量化计算 简化了带宽信用的计算逻辑,有利于提升计算效 率。帧累计方法实现了面向资源优化的带宽信用 更新、带宽信用比较和优先权比较,进一步减少了 电路面积。

#### 2.2 基于流水线技术的错误检测子系统

错误检测子系统接收到的字可以分为数据 帧、广播帧和空闲帧三种非单字帧,以及流量控制 字 FCT、错误恢复控制字 FULL/RETRY 和反馈信 息字 ACK/NACK 共六种。在接收到数据后,错误 检测子系统需要根据序列号和循环冗余校验字段 进行错误检测操作。若等待某帧错误检测完毕再 对下一个字进行校验,会引入较大的处理延时,导 致错误检测子系统不能在当前速率下对数据进行 有效解析。为解决上述问题,在充分考虑数据处 理速度的基础上,本文提出基于流水线的错误检 测子系统,该子系统架构如图 6 所示。

一旦通道层向数据链路层的接收端传递字, 该架构会立即开始字的流水化错误检测操作。整 个流水线共分为解复用(demultiplexing, DEMUX)、解帧(unpack data frame, UNFRM)、解 析(analysis, ANLS)和判断(judge, JU)四个步骤。 解复用DEMUX步骤通过控制字标识字段对非单 字帧和其他控制字进行分类。分类后的非单字帧 通过解帧 UNFRM 被分隔为广播帧、数据帧和空 闲帧三种类型。错误检测系统为顺序系统,为了 保证接收序列号更新行为的正确性,需要在解帧 步骤中对 FULL/FCT 进行保持操作。解析 ANLS 用于广播帧、数据帧、空闲帧和其他控制字的序列 号检查和循环冗余校验。判断 JU 根据解析结果 判读当前帧或控制字是否有效。

考虑到硬件开销,图 6 中的 ACK/NACK、FCT 和 FULL 控制字共享同一8 bit CRC 解析模块,该 模块的重复利用有效降低了错误检测电路的面积。由于 CRC 生成式和帧结构不同,数据帧解 析、广播帧解析、空闲帧解析模块各自包含 CRC 解析和序列号解析模块。





当反馈信息的循环冗余校验无误,且其序列 号的极性等于发送序列号的极性 *P*<sub>TX</sub>时,则认为 反馈信息为有效。

与反馈信息不同,非单字帧、FCT 和 FULL 的 校验只与接收端有关,且整个数据处理都是单向 的,所以可进行流水线操作。当数据帧、广播帧、 流控字的 CRC 正确且所包含的序列号满足式(3) 时,则认为当前帧或字有效。此时接收序列号 *SNC*<sub>RX</sub>做递增处理,以备后续字的正确接收。

$$\begin{cases} P_{\rm FR} = P_{\rm RX} \\ SNC_{\rm FR} = SNC_{\rm RX} + 1 \end{cases}$$
(3)

式中,P<sub>FR</sub>为非单字帧的序列号极性,SNC<sub>FR</sub>为非单 字帧的序列号计数值。

当 FULL/SIF 控制字的循环冗余校验正确且 所携带的序列号满足式(4)时,则认为有效。

$$\begin{cases} P_{\rm FS} = P_{\rm RX} \\ SNC_{\rm FS} = SNC_{\rm RX} \end{cases}$$
(4)

式中,  $P_{\rm FS}$ 为 FULL/SIF 控制字的序列号极性, *SNC*<sub>FS</sub>为其序列号计数值。

使用流水线技术对错误检测过程进行优化, 保证了错误检测操作的连续性,提高了系统的运 行频率,可支持多种接收速率。循环冗余校验模 块的重复利用,减少了系统的电路面积,平衡了错 误检测子系统硬件资源的使用。

# 2.3 基于轻量化确认重传算法的错误恢复子系统

相比 SpaceWire 等中低速网络, SpaceFibre 星 载数据网络拥有更快的速率<sup>[15-16]</sup>,但也面临越来 越严重的可靠性挑战。该协议采用确认重传算 法<sup>[5]</sup>避免数据的丢失。未经优化的错误重传架 构保留恢复的开销较大,因此需要设计高效的容 错架构,有效保证系统运行效率的同时不带来巨 大硬件开销。本文提出了图 7 所示的基于轻量化 确认重传算法的错误恢复子系统,该子系统可在 保证错误恢复功能的基础上,严格控制错误恢复 引入的资源成本。

现有的错误恢复控制解决方案在数据帧、广 播帧和流控字备份的删除或者重发过程中无法响 应反馈信息,造成反馈信息的漏应答,对反馈信息 的处理具有不完整性,不能及时清理备份数据,进 而引起错误恢复缓冲区的溢出。

为克服上述技术缺陷,错误恢复子系统采用基 于完整应答的双层控制策略。错误恢复控制模块 为第一层,主要负责响应正确接收的反馈信息;第 二层由数据帧错误恢复控制、广播帧错误恢复控制 和流控字错误恢复控制模块共同组成,主要用于删 除和重发流程。当错误恢复控制模块处于反馈处 理状态时,未被处理的反馈信息会暂存到反馈信息 寄存器中。错误恢复控制模块若检测到存在未处 理的反馈信息,则进入相应的反馈处理状态。基于



#### 图 7 轻量化错误恢复子系统架构

Fig. 7 Lightweight error recovery subsystem architecture

完整应答的双层控制策略简化了控制逻辑,可保 证缓冲区的非满状态,进而保证系统的稳定运行。

为降低确认重传算法的硬件实现资源,第二 层控制策略采用轻量化错误恢复控制状态机,以 图8所示的数据帧错误恢复控制状态机为例进行 说明。该状态机可使用较少的工作状态完成基本 的反馈信息处理操作,控制逻辑较简单,占用面积 较小,保证了错误恢复子系统的轻量化。当接收 到错误恢复控制模块的使能信号 EnFsm 时,该状 态机进入判断态。在判断态,若帧尾错误恢复缓 冲区中的首个序列号小于反馈信息序列号 RxSeqAns,则状态机进入删除态。在删除态,该 模块删除相应的数据帧和帧尾。当数据帧错误缓 冲区中读取出 EDF 时,状态机从删除态再次进入 判断态。若该缓冲区非空且错误恢复控制模块处 于 NACK 处理态,状态机进入重发态并向错误恢 复控制模块反馈 ReSdDat 信号。在重发态,数据 帧错误恢复控制模块向数据帧生成模块发出数据 帧重发请求。数据帧生成模块通过读使能信号 EnRdDBuf\_i 读取需要重发的数据帧。





错误恢复子系统采用面向资源优化的轻量化 存储架构。图7中数据帧错误恢复 FIFO 缓冲区 用于备份数据帧生成模块输出的数据帧,其存储 宽度为数据字宽度 w<sub>n</sub>。为了降低数据备份带来 的硬件开销,数据帧尾错误恢复缓冲区仅存储帧 尾 EDF 中的无符号序列号,该缓冲区存储宽度  $w_{\text{FDF}}$ 仅为7 bit。由协议的分析可知,广播帧错误 恢复存储格式与数据帧错误恢复类似。单通道流 控字的存储结构可简化为仅备份虚拟通道号和无 符号序列号。假设数据帧错误恢复缓冲区的深度 为 $d_{\rm D} = 2^m (m \ge 6, m \in \mathbb{N})$ ,用于数据帧尾错误恢 复缓冲区的深度为  $d_{\text{EDF}} = 2^n (n \in \mathbf{N}^+)$ ; 广播帧错 误恢复缓冲 FIFO 的深度为  $d_{BC} = 2^{p} (p \in \mathbf{N}^{+}),$ 广 播帧尾错误恢复缓冲区深度为  $d_{\text{FBF}} = 2^q (q \in \mathbf{N});$ 流控字错误恢复缓冲 FIFO 的深度为  $d_{\text{FCT}} = 2^k$  $(k \in \mathbf{N}^{+})$ 。则在相同深度的情况下,轻量级存储 结构共节省存储区域 S 大小如式(5) 所示,存储 深度越大,该结构优势越明显。

 $S = (2+m)2^{n} + (2+p)2^{q} + 23 \times 2^{k}$ (5)

基于完整应答的双层控制策略提升了系统的 可靠性,简化了控制逻辑的复杂度,进而降低了资 源的消耗。面向资源优化的轻量化存储架构,降 低了数据备份的存储资源占用。

#### 3 系统测试与验证

#### 3.1 系统功能验证

在两块型号为 XC7Z100FFG900-2 的现场可 编程门阵列(field programmable gate array, FPGA) 上分别例化包含四条虚拟通道的优化节点系统以 搭建双节点板级验证平台,如图9所示。单一节点 板级验证平台由数据生成器、广播消息生成器、错 误注入器、参数配置器、状态记录器、集成逻辑分析 仪(integrated logic analyzer, ILA)和节点系统组成。 不同节点系统之间使用单条光纤链路进行全双工



图 9 系统板级验证平台 Fig. 9 Verification platform of the system board

# 3.1.1 介质访问控制子系统验证

验证过程中 VC<sub>0</sub> 至 VC<sub>3</sub> 的优先级分别为  $R_0 = 3 \ R_1 = 2 \ R_2 = 1 \ \pi R_3 = 0$ ,预留带宽均为 25%,带宽信用限制为 977 帧。除时隙 6 为十六 进制 E,时隙 0 至时隙 63 均为十六进制 F。

如图 10 所示为集成逻辑分析仪抓取的介质 访问控制子系统波形图,测试过程中向 VC<sub>0</sub> 和 VC<sub>1</sub>中注入数据包。图 10(a)中允许任意 VC 参 与调度。数据包注入后,MAC 选择优先权最大的 VC<sub>0</sub>进行数据发送并从输出虚拟通道 0 缓冲区中 读取数据包内容。同时,MAC 根据式(2)更新各 虚拟通道的带宽信用。带宽信用阈值为带宽信用 限制的 90%,图 10(b)中 VC<sub>0</sub>带宽信用达到带宽 信用阈值,该虚拟通道的优先级优先权暂时为 0, MAC 选择优先权较大的 VC<sub>1</sub>进行数据发送并从 输出虚拟通道 1 缓冲区中读取数据包。图 10(c) 中允许除 VC<sub>0</sub> 外的其他虚拟通道参与调度。数



(a) 无调度数据帧开始发送(a) Beginning of data transmission without scheduling

据包注入后,虽然虚拟通道0的优先权最大,但是 其被禁止发送数据,因此MAC从输出虚拟通道1 缓冲区读取数据包。图10(d)中,VC<sub>1</sub>带宽信用 达到带宽信用阈值,其优先级优先权暂时为0,但 此时VC<sub>0</sub>被禁止调度,因此MAC仲裁结果仍为 VC<sub>1</sub>。可见,介质访问子系统实现了优先级、预留 带宽和调度三种服务质量。

通信,物理链路速率分别配置为协议规范<sup>[5]</sup>中的

1 Gbit/s, 1.25 Gbit/s, 2 Gbit/s, 2.5 Gbit/s,

## 3.1.2 错误检测子系统验证

如图 11 所示为错误检测子系统 ILA 波形图, 图中包含该子系统中流水线各级的输出结果:解 复用 DEMUX 步骤对 FCT 控制字、NACK 控制字 和非单字帧进行分类;分类后的非单字帧通过解 帧 UNFRM 步骤被分隔为数据帧;根据解析 ANLS 步骤的序列号检查和循环冗余校验的结果,判断 JU 步骤判读数据帧、FCT 和 ACK 的有效性。因 此,错误检测子系统可以判断接收数据的正确性, 及时检测错误的发生。

» 📕 🖪 @ @ X 📲 🖬 케 코 코 퓌 🖬 히 터 Value 500 Data link Layer/schtab time[3:0 t\_Data\_link\_Layer/OutVC0\_out[35:0] 03d0d0d0d 0400 000404040 \_Data\_link\_Layer/OutVC1\_out[35:0] 000404040 t\_Dat...nk\_Layer/flag\_RchBWLimTh0 t Dat...nk Laver/flag RchBWLimTh t Data link Layer/BW credit0[13:0] -879 293 t\_Data\_link\_Layer/BW\_credit1[13:0] 293 t Data link Layer/BW credit2[13:0] 294 t Data link Laver/BW credit3[13:0] 293 t Data link Laver/Precedence0[13] -879 -879 t\_Data\_link\_Layer/Precedence1[13 5178 t\_Data\_link\_Layer/Precedence2[13: 3224 3224 t\_Data\_link\_Layer/Precedence3[13 1270

(b) 无调度带宽信用达阈值(b) Abnormal bandwidth without scheduling

#### » ■ B Q Q X + H H 12 27 + F F + H

|                                     |           |        |           | 733  |
|-------------------------------------|-----------|--------|-----------|------|
|                                     | Value     | 0      | 500       |      |
| st_Data_link_Layer/schtab_time[3:0] | е         |        | •         |      |
| st_Data_link_Layer/OutVC0_out[35:0] | 001010101 |        | 001010101 |      |
| st_Data_link_Layer/OutVC1_out[35:0] | 000404040 |        |           |      |
| st_Datnk_Layer/flag_RchBWLimTh0     | 0         |        |           |      |
| st_Datnk_Layer/flag_RchBWLimTh1     | 0         |        |           |      |
| st_Data_link_Layer/BW_credit0[13:0] | 1         | $\sim$ | 1         | 2    |
| st_Data_link_Layer/BW_credit1[13:0] | -3        |        | -3        | -6   |
| st_Data_link_Layer/BW_credit2[13:0] | 1         | $\sim$ | 1         | 2    |
| st_Data_link_Layer/BW_credit3[13:0] | 1         |        | 1         | 2    |
| st_Data_link_Layer/Precedence0[13:0 | 6840      |        | 6840      | 6841 |
| st_Data_link_Layer/Precedence1[13:0 | 4882      |        | 4882      | 4879 |
| st_Data_link_Layer/Precedence2[13:0 | 2932      |        | 2932      | 2933 |
| st_Data_link_Layer/Precedence3[13:0 | 978       |        | 978       | 979  |

(c) 有调度数据帧开始发送

(c) Beginning of data transmission with scheduling

#### > 📕 📴 🔍 🔍 🛒 🖬 射 🖆 🖆 👫 🖬 🖃

| 1                                   | -         |     |        |                                                                                                                 |     |     |    |
|-------------------------------------|-----------|-----|--------|-----------------------------------------------------------------------------------------------------------------|-----|-----|----|
|                                     | Value     | 0   | 5      | 00                                                                                                              |     |     | 1, |
| st_Data_link_Layer/schtab_time[3:0] | е         |     | •      |                                                                                                                 |     |     | >  |
| st_Data_link_Layer/OutVC0_out[35:0] | 001010101 | K T | 001010 | 101                                                                                                             |     |     | þ  |
| st_Data_link_Layer/OutVC1_out[35:0] | 0d1404040 |     |        |                                                                                                                 |     |     | 1  |
| st_Datnk_Layer/flag_RchBWLimTh0     | 0         |     |        |                                                                                                                 |     |     |    |
| st_Datnk_Layer/flag_RchBWLimTh1     | 1         |     |        |                                                                                                                 |     |     | t  |
| st_Data_link_Layer/BW_credit0[13:0] | 293       |     | 293    |                                                                                                                 | χ 2 | 94  |    |
| st_Data_link_Layer/BW_credit1[13:0] | -879      | Ŕ.  | -879   |                                                                                                                 | χ-  | 882 |    |
| st_Data_link_Layer/BW_credit2[13:0] | 293       |     | 293    |                                                                                                                 | X 2 | 94  |    |
| st_Data_link_Layer/BW_credit3[13:0] | 293       | ĺΩ_ | 293    |                                                                                                                 | X 2 | 94  | ×. |
| st_Data_link_Layer/Precedence0[13:0 | 7132      | 6C  | 7132   |                                                                                                                 | χ7  | 133 |    |
| st_Data_link_Layer/Precedence1[13:0 | -879      | bC  | -879   |                                                                                                                 | χ-  | 882 |    |
| st_Data_link_Layer/Precedence2[13:0 | 3224      | 0C  | 3224   |                                                                                                                 | X 3 | 225 |    |
| st_Data_link_Layer/Precedence3[13:0 | 1270      | bC  | 1270   |                                                                                                                 | 1   | 271 |    |
|                                     |           |     |        | The second se |     |     |    |

(d) 有调度带宽信用达阈值(d) Dispatched bandwidth credit with scheduling

# 图 10 MAC 子系统 ILA 波形





图 11 错误检测子系统 ILA 波形 Fig. 11 ILA waveform of error detection subsystem

#### 3.1.3 错误恢复子系统验证

如图 12 所示为双层控制策略 ILA 波形图,该 图中处于 ACK 处理态的错误恢复控制结合第二 层控制策略删除相应的数据帧、FCT 控制字和广 播帧。当接收到新的有效 ACK 时,错误恢复控制 待当前 ACK 处理完毕后,重新进入 ACK 处理态 以删除相应的 FCT 控制字。可见,基于完整应答 的双层控制策略可以避免反馈信息的漏应答,及 时删除相应的备份数据。

图 13 为 ILA 抓取的板级验证错误恢复子系



图 12 双层控制策略 ILA 波形 Fig. 12 ILA waveform of double layer control strategy

统波形图,图13(a)为错误注入远端,图13(b)为 近端。图13(a)中,错误注入方发送 NACK 向远 端表明远端最后正确接收的序列号为 E9。 图13(b)中,近端错误检测子系统置位 NACK 接 收有效信号。近端经过错误恢复控制后发出 RETRY 信号,向远端表明即将开始重发操作。通 过图 13(b)可以看到,数据帧生成模块开始使用 来自数据帧错误恢复缓冲区中的备份数据。通过 图 13(a)可知,错误注入远端的错误检测子系统 置位 RETRY 接收有效信号后的一段时间内,接 收序列号开始递增,表明错误恢复过程完成。因 此,错误恢复子系统可保证错误恢复功能。



(b) 近端(b) Near end



#### 3.1.4 系统可靠性验证

节点传输系统的测试通过以下五方面来确保 数据的可靠、有序和无误传输:数据生成器产生的 自测数据包以包为单位进行连续计数;数据生成 器产生的自测数据包存在以包为单位的校验和; 错误检测子系统包含以帧为单位的序列号;错误 检测子系统包含以帧为单位的校验和;错误检测 子系统自动丢弃错误数据。 验证过程中,状态记录器对序列号错误和 循环冗余校验错误分别计数,并分别记录 FULL、FCT、反馈信息、数据帧、广播帧和空闲帧 的序列号和循环冗余校验错误,图14 为状态记 录器中的错误记录 ILA 波形。观察可知:在接 收序列号长时间不断递增的情况下,各错误记 录的计数值均为0,说明该节点系统具有一定的 稳定性。



图 14 错误记录 ILA 波形 Fig. 14 ILA waveform of error record

# 3.2 系统性能验证

为验证系统性能,将本文提出的优化节点系 统与现有设计方案进行对比评估,评估结果如 表1所示。表1中,优化节点系统的工作频率最 高,可达200 MHz,可支持 6.25 Gbit/s 的传输速 率,这主要得益于合理的流水线设计。为比较各 方案在不同器件平台上的性能,表1基于文 献[13]将其他各方案的查找表资源和寄存器资源 进行归一化处理。由表1可知:相比文献[13],文 献[7]的查找表资源归一化比例为0.56,但寄存 器比例为1.88,说明其查找表资源优势较大,但 寄存器资源显著增加;文献[14]查找表和寄存器 归一化比例分别为1.04 和1.73,说明其查找表 和寄存器资源均有所增加;文献[11]查找表资源 比例为 0.86,寄存器占用资源归一化比例为 0.63,其查找表和寄存器资源占用均降低。相比 文献[13],优化节点系统的查找表资源归一化比 例为 0.59,寄存器资源比例为 1.06,其查找表资 源显著降低,寄存器资源占用相近。表 1 中总存 储器资源分为虚拟通道缓冲区存储和内部存储资 源两类:VC 缓冲区存储为外部设备与节点系统 的数据交换缓存;内部存储资源为节点系统内部 逻辑,与节点系统的设计方案紧密相关。从表 1 中可知,文献[11]中的内部存储资源归一化比例为 0.71,优化节点系统的比例为 0.45。因此,采用优 化技术的节点系统的电路面积同样具有优势。

| Tab. 1 Evaluation of the node with four VCs on hardware |                   |                  |               |                  |                    |                 |                      |                        |                          |
|---------------------------------------------------------|-------------------|------------------|---------------|------------------|--------------------|-----------------|----------------------|------------------------|--------------------------|
| 方法                                                      | 器件                | 最大<br>频率/<br>MHz | Slice<br>LUTs | LUT<br>归一<br>化比例 | Slice<br>Registers | FF<br>归一<br>化比例 | 总 Block<br>RAMs/Kbit | VCs Block<br>RAMs/Kbit | 内部<br>Block<br>RAMs/Kbit |
| 文献[7]                                                   | Microsemi RTG4    | 80               | 3 967         | 0.56             | 7 219              | 1.88            | 440                  |                        |                          |
| 文献[14]                                                  | Xlinx Virtex - 5  | 80               | 5 259         | 1.04             | 5 191              | 1.73            | 288                  |                        |                          |
| 文献[11]                                                  | Xlinx Virtex – 5  | 156              | 4 318         | 0.86             | 1 892              | 0.63            | 396                  | 36                     | 360                      |
|                                                         | Microsemi RTG4    | 80               | 7 073         | 1.00             | 3 835              | 1.00            | 188                  | 72                     | 116                      |
| 文献[13]                                                  | Xlinx Virtex - 5  | 80               | 5 037         | 1.00             | 3 003              | 1.00            | 576                  | 72                     | 504                      |
|                                                         | Xlinx Zynq – 7000 | 80               | 4 110         | 1.00             | 3 203              | 1.00            | 432                  | 72                     | 360                      |
| 优化节点                                                    | Xlinx Zynq - 7000 | 200              | 2 431         | 0.59             | 3 386              | 1.06            | 198                  | 36                     | 162                      |

表 1 四虚拟通道节点硬件实现评估

# 4 结论

面向空间应用的 SpaceFibre 技术具有超高 速、高可靠和低面积的传输需求,为此本文提出了 一种采用优化技术的自主化 SpaceFibre 节点传输 系统,该系统中的关键优化子系统为介质访问控 制子系统、错误检测子系统和错误恢复子系统。 介质访问控制子系统采用增量化计算简化了计算 逻辑,通过帧累计方法进一步优化了电路面积。 错误检测子系统使用流水线技术,提高了系统的 运行频率;循环冗余校验模块的重复利用,减少了 系统的硬件资源消耗。错误恢复子系统通过基于 完整应答的双层控制策略提升了系统的可靠性, 且简化了控制逻辑的复杂度;轻量化的存储架构 和控制状态机实现了确认重传算法的简化。经板 级验证,本系统符合协议规范且具有一定的稳定 性,与相同平台的同类设计方案相比,最大时钟频 率提高 1.5 倍,查找表资源占用率下降 40.9%, 存储资源占用下降 54.2%,寄存器资源相近。

# 参考文献(References)

- DONCKELS J R, LOVELLY T M, MEE J K. Comparing data processing and transmission scenarios for spacecraft [C]// Proceedings of the IEEE Space Computing Conference (SCC), 2021: 95 – 99.
- [2] 吕良庆,安军社. 1553B 总线即插即用解决方案[J]. 国防科技大学学报, 2019, 41(2):82-90.
  LYULQ, ANJS. Plug and play resolution on 1553B data bus [J]. Journal of National University of Defense Technology, 2019, 41(2):82-90. (in Chinese)
- [3] 李国军,苏晨光,李志刚,等.一种改进的星载 CAN 总线时间同步方法[J].西北工业大学学报,2020,38(增刊1):102-106.
  LIGJ,SUCG,LIZG, et al. An improved time synchronization method for spaceborne CAN bus[J]. Journal of Northwestern Polytechnical University, 2020, 38 (Suppl 1):102-106. (in Chinese)
- [4] 姜宏,杨孟飞,刘波,等.高速 SpaceWire 协议 IP 的可靠 性增强方法[J]. 宇航学报, 2019, 40(9): 1071-1079.

JIANG H, YANG M F, LIU B, et al. Dependability enhancement method for high-speed SpaceWire protocol IP[J]. Journal of Astronautics, 2019, 40(9): 1071 - 1079. (in Chinese)

- [5] ECSS. Space engineering: SpaceFibre, very high-speed serial link: ECSS-E-ST-50-11C [S]. Noordwijk: ESAESTEC Requirements & Standards Division, 2019.
- [6] PARKES S, MCCLEMENTS C, McLAREN D, et al. SpaceWire and SpaceFibre on the Microsemi RTG4 FPGA[C]//Proceedings of the IEEE Aerospace Conference, 2016: 1-8.
- [7] PARKES S, MCCLEMENTS C, MCLAREN D, et al. SpaceFibre networks: SpaceFibre, long paper [C]//Proceedings of the International SpaceWire Conference, 2016: 1-6.
- [8] FLORIT A F, VILLAFRANCA A G, PARKES S, et al. SpaceFibre interface and routing switch IP cores [C]// Proceedings of International SpaceWire Conference, 2018.
- [9] VILLAFRANCA A G, FERRER A, McLAREN D, et al. VHiSSI: experimental SpaceFibre ASIC[C]//Proceedings of Data Systems In Aerospace Conference, 2015.
- [10] JUNGEWELTER D, COZZI D, KLEIBRINK D, et al. AXI-based SpaceFibre IP core implementation [C]//Proceedings of the International SpaceWire Conference (SpaceWire), 2014: 1-6.
- [11] SIEGLE F, HABINC S, BOTH J. SpaceFibre Port IP Core (GRSPFI): SpaceFibre, poster paper [C]//Proceedings of the International SpaceWire Conference (SpaceWire), 2016:

1 - 5.

- [12] DINELLI G, NANNIPIERI P, DAVALLE D, et al. Design of a reduced SpaceFibre interface: an enabling technology for low-cost spacecraft high-speed data-handling[J]. Aerospace, 2019, 6(9): 101.
- [13] NANNIPIERI P, DINELLI G, MARINO A, et al. A serial high-speed satellite communication CODEC: design and implementation of a SpaceFibre interface [J]. Acta Astronautica, 2020, 169: 206-215.
- [14] 祝平,朱岩,安军社,等. 高速 SpaceFibre 总线节点的系统设计[J]. 国防科技大学学报,2021,43(5): 117-126.
  ZHU P, ZHU Y, AN J S, et al. System design of high-speed SpaceFibre node [J]. Journal of National University of Defense Technology, 2021,43(5):117-126. (in Chinese)
- [15] 姚睿,王梅群,吴军,等.使用 FPGA 设计高可靠 SpaceWire 路由器[J].国防科技大学学报,2019,41(4): 86-93.
  YAOR, WANG MQ, WUJ, et al. Design of highly reliable

SpaceWire routers based on FPGA [J]. Journal of National University of Defense Technology, 2019, 41(4): 86 – 93. (in Chinese)

[16] DINELLI G, NANNIPIERI P, MARINO A, et al. The very high-speed SpaceFibre multi-lane CoDec: implementation and experimental performance evaluation [J]. Acta Astronautica, 2021, 179: 462 - 470.

(编辑: 熊立桃, 杨琴)