导弹三回路自动驾驶仪的最优控制设计方法

徐婉莹; 郑永斌; 白圣建; 张巍; XU Wanying; ZHENG Yongbin; BAI Shengjian; ZHANG Wei

导弹三回路自动驾驶仪的最优控制设计方法

doi: 10.11887/j.cn.202406021

徐婉莹¹ ，郑永斌¹ ，白圣建¹ ，张巍²

1. 国防科技大学智能科学学院, 湖南长沙 410073

2. 军事科学院国防科技创新研究院，北京 100071

基金项目: 国家自然科学基金资助项目（62273353）

详细信息

作者简介

徐婉莹（1981—），女，河南偃师人，副教授，博士，E-mail: wy.xu@163.com

中图分类号: TJ41

文献标识码: A

文章编号: 1001-2486(2024)06-194-09

Optimal control design method for missile three-loop autopilot

XU Wanying¹ ， ZHENG Yongbin¹ ， BAI Shengjian¹ ， ZHANG Wei²

1. College of Intelligence Science and Technology, National University of Defense Technology, Changsha 410073 , China

2. National Innovation Institute of Defense Technology, Academy of Military Sciences, Beijing 100071 , Chin

摘要

为优化自动驾驶仪设计过程，寻找最优设计参数，提出了一种基于最优控制的三回路自动驾驶仪设计方法。通过设计最优控制问题的代价函数生成三回路驾驶仪拓扑结构，并通过求解最优控制问题同时得到三回路自动驾驶仪的多个设计参数，进一步研究分析了代价函数中惩罚权重对驾驶仪性能指标的影响。实验结果表明，与传统设计方法相比，通过最优控制方法设计的三回路自动驾驶仪性能更优，且对于模型不确定性误差和系统未建模动态等具有较好的鲁棒性。

关键词

自动驾驶仪 / 经典三回路 / 最优控制器 / 鲁棒性

Abstract

To optimize the design process of an autopilot and find the optimal design parameters, a new design method based on optimal control for a three-loop autopilot was proposed. It generates a three-loop autopilot topology by designing the cost function of the optimal control problem, and obtains multiple parameters of the three-loop autopilot by solving the optimal control problem. The impact of penalty weights in the cost function on the performance indicators of the autopilot was further studied and analyzed. Experimental results show that the three-loop autopilot designed by optimal control method has better performance compared with traditional design methods. And it also has good robustness against model-parameter uncertainties and unmodeled high-frequency dynamics of the system.

Keywords

autopilot / classic three-loop / optimal controller / robustness

1 导弹纵向动力学方程 2 基于LQR最优控制器的自动驾驶仪设计 2.1 LQR最优控制理论 2.2 状态变换 2.3 整定问题求解 2.4 跟踪问题求解 2.5 最优控制器结构 3 权重系数的选择与系统性能指标 4 仿真结果对比与分析 4.1 与传统设计方法的对比验证 4.2 LQR最优控制器的鲁棒性验证 5 结论

经典三回路自动驾驶仪拓扑结构自美国雷神公司在麻雀导弹上首次应用以来，目前已在全球范围内得到广泛应用，成为各类导弹武器设计的首选^[1]。三回路过载型自动驾驶仪以期望的纵向加速度作为指令，以测量的加速度和角速度作为反馈量，该控制结构不仅有利于实现导弹的精确命中，而且在针对众多拓扑结构的评测中具有最好的鲁棒性和快速性^[2-4]。因此，针对经典三回路自动驾驶仪的研究和应用有很多^[5-7]。

导弹自动驾驶仪设计的一般方法是这样的：在特定点上离散化飞行包络线，在不同的气动点上设计自动驾驶仪，通过设计大的单回路稳定裕度并进行仿真评估来保证系统对参数变化的鲁棒性。一般来说，使用传统方法设计自动驾驶仪涉及重复的单回路设计分析，这在时间和人力上代价都很昂贵；并且考虑到模型的不准确，经典方法在评估系统的稳定性和鲁棒性时具有很强的误导性^[8]。因此，随着现代控制技术的发展，有文献提出了基于自抗扰理论的方法^[9-10]、基于微分对策的方法^[11]、基于深度强化学习的参数整定方法^[12-14]，以及基于粒子群算法和非线性模型预测控制的方法^[15-16]、基于滑模控制的方法和基于H-∞的方法^[17-20]等。

当前和未来出现的许多复杂飞行控制问题需要使用优化设计的多输入/多输出（multiple-input multiple-output，MIMO）数字控制系统，对飞控系统的稳定性和鲁棒性也提出了更高的要求。这使得采用最优控制理论设计自动驾驶仪成为一条重要的路径。然而，这些技术在导弹设计中的实际应用受到了限制。其中一个主要的问题是，使用二次性能指标的最优控制器是在时域内的优化设计，如何将自动驾驶仪的频域性能指标和稳定性要求转化为时域要求，并确定最优二次型的性能指标惩罚函数，使用优化性能指标来满足诸如带宽、噪声灵敏度等频域要求，同时满足对模型参数不确定性和未建模高频动态的鲁棒性，都是需要解决的重要问题。

针对上述问题，本文从最优控制的角度设计线性二次调节器（linear quadratic regulator，LQR）控制器，通过设计性能指标惩罚函数得到三回路自动驾驶仪拓扑结构，研究了惩罚权重与系统性能指标的关系，并通过设计实例与传统方法设计的经典三回路自动驾驶仪进行了比较，最后考察了该设计方法对模型不确定性误差和系统未建模动态的鲁棒性。

1 导弹纵向动力学方程

导弹纵向动力学可以用纵向姿态运动的扰动运动方程描述，即^[21]：

\{\begin{matrix} \ddot{ϑ} + a_{1} \dot{ϑ} + a_{2} α + a_{3} δ_{p} = 0 \\ \dot{α} = \dot{ϑ} - a_{4} α - a_{5} δ_{p} \end{matrix}

(1)

取状态变量为

x = [\begin{matrix} α \\ \dot{ϑ} \end{matrix}]

，令

u = δ_{p} ， y = [\begin{matrix} a_{y m} \\ \dot{ϑ} \end{matrix}]

，则上式可以写成矩阵形式的状态方程：

\{\begin{matrix} \dot{x} = A x + B u \\ y = C x + D u \end{matrix}

(2)

其中，α和

\dot{ϑ}

分别为攻角和俯仰角速率，δ_p为俯仰通道舵偏角，a_ym为俯仰方向体系过载的测量值。则有

A = [\begin{matrix} - a_{4} & 1 \\ - a_{2} & - a_{1} \end{matrix}] ， B = [\begin{matrix} - a_{5} \\ - a_{3} \end{matrix}] ， C = [\begin{matrix} a_{4} \cdot V / g & 0 \\ 0 & 1 \end{matrix}] ， D = [\begin{matrix} a_{5} \cdot V / g \\ 0 \end{matrix}]

。

可以看出，弹体的模型主要取决于动力学系数a₁、a₂、a₃、a₄、a₅，它们是由理论弹道确定的随飞行状态变化的参数，其中：

a_{1} = - \frac{m_{z}^{{\bar{ω}}_{z}} q S L}{J_{z}} \cdot \frac{L}{V} ， a_{2} = - \frac{m_{z}^{α} q S L}{J_{z}} ， a_{3} = - \frac{m_{z}^{δ_{P}} q S L}{J_{z}} ， a_{4} = \frac{C_{y}^{α} q S}{m V} ， a_{5} = \frac{C_{y}^{δ_{P}} q S}{m V}

。

本文分析单次飞行条件：导弹速度V=200 m/s，高度h=3 000 m，攻角α=6°，在此条件下各参数定义和取值如表1所示。

表1变量描述及取值

Tab.1 Description and value of the variables

2 基于LQR最优控制器的自动驾驶仪设计

2.1 LQR最优控制理论

为了将导弹纵向自动驾驶仪的设计表述为LQR最优控制问题，首先考虑单输入单输出系统LQR最优控制问题的标准形式。

对于系统

\{\begin{matrix} \dot{x} = A x + B u \\ z = H x \end{matrix}

(3)

定义综合性能指标为

\underset{u}{m i n} J = \int_{0}^{\infty} (Q z^{2} + R u^{2}) d t

(4)

其中，（A，B）能稳，（H，A）能检，Q≥0，R＞0。则最优反馈状态信号为

u = K x

(5)

其中

K = - R^{- 1} B^{T} P

P是满足如下代数黎卡提方程的正半定稳定解：

A^{T} P + P A - P B R^{- 1} B^{T} P + H^{T} Q H = 0

(6)

2.2 状态变换

对于式（2）表示的过载型自动驾驶仪状态方程，由于矩阵D不为0，即在优化的性能指标中含有馈通项，不能直接应用上述线性二次调节器理论，将输出反馈问题转换为状态反馈问题，因此需要引入新的状态变量进行变换。

这里，取控制量δ_p作为一个新的状态，并增加控制速率作为系统输入，给原系统增加一个额外的微分方程：

{\dot{δ}}_{p} = u_{1}

(7)

可以构造一个新的系统：

\{\begin{matrix} {\dot{x}}_{1} = A_{1} x_{1} + B_{1} u_{1} \\ y_{1} = C_{1} x_{1} + D_{1} u_{1} \\ z_{1} = H_{1} x_{1} + L_{1} u_{1} \end{matrix}

(8)

其中，

x_{1} = [\begin{matrix} α \\ \dot{ϑ} \\ δ_{p} \end{matrix}] ， u_{1} = {\dot{δ}}_{P} ， y_{1} = [\begin{matrix} a_{y m} \\ {\dot{ϑ}}_{m} \\ \ddot{ϑ_{m}} \end{matrix}] ， z_{1} = a_{y m} ， a_{y m}

为加速度计测量的体系纵向过载，K_ss是为了确保系统阶跃响应稳态误差为0而引入的指令放大倍数。

从而：

A_{1} = [\begin{matrix} A B \\ 0 0 \end{matrix}] ， B_{1} = [\begin{matrix} 0 \\ 1 \end{matrix}] ， C_{1} = [\begin{matrix} C & D \\ A （ 2 ， : ） & B （ 2 ， : ） \end{matrix}] ， D_{1} = [\begin{matrix} 0 \\ 0 \end{matrix}] ， H_{1} = C_{1} （ 1 ， : ） ， L_{1} = [0]

。

此时D₁为零矩阵。由于系统是严格适定的，C₁为非奇异矩阵，此时可以引入状态变换x₂=C₁x₁=y₁，将系统状态方程（8）转换为：

\{\begin{matrix} {\dot{x}}_{2} = A_{2} x_{2} + B_{2} u_{2} \\ y_{2} = x_{2} \\ z_{2} = H_{2} x_{2} \end{matrix}

(9)

其中，

x_{2} = [\begin{matrix} a_{y m} \\ {\dot{ϑ}}_{m} \\ {\ddot{ϑ}}_{m} \end{matrix}] ， u_{2} = {\dot{δ}}_{p} ， y_{2} = [\begin{matrix} a_{y m} \\ {\dot{ϑ}}_{m} \\ \ddot{ϑ_{m}} \end{matrix}] ， z_{2} = a_{y m}

，且

A_{2} = C_{1} A_{1} C_{1}^{- 1} ， B_{2} = C_{1} B_{1} ， H_{2} = H_{1} C_{1}^{- 1}

。

2.3 整定问题求解

自动驾驶仪最基本的功能是稳定弹体姿态，同时调节或跟踪指令加速度。因此，本文先从整定问题开始，设置优化指标，寻求“最佳”控制。一个明显的优化目标是使用测量加速度和控制输入的加权和，由于在实际执行中舵的控制速率是有限的，因此惩罚函数中加入对舵控速率的控制是合理的，由此得到性能指标函数如下：

\underset{{\dot{δ}}_{p}}{m i n} J = \int_{0}^{\infty} (Q_{11} a_{y m}^{2} + R_{11} {\dot{δ}}_{p}^{2}) d t

= \int_{0}^{\infty} (Q_{2} z_{2}^{2} + R_{2} u_{2}^{2}) d t

(10)

对于变换后的系统状态方程（9），由2.1节可以推出其最优解为

u = K_{opt} x_{2} = K_{opt} [\begin{matrix} a_{y m} \\ \dot{ϑ} \\ \ddot{ϑ} \end{matrix}]

(11)

式中

\{\begin{matrix} K_{opt} = - R_{2}^{- 1} B_{2}^{T} P \\ A_{2}^{T} P + P A_{2} - P B_{2} R_{2}^{- 1} B_{2}^{T} P + H_{2}^{T} Q_{2} H_{2} = 0 \end{matrix}

(12)

其中，

A_{2} = C_{1} A_{1} C_{1}^{- 1} ， B_{2} = C_{1} B_{1} ， H_{2} = H_{1} C_{1}^{- 1} ， Q_{2} = Q_{11} ， R_{2} = R_{11}

。

2.4 跟踪问题求解

为了实现精确命中，自动驾驶仪的一个重要目标是实现导弹纵向过载对制导指令过载的稳定跟踪，其本质是一个跟踪问题。这里可以将跟踪定义为跟随阶跃信号输入，从而成为一个定点调节器问题。在设计最优性能指标函数时，可以使用实测过载与指令过载之间误差的平方和作为惩罚函数，得到最优控制性能指标函数如下：

\underset{{\dot{δ}}_{p}}{m i n} J = \int_{0}^{\infty} [Q_{11} {(a_{y m} - K_{s s} a_{y c})}^{2} + R_{11} {\dot{δ}}_{p}^{2}] d t

(13)

其中，a_yc为指令过载。

其对应的状态方程相对于模型（8）多了一项，则：

\{\begin{matrix} {\dot{x}}_{1} = A_{1} x_{1} + B_{1} u_{1} \\ y_{1} = C_{1} x_{1} + D_{1} u_{1} - {\tilde{K}}_{s s 1} a_{y c} \\ z_{1} = H_{1} x_{1} + L_{1} u_{1} - K_{s s} a_{y c} = a_{y m} - K_{s s} a_{y c} \end{matrix}

(14)

其中

x_{1} = [\begin{matrix} α \\ \dot{ϑ} \\ δ_{p} \end{matrix}] ， u_{1} = {\dot{δ}}_{p} ， y_{1} = [\begin{matrix} a_{y m} - K_{s s} a_{y c} \\ {\dot{ϑ}}_{m} \\ \ddot{ϑ_{m}} \end{matrix}]

且

{\tilde{K}}_{s s 1} = {[\begin{matrix} K_{s s} 0 0 \end{matrix}]}^{T}

。

性能指标函数式（13）可以变换为：

\underset{{\dot{δ}}_{p}}{m i n} J = \int_{0}^{\infty} [Q_{11} {(a_{y m} - K_{s s} a_{y c})}^{2} + R_{11} {\dot{δ}}_{p}^{2}] d t

= \int_{0}^{\infty} (Q_{1} z_{1}^{2} + R_{1} u_{1}^{2}) d t

(15)

该问题与2.3节的整定问题是等价的，其最优解与整定问题一样^[22]。此时控制输入为

u^{*} = K_{opt} [\begin{matrix} a_{y m} - K_{s s} a_{y c} \\ \dot{ϑ} \\ \ddot{ϑ} \end{matrix}] = {\dot{δ}}_{p}

(16)

其中计算K_opt的方法与2.3节相同。

接下来计算系数K_ss。根据开环系统状态方程（9），可以将闭环系统状态方程写为

\{\begin{matrix} {\dot{x}}_{c} = A_{c} x_{c} + B_{c} a_{y c} \\ a_{y m} = C_{c} x_{c} \end{matrix}

(17)

其中

A_{c} = A_{2} + B_{2} K_{o p t} = C_{1} A_{1} C_{1}^{- 1} + C_{1} B_{1} K_{o p t}

B_{c} = - B_{2} K_{o p t} [\begin{matrix} K_{s s} \\ 0 \\ 0 \end{matrix}] = - B_{c}^{'} K_{s s}

C_{c} = H_{2} = H_{1} C_{1}^{- 1}

B_{c}^{'} = B_{2} K_{o p t} [\begin{matrix} 1 \\ 0 \\ 0 \end{matrix}] = C_{1} B_{1} K_{o p t} [\begin{matrix} 1 \\ 0 \\ 0 \end{matrix}]

为了保证闭环系统稳态误差为零，有

\underset{s \to 0}{l i m} \frac{a_{y m}}{a_{y c}} = 1 = - C_{c} A_{c}^{- 1} B_{c} = [C_{c} A_{c}^{- 1} B_{c}^{'}] K_{s s}

(18)

因此

K_{s s} = {[C_{c} A_{c}^{- 1} B_{c}^{'}]}^{- 1}

。

2.5 最优控制器结构

根据以上推导，只需选定最优性能指标函数式（13）中的权重Q₁₁和R₁₁，即可求得最优控制器的反馈系数K_opt，得到最优控制输入如式（16）所示。应注意到K_opt是一个1×3维的向量，将其记为

K_{o p t} = [\begin{matrix} K_{a y} K_{ϑ} K_{\dot{ϑ}} \end{matrix}]

。

再注意到输入为u=

{\dot{δ}}_{p}

，将式（16）两边积分可得：

δ_{p} = K_{o p t} [\begin{matrix} \int (a_{y m} - K_{s s} a_{y c}) d t \\ \int \dot{ϑ} d t \\ \int \ddot{ϑ} d t \end{matrix}]

= [\begin{matrix} K_{a y} K_{ϑ} K_{\dot{ϑ}} \end{matrix}] [\begin{matrix} \int (a_{y m} - K_{s s} a_{y c}) d t \\ \int \dot{ϑ} d t \\ \dot{ϑ} \end{matrix}]

= K_{a y} \int (a_{y m} - K_{s s} a_{y c}) d t + K_{ϑ} \int \dot{ϑ} d t + K_{\dot{ϑ}} \dot{ϑ}

(19)

由此可以绘出最优控制器结构如图1所示。该控制结构正好与经典三回路自动驾驶仪^[23]结构相同。实际上也是从最优控制的角度验证了经典三回路自动驾驶仪的优越性。

图1LQR最优控制器结构

Fig.1Structure of LQR optimal controller

3 权重系数的选择与系统性能指标

性能指标函数中权重系数Q₁₁和R₁₁的选择对最优控制的结果有非常重要的影响，其中Q₁₁代表了对跟踪误差的约束，取值越大，系统的跟踪误差收敛越快；系数R₁₁代表了对输入控制速率的约束，系数越大，系统所需控制速率越小。两个系数的比值反映了系统性能与能量消耗之间的相对重要程度。实际上，比值相同则得到的最优解是相同的。因此，不妨令R₁₁=1.0，考察Q₁₁变化对系统性能的影响。

在第1节所述的飞行条件和参数取值下，令R₁₁=1.0，计算Q₁₁不同取值情况下的最优解。并在不考虑舵机动力学以及陀螺与加速度计模型的情况下，考察理想系统在不同参数下的各项性能指标，结果如表2所示，开环频率响应曲线和闭环阶跃响应曲线分别如图2和图3所示。

从结果可以看出，当Q₁₁的取值增大时，系统上升时间减小，超调量增加，相角裕度下降，开环截止频率增加。也即随着系数的增大，系统响应速度加快，但稳定性逐渐降低。虽然系统的相位裕度都能保持在69°以上，但这是在未考虑舵机动力学和陀螺与加速度计模型的情况下得到的。在实际情况中，随着更多未建模设备动态的加入，会“吃掉”更多的稳定裕度，也即稳定性下降。文献^[24]研究指出，基于低阶系统设计的控制器会由于未建模设备动态的加入而变得不稳定，因此必须通过控制性能指标系数，降低开环增益，限制开环截止频率，从而使得设计的控制器可以用于控制更高阶的系统对象。

表2不同Q₁₁取值下的系统性能指标

Tab.2 System performance index under different values of Q₁₁

图2不同参数取值下的开环频率响应曲线

Fig.2Open loop frequency response curves with different parameter values

图3不同参数取值下的闭环阶跃响应曲线

Fig.3Closed-loop step response curves with different parameter values

基于以上分析，为保证系统较好的快速性，同时具有良好的稳定性和鲁棒性，取Q₁₁在2.0~5.0之间，可以取得较好的综合性能。

4 仿真结果对比与分析

为验证本文设计的LQR最优控制器的性能，首先将该控制器与采用传统方法设计的经典三回路自动驾驶仪性能进行对比，验证该方法的优越性，然后在系统中加入模型误差、舵机等执行机构的未建模动态误差等，以验证LQR控制器的鲁棒性。

4.1 与传统设计方法的对比验证

采用文献^[23]中的经典三回路自动驾驶仪结构，如图4所示，以及文献^[5]中的经典设计方法。仍然在第1节所述飞行条件下进行设计，其中系数K_g=0.206 7、ω_i=0.240 0、K_A=3.553 3、K_dc=1.000 3，该设计参数经过数学仿真和半实物仿真验证是可行的。

图4经典三回路自动驾驶仪结构

Fig.4Classic three-loop autopilot topology

将该设计结果与Q₁₁=2.0时的最优控制设计结果进行对比，结果见表3、图5、图6。从结果可以看出，与传统设计方法相比，LQR最优控制器的上升时间更短，截止频率更高，说明该控制器的响应速度更快，而且相比于传统方法，该方法阶跃响应的稳态误差更小，稳定裕度更高，体现了该方法作为“最优”控制器的优越性。

表3LQR控制器与传统控制器性能指标对比

Tab.3 Comparison of performance indicators between LQR controller and traditional controller

4.2 LQR最优控制器的鲁棒性验证

自动驾驶仪的鲁棒性主要体现在对模型参数不确定性和未建模高频动态的鲁棒性。本节考察加入气动数据拉偏等模型误差和舵机等执行机构的未建模动态后，采用LQR最优控制器的自动驾驶仪的鲁棒性能，并与传统设计方法进行了比较。

图5与传统设计方法的Bode图对比

Fig.5Bode diagrams compared with traditional method

图6与传统设计方法的阶跃响应曲线对比

Fig.6Step response curves compared with traditional design method

在模型中加入表4所示的两种情况下的气动拉偏，并采用如下二阶传递函数来近似控制执行机构（control actuation system，CAS）即舵机的模型：

G_{C A S} (s) = \frac{1}{1 + \frac{2 ζ_{A}}{ω_{A}} s + \frac{s^{2}}{ω_{A}^{2}}}

(20)

其中，ζ_A=0.614 3，ω_A=65.115 3 rad/s。

表4气动参数拉偏情况

Tab.4 Variation of aerodynamic parameters

加入以上模型不确定性误差和系统未建模误差后，考察系统的稳定性和瞬态性能指标，结果如表5~6和图7~8所示。

表5LQR控制器对模型不确定性和未建模动态的鲁棒性

Tab.5 Robustness analysis of LQR controller to model uncertainty and unmodeled dynamics

表6传统控制器对模型不确定性和未建模动态的鲁棒性

Tab.6 Robustness analysis of traditional controller to model uncertainty and unmodeled dynamics

从结果可以看出，当模型存在偏差时，对系统的稳定性和瞬态性能有较大的影响，且对于LQR最优控制器和传统控制器都有相同的趋势，即：当气动系数向上拉偏时，系统响应速度加快，上升时间减少，但是稳定裕度有所下降；当系数向下拉偏时，系统响应速度变慢，上升时间增加，而稳定裕度也增加了；加入控制执行机构舵机模型后，也会使系统稳定裕度下降，并且截止频率减小。

图7LQR控制器在不同模型误差情况下的响应

Fig.7Responses of LQR controller for different model errors

图8传统控制器在不同模型误差情况下的响应

Fig.8Responses of traditional controller for different model errors

从结果还可以看出，当系统存在模型偏差，或者加入未建模的动态环节后，LQR最优控制器和传统控制器都能使系统保持稳定，并具有良好的跟踪性能。这是由于这两种控制器都采用了经典的三回路控制结构，而该控制结构对于模型的误差或系统未建模动态具有很好的鲁棒性^[2]。由于最优控制器在参数上的优化，LQR最优控制器在快速性方面更占优势，截止频率更高，上升时间更短。

5 结论

本文基于LQR最优控制理论设计了导弹纵向三回路自动驾驶仪，该自动驾驶仪与经典三回路自动驾驶仪具有相同的结构。通过设计性能指标函数并求解最优控制问题，可以同时得到最优控制器的四个控制参数。仿真结果表明，该控制器对模型不确定性和系统未建模动态具有较好的鲁棒性，并且与传统方法设计的自动驾驶仪相比，具有更优的性能。此外，基于最优控制理论的方法可以很方便地推广到多输入多输出系统，并可用于控制静不稳定的导弹，对于未来先进导弹和飞行器的自动驾驶仪设计具有重要意义。

图1LQR最优控制器结构

Fig.1Structure of LQR optimal controller

下载: 全尺寸图片

图2不同参数取值下的开环频率响应曲线

Fig.2Open loop frequency response curves with different parameter values

下载: 全尺寸图片

图3不同参数取值下的闭环阶跃响应曲线

Fig.3Closed-loop step response curves with different parameter values

下载: 全尺寸图片

图4经典三回路自动驾驶仪结构

Fig.4Classic three-loop autopilot topology

下载: 全尺寸图片

图5与传统设计方法的Bode图对比

Fig.5Bode diagrams compared with traditional method

下载: 全尺寸图片

图6与传统设计方法的阶跃响应曲线对比

Fig.6Step response curves compared with traditional design method

下载: 全尺寸图片

图7LQR控制器在不同模型误差情况下的响应

Fig.7Responses of LQR controller for different model errors

下载: 全尺寸图片

图8传统控制器在不同模型误差情况下的响应

Fig.8Responses of traditional controller for different model errors

下载: 全尺寸图片

表1变量描述及取值

下载: 全尺寸图片

表2不同Q₁₁取值下的系统性能指标

下载: 全尺寸图片

表3LQR控制器与传统控制器性能指标对比

下载: 全尺寸图片

表4气动参数拉偏情况

下载: 全尺寸图片

表5LQR控制器对模型不确定性和未建模动态的鲁棒性

下载: 全尺寸图片

表6传统控制器对模型不确定性和未建模动态的鲁棒性

下载: 全尺寸图片

图1LQR最优控制器结构

Fig.1Structure of LQR optimal controller

图2不同参数取值下的开环频率响应曲线

Fig.2Open loop frequency response curves with different parameter values

图3不同参数取值下的闭环阶跃响应曲线

Fig.3Closed-loop step response curves with different parameter values

图4经典三回路自动驾驶仪结构

Fig.4Classic three-loop autopilot topology

图5与传统设计方法的Bode图对比

Fig.5Bode diagrams compared with traditional method

图6与传统设计方法的阶跃响应曲线对比

Fig.6Step response curves compared with traditional design method

图7LQR控制器在不同模型误差情况下的响应

Fig.7Responses of LQR controller for different model errors

图8传统控制器在不同模型误差情况下的响应

Fig.8Responses of traditional controller for different model errors

表1变量描述及取值

表2不同Q₁₁取值下的系统性能指标

表3LQR控制器与传统控制器性能指标对比

表4气动参数拉偏情况

表5LQR控制器对模型不确定性和未建模动态的鲁棒性

表6传统控制器对模型不确定性和未建模动态的鲁棒性

图1LQR最优控制器结构

Fig.1Structure of LQR optimal controller

图2不同参数取值下的开环频率响应曲线

Fig.2Open loop frequency response curves with different parameter values

图3不同参数取值下的闭环阶跃响应曲线

Fig.3Closed-loop step response curves with different parameter values

图4经典三回路自动驾驶仪结构

Fig.4Classic three-loop autopilot topology

图5与传统设计方法的Bode图对比

Fig.5Bode diagrams compared with traditional method

图6与传统设计方法的阶跃响应曲线对比

Fig.6Step response curves compared with traditional design method

图7LQR控制器在不同模型误差情况下的响应

Fig.7Responses of LQR controller for different model errors

图8传统控制器在不同模型误差情况下的响应

Fig.8Responses of traditional controller for different model errors

表1变量描述及取值

表2不同Q₁₁取值下的系统性能指标

表3LQR控制器与传统控制器性能指标对比

表4气动参数拉偏情况

表5LQR控制器对模型不确定性和未建模动态的鲁棒性

表6传统控制器对模型不确定性和未建模动态的鲁棒性

LIN D F. Tactical missile guidance and control system design[M]. Beijing: Beijing Institute of Technology Press,2020.(in Chinese)

MRACEK C, RIDGELY D. Missile longitudinal autopilots:comparison of multiple three loop topologies[C]//Proceedings of the AIAA Guidance, Navigation,and Control Conference and Exhibit,2005.

WANG J, LIN D F, LI Q Y. Stability analysis of tactical missile autopilots based on vector margin[J]. Journal of Beijing Institute of Technology,2014,23(3):292-298.

MOHAMED E M, YAN L. Design and comparison of two-loop with PI and three-loop autopilot for static unstable missile[J]. International Journal of Computer and Electrical Engineering,2016,8(1):1-11.

周春成. 三回路自动驾驶仪结构分析与设计[J]. 工业控制计算机,2017,30(3):60-62,65. ZHOU C C. Structure analysis and design of three-loop autopilot[J]. Industrial Control Computer,2017,30(3):60-62,65.(in Chinese)

杨育荣, 李友年, 王建琦, 等. 三回路自动驾驶仪频域设计法[J]. 航空兵器,2010(6):33-36. YANG Y R, LI Y N, WANG J Q,et al. Frequency domain design of three-loop autopilot[J]. Aero Weaponry,2010(6):33-36.(in Chinese)

孙明玮, 张利民, 陈增强. 导弹三回路过载驾驶仪设计频带的灵敏度分析方法[J]. 兵工学报,2014,35(12):2023-2029. SUN M W, ZHANG L M, CHEN Z Q. Sensitivity analysis of design bandwidth of missile three-loop acceleration control[J]. Acta Armamentarii,2014,35(12):2023-2029.(in Chinese)

WISE K A. Bank-to-turn missile autopilot design using loop transfer recovery[J]. Journal of Guidance, Control,and Dynamics,1990,13(1):145-152.

杨登峰, 钟扬威, 吴翔, 等. 一种线性自抗扰三回路姿态驾驶仪设计方法研究[J]. 战术导弹技术,2022(3):66-72,106. YANG D F, ZHONG Y W, WU X,et al. Study on a design method of linear active disturbance rejection three-loop attitude pilot[J]. Tactical Missile Technology,2022(3):66-72,106.(in Chinese)

孙明玮, 徐琦, 陈增强, 等. 自抗扰三回路过载驾驶仪的设计[J]. 北京理工大学学报,2015,35(6):592-596. SUN M W, XU Q, CHEN Z Q,et al. Active disturbance rejection three-loop acceleration autopilot design[J]. Transactions of Beijing Institute of Technology,2015,35(6):592-596.(in Chinese)

陈必露, 刘春生, 袁斐然. 基于微分对策的鲁棒导弹自动驾驶仪设计[J]. 电光与控制,2022,29(1):70-74,104. CHEN B L, LIU C S, YUAN F R. Robust missile autopilot design based on differential game[J]. Electronics Optics & Control,2022,29(1):70-74,104.(in Chinese)

万齐天, 卢宝刚, 赵雅心, 等. 基于深度强化学习的驾驶仪参数快速整定方法[J]. 系统工程与电子技术,2022,44(10):3190-3199. WAN Q T, LU B G, ZHAO Y X,et al. Autopilot parameter rapid tuning method based on deep reinforcement learning[J]. Systems Engineering and Electronics,2022,44(10):3190-3199.(in Chinese)

ELKINS J G, SOOD R, RUMPF C. Bridging reinforcement learning and online learning for spacecraft attitude control[J]. Journal of Aerospace Information Systems,2022,19(1):62-69.

CANDELI A, DE TOMMASI G, LUI D G,et al. A deep deterministic policy gradient learning approach to missile autopilot design[J]. IEEE Access,2022,10:19685-19696.

张田田, 陈志华, 韩磊, 等. 基于粒子群算法的自动驾驶仪参数优化[J]. 兵器装备工程学报,2021,42(7):46-50. ZHANG T T, CHEN Z H, HAN L,et al. Design of two loop autipilot based on partical swarm optimization[J]. Journal of Ordnance Equipment Engineering,2021,42(7):46-50.(in Chinese)

崔家明, 马克茂, 张公平. 基于NMPC的空空导弹自动驾驶仪设计[J]. 航空兵器,2021,28(3):31-37. CUI J M, MA K M, ZHANG G P. NMPC-based autopilot design for air-to-air missiles[J]. Aero Weaponry,2021,28(3):31-37.(in Chinese)

熊佳富, 李君龙, 张锐, 等. 导弹滑模抗干扰自动驾驶仪设计[J]. 宇航学报,2022,43(6):743-750. XIONG J F, LI J L, ZHANG R,et al. Sliding-mode-based anti-disturbance autopilot design for missiles[J]. Journal of Astronautics,2022,43(6):743-750.(in Chinese)

ZHOU J P, LI W, XIA Q L,et al. Robust missile autopilot design based on dynamic surface control[J]. Journal of Systems Engineering and Electronics,2023,34(1):160-171.

D′SOUZA R S, NIELSEN C. Path following control design for a gliding missile[J]. IEEE Transactions on Aerospace and Electronic Systems,2022,58(1):485-495.

XU A R, LIU Y S, HUANG B. Output feedback robust H-infinite autopilot of BTT missile based on linear matrix inequality[C]//Proceedings of 2021 IEEE 5th Advanced Information Technology, Electronic and Automation Control Conference(IAEAC),2021:2011-2016.

黄新生, 徐婉莹, 郑永斌. 导弹制导控制系统设计[M]. 长沙: 国防科技大学出版社,2013. HUANG X S, XU W Y, ZHENG Y B. Missile guidance and control systems design[M]. Changsha: National University of Defense Technology Press,2013.(in Chinese)

MRACEK C, RIDGELY D B. Missile longitudinal autopilots:connections between optimal control and classical topologies[C]//Proceedings of the AIAA Guidance, Navigation,and Control Conference and Exhibit,2005.

祁载康. 战术导弹制导控制系统设计[M]. 北京: 中国宇航出版社,2018. QI Z K. Design of tactical missile guidance and control system[M]. Beijing: China Aerospace Press,2018.(in Chinese)

NESLINE F W, ZARCHAN P. Why modern controllers can go unstable in practice[J]. Journal of Guidance, Control,and Dynamics,1984,7(4):495-500.

首页

期刊介绍

投稿指南

编委会

出版声明

开放获取声明

联系我们

期刊订阅

Rss

AI检索

English

1 导弹纵向动力学方程

2 基于LQR最优控制器的自动驾驶仪设计

3 权重系数的选择与系统性能指标

4 仿真结果对比与分析

5 结论