导弹三回路自动驾驶仪的最优控制设计方法
doi: 10.11887/j.cn.202406021
徐婉莹1 , 郑永斌1 , 白圣建1 , 张巍2
1. 国防科技大学智能科学学院, 湖南 长沙 410073
2. 军事科学院国防科技创新研究院,北京 100071
基金项目: 国家自然科学基金资助项目(62273353)
Optimal control design method for missile three-loop autopilot
XU Wanying1 , ZHENG Yongbin1 , BAI Shengjian1 , ZHANG Wei2
1. College of Intelligence Science and Technology, National University of Defense Technology, Changsha 410073 , China
2. National Innovation Institute of Defense Technology, Academy of Military Sciences, Beijing 100071 , Chin
摘要
为优化自动驾驶仪设计过程,寻找最优设计参数,提出了一种基于最优控制的三回路自动驾驶仪设计方法。通过设计最优控制问题的代价函数生成三回路驾驶仪拓扑结构,并通过求解最优控制问题同时得到三回路自动驾驶仪的多个设计参数,进一步研究分析了代价函数中惩罚权重对驾驶仪性能指标的影响。实验结果表明,与传统设计方法相比,通过最优控制方法设计的三回路自动驾驶仪性能更优,且对于模型不确定性误差和系统未建模动态等具有较好的鲁棒性。
Abstract
To optimize the design process of an autopilot and find the optimal design parameters, a new design method based on optimal control for a three-loop autopilot was proposed. It generates a three-loop autopilot topology by designing the cost function of the optimal control problem, and obtains multiple parameters of the three-loop autopilot by solving the optimal control problem. The impact of penalty weights in the cost function on the performance indicators of the autopilot was further studied and analyzed. Experimental results show that the three-loop autopilot designed by optimal control method has better performance compared with traditional design methods. And it also has good robustness against model-parameter uncertainties and unmodeled high-frequency dynamics of the system.
经典三回路自动驾驶仪拓扑结构自美国雷神公司在麻雀导弹上首次应用以来,目前已在全球范围内得到广泛应用,成为各类导弹武器设计的首选[1]。三回路过载型自动驾驶仪以期望的纵向加速度作为指令,以测量的加速度和角速度作为反馈量,该控制结构不仅有利于实现导弹的精确命中,而且在针对众多拓扑结构的评测中具有最好的鲁棒性和快速性[2-4]。因此,针对经典三回路自动驾驶仪的研究和应用有很多[5-7]
导弹自动驾驶仪设计的一般方法是这样的:在特定点上离散化飞行包络线,在不同的气动点上设计自动驾驶仪,通过设计大的单回路稳定裕度并进行仿真评估来保证系统对参数变化的鲁棒性。一般来说,使用传统方法设计自动驾驶仪涉及重复的单回路设计分析,这在时间和人力上代价都很昂贵;并且考虑到模型的不准确,经典方法在评估系统的稳定性和鲁棒性时具有很强的误导性[8]。因此,随着现代控制技术的发展,有文献提出了基于自抗扰理论的方法[9-10]、基于微分对策的方法[11]、基于深度强化学习的参数整定方法[12-14],以及基于粒子群算法和非线性模型预测控制的方法[15-16]、基于滑模控制的方法和基于H-∞的方法[17-20]等。
当前和未来出现的许多复杂飞行控制问题需要使用优化设计的多输入/多输出(multiple-input multiple-output,MIMO)数字控制系统,对飞控系统的稳定性和鲁棒性也提出了更高的要求。这使得采用最优控制理论设计自动驾驶仪成为一条重要的路径。然而,这些技术在导弹设计中的实际应用受到了限制。其中一个主要的问题是,使用二次性能指标的最优控制器是在时域内的优化设计,如何将自动驾驶仪的频域性能指标和稳定性要求转化为时域要求,并确定最优二次型的性能指标惩罚函数,使用优化性能指标来满足诸如带宽、噪声灵敏度等频域要求,同时满足对模型参数不确定性和未建模高频动态的鲁棒性,都是需要解决的重要问题。
针对上述问题,本文从最优控制的角度设计线性二次调节器(linear quadratic regulator,LQR)控制器,通过设计性能指标惩罚函数得到三回路自动驾驶仪拓扑结构,研究了惩罚权重与系统性能指标的关系,并通过设计实例与传统方法设计的经典三回路自动驾驶仪进行了比较,最后考察了该设计方法对模型不确定性误差和系统未建模动态的鲁棒性。
1 导弹纵向动力学方程
导弹纵向动力学可以用纵向姿态运动的扰动运动方程描述,即[21]
ϑ¨+a1ϑ˙+a2α+a3δp=0α˙=ϑ˙-a4α-a5δp
(1)
取状态变量为x=αϑ˙,令u=δpy=aymϑ˙,则上式可以写成矩阵形式的状态方程:
x˙=Ax+Buy=Cx+Du
(2)
其中,α和ϑ˙ 分别为攻角和俯仰角速率,δp为俯仰通道舵偏角,aym为俯仰方向体系过载的测量值。则有A=-a41-a2-a1B=-a5-a3C=a4V/g001D=a5V/g0
可以看出,弹体的模型主要取决于动力学系数a1a2a3a4a5,它们是由理论弹道确定的随飞行状态变化的参数,其中:a1=-mzω-zqSLJzLVa2=-mzαqSLJza3=-mzδPqSLJza4=CyαqSmVa5=CyδPqSmV
本文分析单次飞行条件:导弹速度V=200 m/s,高度h=3 000 m,攻角α=6°,在此条件下各参数定义和取值如表1所示。
1变量描述及取值
Tab.1 Description and value of the variables
2 基于LQR最优控制器的自动驾驶仪设计
2.1 LQR最优控制理论
为了将导弹纵向自动驾驶仪的设计表述为LQR最优控制问题,首先考虑单输入单输出系统LQR最优控制问题的标准形式。
对于系统
x˙=Ax+Buz=Hx
(3)
定义综合性能指标为
minu J=0 Qz2+Ru2dt
(4)
其中,(A,B)能稳,(H,A)能检,Q≥0,R>0。则最优反馈状态信号为
u=Kx
(5)
其中
K=-R-1BTP
P是满足如下代数黎卡提方程的正半定稳定解:
ATP+PA-PBR-1BTP+HTQH=0
(6)
2.2 状态变换
对于式(2)表示的过载型自动驾驶仪状态方程,由于矩阵D不为0,即在优化的性能指标中含有馈通项,不能直接应用上述线性二次调节器理论,将输出反馈问题转换为状态反馈问题,因此需要引入新的状态变量进行变换。
这里,取控制量δp作为一个新的状态,并增加控制速率作为系统输入,给原系统增加一个额外的微分方程:
δ˙p=u1
(7)
可以构造一个新的系统:
x˙1=A1x1+B1u1y1=C1x1+D1u1z1=H1x1+L1u1
(8)
其中,x1=αϑ˙δpu1=δ˙Py1=aymϑ˙mϑm¨z1=aymaym为加速度计测量的体系纵向过载,Kss是为了确保系统阶跃响应稳态误差为0而引入的指令放大倍数。
从而:A1=A B0 0B1=01C1=CDA2:B2:D1=00H1=C11:L1=[0]
此时D1为零矩阵。由于系统是严格适定的,C1为非奇异矩阵,此时可以引入状态变换x2=C1x1=y1,将系统状态方程(8)转换为:
x˙2=A2x2+B2u2y2=x2z2=H2x2
(9)
其中,x2=aymϑ˙mϑ¨mu2=δ˙py2=aymϑ˙mϑm¨z2=aym,且A2=C1A1C1-1B2=C1B1H2=H1C1-1
2.3 整定问题求解
自动驾驶仪最基本的功能是稳定弹体姿态,同时调节或跟踪指令加速度。因此,本文先从整定问题开始,设置优化指标,寻求“最佳”控制。一个明显的优化目标是使用测量加速度和控制输入的加权和,由于在实际执行中舵的控制速率是有限的,因此惩罚函数中加入对舵控速率的控制是合理的,由此得到性能指标函数如下:
minδ˙p J=0 Q11aym2+R11δ˙p2dt
=0 Q2z22+R2u22dt
(10)
对于变换后的系统状态方程(9),由2.1节可以推出其最优解为
u=Kopt x2=Kopt aymϑ˙ϑ¨
(11)
式中
Kopt =-R2-1B2TPA2TP+PA2-PB2R2-1B2TP+H2TQ2H2=0
(12)
其中,A2=C1A1C1-1B2=C1B1H2=H1C1-1Q2=Q11R2=R11
2.4 跟踪问题求解
为了实现精确命中,自动驾驶仪的一个重要目标是实现导弹纵向过载对制导指令过载的稳定跟踪,其本质是一个跟踪问题。这里可以将跟踪定义为跟随阶跃信号输入,从而成为一个定点调节器问题。在设计最优性能指标函数时,可以使用实测过载与指令过载之间误差的平方和作为惩罚函数,得到最优控制性能指标函数如下:
minδ˙p J=0 Q11aym-Kssayc2+R11δ˙p2dt
(13)
其中,ayc为指令过载。
其对应的状态方程相对于模型(8)多了一项,则:
x˙1=A1x1+B1u1y1=C1x1+D1u1-K~ss1aycz1=H1x1+L1u1-Kssayc=aym-Kssayc
(14)
其中x1=αϑ˙δpu1=δ˙py1=aym-Kssaycϑ˙mϑm¨K~ss1=Kss 0 0T
性能指标函数式(13)可以变换为:
minδ˙p J=0 Q11aym-Kssayc2+R11δ˙p2dt
=0 Q1z12+R1u12dt
(15)
该问题与2.3节的整定问题是等价的,其最优解与整定问题一样[22]。此时控制输入为
u*=Kopt aym-Kssaycϑ˙ϑ¨=δ˙p
(16)
其中计算Kopt的方法与2.3节相同。
接下来计算系数Kss。根据开环系统状态方程(9),可以将闭环系统状态方程写为
x˙c=Acxc+Bcaycaym=Ccxc
(17)
其中
Ac=A2+B2Kopt=C1A1C1-1+C1B1Kopt
Bc=-B2KoptKss00=-Bc'Kss
Cc=H2=H1C1-1
Bc'=B2Kopt100=C1B1Kopt100
为了保证闭环系统稳态误差为零,有
lims0 aymayc=1=-CcAc-1Bc=CcAc-1Bc'Kss
(18)
因此Kss=CcAc-1Bc'-1
2.5 最优控制器结构
根据以上推导,只需选定最优性能指标函数式(13)中的权重Q11R11,即可求得最优控制器的反馈系数Kopt,得到最优控制输入如式(16)所示。应注意到Kopt是一个1×3维的向量,将其记为Kopt=Kay Kϑ Kϑ˙
再注意到输入为u=δ˙p,将式(16)两边积分可得:
δp=Koptaym-Kssaycdtϑ˙dtϑ¨dt
=Kay Kϑ Kϑ˙aym-Kssaycdtϑ˙dtϑ˙
=Kayaym-Kssaycdt+Kϑϑ˙dt+Kϑ˙ϑ˙
(19)
由此可以绘出最优控制器结构如图1所示。该控制结构正好与经典三回路自动驾驶仪[23]结构相同。实际上也是从最优控制的角度验证了经典三回路自动驾驶仪的优越性。
1LQR最优控制器结构
Fig.1Structure of LQR optimal controller
3 权重系数的选择与系统性能指标
性能指标函数中权重系数Q11R11的选择对最优控制的结果有非常重要的影响,其中Q11代表了对跟踪误差的约束,取值越大,系统的跟踪误差收敛越快;系数R11代表了对输入控制速率的约束,系数越大,系统所需控制速率越小。两个系数的比值反映了系统性能与能量消耗之间的相对重要程度。实际上,比值相同则得到的最优解是相同的。因此,不妨令R11=1.0,考察Q11变化对系统性能的影响。
在第1节所述的飞行条件和参数取值下,令R11=1.0,计算Q11不同取值情况下的最优解。并在不考虑舵机动力学以及陀螺与加速度计模型的情况下,考察理想系统在不同参数下的各项性能指标,结果如表2所示,开环频率响应曲线和闭环阶跃响应曲线分别如图2图3所示。
从结果可以看出,当Q11的取值增大时,系统上升时间减小,超调量增加,相角裕度下降,开环截止频率增加。也即随着系数的增大,系统响应速度加快,但稳定性逐渐降低。虽然系统的相位裕度都能保持在69°以上,但这是在未考虑舵机动力学和陀螺与加速度计模型的情况下得到的。在实际情况中,随着更多未建模设备动态的加入,会“吃掉”更多的稳定裕度,也即稳定性下降。文献[24]研究指出,基于低阶系统设计的控制器会由于未建模设备动态的加入而变得不稳定,因此必须通过控制性能指标系数,降低开环增益,限制开环截止频率,从而使得设计的控制器可以用于控制更高阶的系统对象。
2不同Q11取值下的系统性能指标
Tab.2 System performance index under different values of Q11
2不同参数取值下的开环频率响应曲线
Fig.2Open loop frequency response curves with different parameter values
3不同参数取值下的闭环阶跃响应曲线
Fig.3Closed-loop step response curves with different parameter values
基于以上分析,为保证系统较好的快速性,同时具有良好的稳定性和鲁棒性,取Q11在2.0~5.0之间,可以取得较好的综合性能。
4 仿真结果对比与分析
为验证本文设计的LQR最优控制器的性能,首先将该控制器与采用传统方法设计的经典三回路自动驾驶仪性能进行对比,验证该方法的优越性,然后在系统中加入模型误差、舵机等执行机构的未建模动态误差等,以验证LQR控制器的鲁棒性。
4.1 与传统设计方法的对比验证
采用文献[23]中的经典三回路自动驾驶仪结构,如图4所示,以及文献[5]中的经典设计方法。仍然在第1节所述飞行条件下进行设计,其中系数Kg=0.206 7、ωi=0.240 0、KA=3.553 3、Kdc=1.000 3,该设计参数经过数学仿真和半实物仿真验证是可行的。
4经典三回路自动驾驶仪结构
Fig.4Classic three-loop autopilot topology
将该设计结果与Q11=2.0时的最优控制设计结果进行对比,结果见表3图5图6。从结果可以看出,与传统设计方法相比,LQR最优控制器的上升时间更短,截止频率更高,说明该控制器的响应速度更快,而且相比于传统方法,该方法阶跃响应的稳态误差更小,稳定裕度更高,体现了该方法作为“最优”控制器的优越性。
3LQR控制器与传统控制器性能指标对比
Tab.3 Comparison of performance indicators between LQR controller and traditional controller
4.2 LQR最优控制器的鲁棒性验证
自动驾驶仪的鲁棒性主要体现在对模型参数不确定性和未建模高频动态的鲁棒性。本节考察加入气动数据拉偏等模型误差和舵机等执行机构的未建模动态后,采用LQR最优控制器的自动驾驶仪的鲁棒性能,并与传统设计方法进行了比较。
5与传统设计方法的Bode图对比
Fig.5Bode diagrams compared with traditional method
6与传统设计方法的阶跃响应曲线对比
Fig.6Step response curves compared with traditional design method
在模型中加入表4所示的两种情况下的气动拉偏,并采用如下二阶传递函数来近似控制执行机构(control actuation system,CAS)即舵机的模型:
GCAS(s)=11+2ζAωAs+s2ωA2
(20)
其中,ζA=0.614 3,ωA=65.115 3 rad/s。
4气动参数拉偏情况
Tab.4 Variation of aerodynamic parameters
加入以上模型不确定性误差和系统未建模误差后,考察系统的稳定性和瞬态性能指标,结果如表5~6图7~8所示。
5LQR控制器对模型不确定性和未建模动态的鲁棒性
Tab.5 Robustness analysis of LQR controller to model uncertainty and unmodeled dynamics
6传统控制器对模型不确定性和未建模动态的鲁棒性
Tab.6 Robustness analysis of traditional controller to model uncertainty and unmodeled dynamics
从结果可以看出,当模型存在偏差时,对系统的稳定性和瞬态性能有较大的影响,且对于LQR最优控制器和传统控制器都有相同的趋势,即:当气动系数向上拉偏时,系统响应速度加快,上升时间减少,但是稳定裕度有所下降;当系数向下拉偏时,系统响应速度变慢,上升时间增加,而稳定裕度也增加了;加入控制执行机构舵机模型后,也会使系统稳定裕度下降,并且截止频率减小。
7LQR控制器在不同模型误差情况下的响应
Fig.7Responses of LQR controller for different model errors
8传统控制器在不同模型误差情况下的响应
Fig.8Responses of traditional controller for different model errors
从结果还可以看出,当系统存在模型偏差,或者加入未建模的动态环节后,LQR最优控制器和传统控制器都能使系统保持稳定,并具有良好的跟踪性能。这是由于这两种控制器都采用了经典的三回路控制结构,而该控制结构对于模型的误差或系统未建模动态具有很好的鲁棒性[2]。由于最优控制器在参数上的优化,LQR最优控制器在快速性方面更占优势,截止频率更高,上升时间更短。
5 结论
本文基于LQR最优控制理论设计了导弹纵向三回路自动驾驶仪,该自动驾驶仪与经典三回路自动驾驶仪具有相同的结构。通过设计性能指标函数并求解最优控制问题,可以同时得到最优控制器的四个控制参数。仿真结果表明,该控制器对模型不确定性和系统未建模动态具有较好的鲁棒性,并且与传统方法设计的自动驾驶仪相比,具有更优的性能。此外,基于最优控制理论的方法可以很方便地推广到多输入多输出系统,并可用于控制静不稳定的导弹,对于未来先进导弹和飞行器的自动驾驶仪设计具有重要意义。
1LQR最优控制器结构
Fig.1Structure of LQR optimal controller
2不同参数取值下的开环频率响应曲线
Fig.2Open loop frequency response curves with different parameter values
3不同参数取值下的闭环阶跃响应曲线
Fig.3Closed-loop step response curves with different parameter values
4经典三回路自动驾驶仪结构
Fig.4Classic three-loop autopilot topology
5与传统设计方法的Bode图对比
Fig.5Bode diagrams compared with traditional method
6与传统设计方法的阶跃响应曲线对比
Fig.6Step response curves compared with traditional design method
7LQR控制器在不同模型误差情况下的响应
Fig.7Responses of LQR controller for different model errors
8传统控制器在不同模型误差情况下的响应
Fig.8Responses of traditional controller for different model errors
1变量描述及取值
2不同Q11取值下的系统性能指标
3LQR控制器与传统控制器性能指标对比
4气动参数拉偏情况
5LQR控制器对模型不确定性和未建模动态的鲁棒性
6传统控制器对模型不确定性和未建模动态的鲁棒性
LIN D F. Tactical missile guidance and control system design[M]. Beijing: Beijing Institute of Technology Press,2020.(in Chinese)
MRACEK C, RIDGELY D. Missile longitudinal autopilots:comparison of multiple three loop topologies[C]//Proceedings of the AIAA Guidance, Navigation,and Control Conference and Exhibit,2005.
WANG J, LIN D F, LI Q Y. Stability analysis of tactical missile autopilots based on vector margin[J]. Journal of Beijing Institute of Technology,2014,23(3):292-298.
MOHAMED E M, YAN L. Design and comparison of two-loop with PI and three-loop autopilot for static unstable missile[J]. International Journal of Computer and Electrical Engineering,2016,8(1):1-11.
周春成. 三回路自动驾驶仪结构分析与设计[J]. 工业控制计算机,2017,30(3):60-62,65. ZHOU C C. Structure analysis and design of three-loop autopilot[J]. Industrial Control Computer,2017,30(3):60-62,65.(in Chinese)
杨育荣, 李友年, 王建琦, 等. 三回路自动驾驶仪频域设计法[J]. 航空兵器,2010(6):33-36. YANG Y R, LI Y N, WANG J Q,et al. Frequency domain design of three-loop autopilot[J]. Aero Weaponry,2010(6):33-36.(in Chinese)
孙明玮, 张利民, 陈增强. 导弹三回路过载驾驶仪设计频带的灵敏度分析方法[J]. 兵工学报,2014,35(12):2023-2029. SUN M W, ZHANG L M, CHEN Z Q. Sensitivity analysis of design bandwidth of missile three-loop acceleration control[J]. Acta Armamentarii,2014,35(12):2023-2029.(in Chinese)
WISE K A. Bank-to-turn missile autopilot design using loop transfer recovery[J]. Journal of Guidance, Control,and Dynamics,1990,13(1):145-152.
杨登峰, 钟扬威, 吴翔, 等. 一种线性自抗扰三回路姿态驾驶仪设计方法研究[J]. 战术导弹技术,2022(3):66-72,106. YANG D F, ZHONG Y W, WU X,et al. Study on a design method of linear active disturbance rejection three-loop attitude pilot[J]. Tactical Missile Technology,2022(3):66-72,106.(in Chinese)
孙明玮, 徐琦, 陈增强, 等. 自抗扰三回路过载驾驶仪的设计[J]. 北京理工大学学报,2015,35(6):592-596. SUN M W, XU Q, CHEN Z Q,et al. Active disturbance rejection three-loop acceleration autopilot design[J]. Transactions of Beijing Institute of Technology,2015,35(6):592-596.(in Chinese)
陈必露, 刘春生, 袁斐然. 基于微分对策的鲁棒导弹自动驾驶仪设计[J]. 电光与控制,2022,29(1):70-74,104. CHEN B L, LIU C S, YUAN F R. Robust missile autopilot design based on differential game[J]. Electronics Optics & Control,2022,29(1):70-74,104.(in Chinese)
万齐天, 卢宝刚, 赵雅心, 等. 基于深度强化学习的驾驶仪参数快速整定方法[J]. 系统工程与电子技术,2022,44(10):3190-3199. WAN Q T, LU B G, ZHAO Y X,et al. Autopilot parameter rapid tuning method based on deep reinforcement learning[J]. Systems Engineering and Electronics,2022,44(10):3190-3199.(in Chinese)
ELKINS J G, SOOD R, RUMPF C. Bridging reinforcement learning and online learning for spacecraft attitude control[J]. Journal of Aerospace Information Systems,2022,19(1):62-69.
CANDELI A, DE TOMMASI G, LUI D G,et al. A deep deterministic policy gradient learning approach to missile autopilot design[J]. IEEE Access,2022,10:19685-19696.
张田田, 陈志华, 韩磊, 等. 基于粒子群算法的自动驾驶仪参数优化[J]. 兵器装备工程学报,2021,42(7):46-50. ZHANG T T, CHEN Z H, HAN L,et al. Design of two loop autipilot based on partical swarm optimization[J]. Journal of Ordnance Equipment Engineering,2021,42(7):46-50.(in Chinese)
崔家明, 马克茂, 张公平. 基于NMPC的空空导弹自动驾驶仪设计[J]. 航空兵器,2021,28(3):31-37. CUI J M, MA K M, ZHANG G P. NMPC-based autopilot design for air-to-air missiles[J]. Aero Weaponry,2021,28(3):31-37.(in Chinese)
熊佳富, 李君龙, 张锐, 等. 导弹滑模抗干扰自动驾驶仪设计[J]. 宇航学报,2022,43(6):743-750. XIONG J F, LI J L, ZHANG R,et al. Sliding-mode-based anti-disturbance autopilot design for missiles[J]. Journal of Astronautics,2022,43(6):743-750.(in Chinese)
ZHOU J P, LI W, XIA Q L,et al. Robust missile autopilot design based on dynamic surface control[J]. Journal of Systems Engineering and Electronics,2023,34(1):160-171.
D′SOUZA R S, NIELSEN C. Path following control design for a gliding missile[J]. IEEE Transactions on Aerospace and Electronic Systems,2022,58(1):485-495.
XU A R, LIU Y S, HUANG B. Output feedback robust H-infinite autopilot of BTT missile based on linear matrix inequality[C]//Proceedings of 2021 IEEE 5th Advanced Information Technology, Electronic and Automation Control Conference(IAEAC),2021:2011-2016.
黄新生, 徐婉莹, 郑永斌. 导弹制导控制系统设计[M]. 长沙: 国防科技大学出版社,2013. HUANG X S, XU W Y, ZHENG Y B. Missile guidance and control systems design[M]. Changsha: National University of Defense Technology Press,2013.(in Chinese)
MRACEK C, RIDGELY D B. Missile longitudinal autopilots:connections between optimal control and classical topologies[C]//Proceedings of the AIAA Guidance, Navigation,and Control Conference and Exhibit,2005.
祁载康. 战术导弹制导控制系统设计[M]. 北京: 中国宇航出版社,2018. QI Z K. Design of tactical missile guidance and control system[M]. Beijing: China Aerospace Press,2018.(in Chinese)
NESLINE F W, ZARCHAN P. Why modern controllers can go unstable in practice[J]. Journal of Guidance, Control,and Dynamics,1984,7(4):495-500.