摘要
为优化自动驾驶仪设计过程,寻找最优设计参数,提出了一种基于最优控制的三回路自动驾驶仪设计方法。通过设计最优控制问题的代价函数生成三回路驾驶仪拓扑结构,并通过求解最优控制问题同时得到三回路自动驾驶仪的多个设计参数,进一步研究分析了代价函数中惩罚权重对驾驶仪性能指标的影响。实验结果表明,与传统设计方法相比,通过最优控制方法设计的三回路自动驾驶仪性能更优,且对于模型不确定性误差和系统未建模动态等具有较好的鲁棒性。
Abstract
To optimize the design process of an autopilot and find the optimal design parameters, a new design method based on optimal control for a three-loop autopilot was proposed. It generates a three-loop autopilot topology by designing the cost function of the optimal control problem, and obtains multiple parameters of the three-loop autopilot by solving the optimal control problem. The impact of penalty weights in the cost function on the performance indicators of the autopilot was further studied and analyzed. Experimental results show that the three-loop autopilot designed by optimal control method has better performance compared with traditional design methods. And it also has good robustness against model-parameter uncertainties and unmodeled high-frequency dynamics of the system.
Keywords
经典三回路自动驾驶仪拓扑结构自美国雷神公司在麻雀导弹上首次应用以来,目前已在全球范围内得到广泛应用,成为各类导弹武器设计的首选[1]。三回路过载型自动驾驶仪以期望的纵向加速度作为指令,以测量的加速度和角速度作为反馈量,该控制结构不仅有利于实现导弹的精确命中,而且在针对众多拓扑结构的评测中具有最好的鲁棒性和快速性[2-4]。因此,针对经典三回路自动驾驶仪的研究和应用有很多[5-7]。
导弹自动驾驶仪设计的一般方法是这样的:在特定点上离散化飞行包络线,在不同的气动点上设计自动驾驶仪,通过设计大的单回路稳定裕度并进行仿真评估来保证系统对参数变化的鲁棒性。一般来说,使用传统方法设计自动驾驶仪涉及重复的单回路设计分析,这在时间和人力上代价都很昂贵;并且考虑到模型的不准确,经典方法在评估系统的稳定性和鲁棒性时具有很强的误导性[8]。因此,随着现代控制技术的发展,有文献提出了基于自抗扰理论的方法[9-10]、基于微分对策的方法[11]、基于深度强化学习的参数整定方法[12-14],以及基于粒子群算法和非线性模型预测控制的方法[15-16]、基于滑模控制的方法和基于H-∞的方法[17-20]等。
当前和未来出现的许多复杂飞行控制问题需要使用优化设计的多输入/多输出(multiple-input multiple-output,MIMO)数字控制系统,对飞控系统的稳定性和鲁棒性也提出了更高的要求。这使得采用最优控制理论设计自动驾驶仪成为一条重要的路径。然而,这些技术在导弹设计中的实际应用受到了限制。其中一个主要的问题是,使用二次性能指标的最优控制器是在时域内的优化设计,如何将自动驾驶仪的频域性能指标和稳定性要求转化为时域要求,并确定最优二次型的性能指标惩罚函数,使用优化性能指标来满足诸如带宽、噪声灵敏度等频域要求,同时满足对模型参数不确定性和未建模高频动态的鲁棒性,都是需要解决的重要问题。
针对上述问题,本文从最优控制的角度设计线性二次调节器(linear quadratic regulator,LQR)控制器,通过设计性能指标惩罚函数得到三回路自动驾驶仪拓扑结构,研究了惩罚权重与系统性能指标的关系,并通过设计实例与传统方法设计的经典三回路自动驾驶仪进行了比较,最后考察了该设计方法对模型不确定性误差和系统未建模动态的鲁棒性。
1 导弹纵向动力学方程
导弹纵向动力学可以用纵向姿态运动的扰动运动方程描述,即[21]:
(1)
取状态变量为,令,则上式可以写成矩阵形式的状态方程:
(2)
其中,α和 分别为攻角和俯仰角速率,δp为俯仰通道舵偏角,aym为俯仰方向体系过载的测量值。则有。
可以看出,弹体的模型主要取决于动力学系数a1、a2、a3、a4、a5,它们是由理论弹道确定的随飞行状态变化的参数,其中:。
本文分析单次飞行条件:导弹速度V=200 m/s,高度h=3 000 m,攻角α=6°,在此条件下各参数定义和取值如表1所示。
表1变量描述及取值
Tab.1 Description and value of the variables

2 基于LQR最优控制器的自动驾驶仪设计
2.1 LQR最优控制理论
为了将导弹纵向自动驾驶仪的设计表述为LQR最优控制问题,首先考虑单输入单输出系统LQR最优控制问题的标准形式。
对于系统
(3)
定义综合性能指标为
(4)
其中,(A,B)能稳,(H,A)能检,Q≥0,R>0。则最优反馈状态信号为
(5)
其中
P是满足如下代数黎卡提方程的正半定稳定解:
(6)
2.2 状态变换
对于式(2)表示的过载型自动驾驶仪状态方程,由于矩阵D不为0,即在优化的性能指标中含有馈通项,不能直接应用上述线性二次调节器理论,将输出反馈问题转换为状态反馈问题,因此需要引入新的状态变量进行变换。
这里,取控制量δp作为一个新的状态,并增加控制速率作为系统输入,给原系统增加一个额外的微分方程:
(7)
可以构造一个新的系统:
(8)
其中,为加速度计测量的体系纵向过载,Kss是为了确保系统阶跃响应稳态误差为0而引入的指令放大倍数。
从而:。
此时D1为零矩阵。由于系统是严格适定的,C1为非奇异矩阵,此时可以引入状态变换x2=C1x1=y1,将系统状态方程(8)转换为:
(9)
其中,,且。
2.3 整定问题求解
自动驾驶仪最基本的功能是稳定弹体姿态,同时调节或跟踪指令加速度。因此,本文先从整定问题开始,设置优化指标,寻求“最佳”控制。一个明显的优化目标是使用测量加速度和控制输入的加权和,由于在实际执行中舵的控制速率是有限的,因此惩罚函数中加入对舵控速率的控制是合理的,由此得到性能指标函数如下:
(10)
对于变换后的系统状态方程(9),由2.1节可以推出其最优解为
(11)
式中
(12)
其中,。
2.4 跟踪问题求解
为了实现精确命中,自动驾驶仪的一个重要目标是实现导弹纵向过载对制导指令过载的稳定跟踪,其本质是一个跟踪问题。这里可以将跟踪定义为跟随阶跃信号输入,从而成为一个定点调节器问题。在设计最优性能指标函数时,可以使用实测过载与指令过载之间误差的平方和作为惩罚函数,得到最优控制性能指标函数如下:
(13)
其中,ayc为指令过载。
其对应的状态方程相对于模型(8)多了一项,则:
(14)
其中且。
性能指标函数式(13)可以变换为:
(15)
该问题与2.3节的整定问题是等价的,其最优解与整定问题一样[22]。此时控制输入为
(16)
其中计算Kopt的方法与2.3节相同。
接下来计算系数Kss。根据开环系统状态方程(9),可以将闭环系统状态方程写为
(17)
其中
为了保证闭环系统稳态误差为零,有
(18)
因此。
2.5 最优控制器结构
根据以上推导,只需选定最优性能指标函数式(13)中的权重Q11和R11,即可求得最优控制器的反馈系数Kopt,得到最优控制输入如式(16)所示。应注意到Kopt是一个1×3维的向量,将其记为。
再注意到输入为u=,将式(16)两边积分可得:
(19)
由此可以绘出最优控制器结构如图1所示。该控制结构正好与经典三回路自动驾驶仪[23]结构相同。实际上也是从最优控制的角度验证了经典三回路自动驾驶仪的优越性。

图1LQR最优控制器结构
Fig.1Structure of LQR optimal controller
3 权重系数的选择与系统性能指标
性能指标函数中权重系数Q11和R11的选择对最优控制的结果有非常重要的影响,其中Q11代表了对跟踪误差的约束,取值越大,系统的跟踪误差收敛越快;系数R11代表了对输入控制速率的约束,系数越大,系统所需控制速率越小。两个系数的比值反映了系统性能与能量消耗之间的相对重要程度。实际上,比值相同则得到的最优解是相同的。因此,不妨令R11=1.0,考察Q11变化对系统性能的影响。
在第1节所述的飞行条件和参数取值下,令R11=1.0,计算Q11不同取值情况下的最优解。并在不考虑舵机动力学以及陀螺与加速度计模型的情况下,考察理想系统在不同参数下的各项性能指标,结果如表2所示,开环频率响应曲线和闭环阶跃响应曲线分别如图2和图3所示。
从结果可以看出,当Q11的取值增大时,系统上升时间减小,超调量增加,相角裕度下降,开环截止频率增加。也即随着系数的增大,系统响应速度加快,但稳定性逐渐降低。虽然系统的相位裕度都能保持在69°以上,但这是在未考虑舵机动力学和陀螺与加速度计模型的情况下得到的。在实际情况中,随着更多未建模设备动态的加入,会“吃掉”更多的稳定裕度,也即稳定性下降。文献[24]研究指出,基于低阶系统设计的控制器会由于未建模设备动态的加入而变得不稳定,因此必须通过控制性能指标系数,降低开环增益,限制开环截止频率,从而使得设计的控制器可以用于控制更高阶的系统对象。
表2不同Q11取值下的系统性能指标
Tab.2 System performance index under different values of Q11


图2不同参数取值下的开环频率响应曲线
Fig.2Open loop frequency response curves with different parameter values

图3不同参数取值下的闭环阶跃响应曲线
Fig.3Closed-loop step response curves with different parameter values
基于以上分析,为保证系统较好的快速性,同时具有良好的稳定性和鲁棒性,取Q11在2.0~5.0之间,可以取得较好的综合性能。
4 仿真结果对比与分析
为验证本文设计的LQR最优控制器的性能,首先将该控制器与采用传统方法设计的经典三回路自动驾驶仪性能进行对比,验证该方法的优越性,然后在系统中加入模型误差、舵机等执行机构的未建模动态误差等,以验证LQR控制器的鲁棒性。
4.1 与传统设计方法的对比验证
采用文献[23]中的经典三回路自动驾驶仪结构,如图4所示,以及文献[5]中的经典设计方法。仍然在第1节所述飞行条件下进行设计,其中系数Kg=0.206 7、ωi=0.240 0、KA=3.553 3、Kdc=1.000 3,该设计参数经过数学仿真和半实物仿真验证是可行的。

图4经典三回路自动驾驶仪结构
Fig.4Classic three-loop autopilot topology
将该设计结果与Q11=2.0时的最优控制设计结果进行对比,结果见表3、图5、图6。从结果可以看出,与传统设计方法相比,LQR最优控制器的上升时间更短,截止频率更高,说明该控制器的响应速度更快,而且相比于传统方法,该方法阶跃响应的稳态误差更小,稳定裕度更高,体现了该方法作为“最优”控制器的优越性。
表3LQR控制器与传统控制器性能指标对比
Tab.3 Comparison of performance indicators between LQR controller and traditional controller

4.2 LQR最优控制器的鲁棒性验证
自动驾驶仪的鲁棒性主要体现在对模型参数不确定性和未建模高频动态的鲁棒性。本节考察加入气动数据拉偏等模型误差和舵机等执行机构的未建模动态后,采用LQR最优控制器的自动驾驶仪的鲁棒性能,并与传统设计方法进行了比较。

图5与传统设计方法的Bode图对比
Fig.5Bode diagrams compared with traditional method

图6与传统设计方法的阶跃响应曲线对比
Fig.6Step response curves compared with traditional design method
在模型中加入表4所示的两种情况下的气动拉偏,并采用如下二阶传递函数来近似控制执行机构(control actuation system,CAS)即舵机的模型:
(20)
其中,ζA=0.614 3,ωA=65.115 3 rad/s。
表4气动参数拉偏情况
Tab.4 Variation of aerodynamic parameters

加入以上模型不确定性误差和系统未建模误差后,考察系统的稳定性和瞬态性能指标,结果如表5~6和图7~8所示。
表5LQR控制器对模型不确定性和未建模动态的鲁棒性
Tab.5 Robustness analysis of LQR controller to model uncertainty and unmodeled dynamics

表6传统控制器对模型不确定性和未建模动态的鲁棒性
Tab.6 Robustness analysis of traditional controller to model uncertainty and unmodeled dynamics

从结果可以看出,当模型存在偏差时,对系统的稳定性和瞬态性能有较大的影响,且对于LQR最优控制器和传统控制器都有相同的趋势,即:当气动系数向上拉偏时,系统响应速度加快,上升时间减少,但是稳定裕度有所下降;当系数向下拉偏时,系统响应速度变慢,上升时间增加,而稳定裕度也增加了;加入控制执行机构舵机模型后,也会使系统稳定裕度下降,并且截止频率减小。

图7LQR控制器在不同模型误差情况下的响应
Fig.7Responses of LQR controller for different model errors

图8传统控制器在不同模型误差情况下的响应
Fig.8Responses of traditional controller for different model errors
从结果还可以看出,当系统存在模型偏差,或者加入未建模的动态环节后,LQR最优控制器和传统控制器都能使系统保持稳定,并具有良好的跟踪性能。这是由于这两种控制器都采用了经典的三回路控制结构,而该控制结构对于模型的误差或系统未建模动态具有很好的鲁棒性[2]。由于最优控制器在参数上的优化,LQR最优控制器在快速性方面更占优势,截止频率更高,上升时间更短。
5 结论
本文基于LQR最优控制理论设计了导弹纵向三回路自动驾驶仪,该自动驾驶仪与经典三回路自动驾驶仪具有相同的结构。通过设计性能指标函数并求解最优控制问题,可以同时得到最优控制器的四个控制参数。仿真结果表明,该控制器对模型不确定性和系统未建模动态具有较好的鲁棒性,并且与传统方法设计的自动驾驶仪相比,具有更优的性能。此外,基于最优控制理论的方法可以很方便地推广到多输入多输出系统,并可用于控制静不稳定的导弹,对于未来先进导弹和飞行器的自动驾驶仪设计具有重要意义。