无人机非线性状态估计:扩展精确高斯变分推理学习方法
doi: 10.11887/j.cn.202503015
刘久富 , Elishahidi S.B.Mvungi , 汪恒宇 , 解晖 , 刘向武 , 王志胜
南京航空航天大学 自动化学院,江苏 南京 211106
基金项目: 国家自然科学基金资助项目(61473144)
Nonlinear state estimation for unmanned aerial vehicles: extended exactly Gaussian variational inference learning method
LIU Jiufu , Elishahidi S.B.Mvungi , WANG Hengyu , XIE Hui , LIU Xiangwu , WANG Zhisheng
College of Automation Engineering, Nanjing University of Aeronautics and Astronautics, Nanjing 211106 , China
摘要
针对在对时变非线性系统进行状态估计以及参数学习时估计误差大、抗干扰能力差等问题,提出一种面向非线性系统的精确稀疏高斯变分推理的批量状态估计与参数学习方法。基于高斯变分推理提出损失函数,状态估计问题转化为对真实后验近似问题,并引入需要学习的参数。对状态概率分布的参数使用高斯-牛顿式优化器的方法进行迭代更新,利用Stein引理、协方差矩阵的稀疏性及高斯容积方法得到完整的状态估计迭代方案。使用期望最大化学习测量模型的噪声参数,同时引入逆Wishart先验减少测量噪声和离群值对参数学习以及状态估计结果的影响。通过对无人机仿真模型进行模拟实验,在不加入无人机运动以及测量噪声真实值的情况下,对无人机轨迹能够进行精确的估计,且有效抑制测量噪声和测量离群值对轨迹估计精度带来的影响。
Abstract
Aiming at the problems of large estimation error and poor anti-interference ability in state estimation and parameter learning of time-varying nonlinear systems, a batch state estimation and parameter learning method for accurate sparse Gaussian variational inference for nonlinear systems was proposed. A loss function was proposed based on Gaussian variational reasoning, and the state estimation problem was transformed into an approximation problem to the true posterior, and parameters that need to be learned were introduced. The parameters of the state probability distribution were iteratively updated using the Gauss-Newton optimizer method, and a complete state estimation iterative scheme was obtained by using Stein′s lemma, the sparsity of the covariance matrix and the Gaussian volume method. The noise parameters of the measurement model were learned through expectation maximization, and the inverse Wishart prior was introduced to reduce the influence of measurement noise and outliers on parameter learning and state estimation results. The simulation experiment was carried out on the UAV simulation model, and the UAV trajectory can be accurately estimated without adding the UAV movement and the real value of the measurement noise, and the impact of measurement noise and measurement outliers on trajectory estimation accuracy is effectively suppressed.
状态估计[1-2]的目的是通过系统中传感器观测到的数据估计出无法被观测到的状态。当面对时变非线性系统时,传统的状态估计方法存在误差大、算法迭代次数过多等缺陷。本文方法拓展了精确高斯变分推理学习方法在非线性状态估计领域的理论研究,并对传统状态估计方法存在的缺陷进行改善。
时变非线性系统的状态估计[3-7]可以看作是对非线性系统的识别问题。高斯变分推理(Gaussian variational inference,GVI)是将高斯推断以及变分推理结合的状态估计方法,GVI方法从待估计状态的先验概率分布出发,利用传感器的观测值修正先验概率分布,得到更加精确的后验概率分布,然后利用损失函数对状态概率分布的均值以及协方差的变分对该分布进行迭代优化,得到接近状态真实后验的概率分布。状态估计问题中,文献[3]提出了一种基于在线的自适应滤波器(online-based adaptive filter, OBAF),用于状态滤波和对具有估计约束、非线性变换的干扰和噪声的非线性离散动态模型的状态进行估计。在OBAF中,将噪声和干扰离散化,通过置信度检测非期望状态估计值避免离群值的干扰,适用于缺少观测或估计约束的状态估计问题。文献[4]使用无迹卡尔曼滤波器(unscented Kalman filter,UKF)对非线性系统进行状态估计,经典的UKF算法要求过程噪声和测量噪声相互独立,由于传感器精度等问题,会发生数据丢失或测量不可靠的情况,导致估计误差过大。文献[5]针对非线性动态系统的状态估计问题,提出了一种基于扩展卡尔曼滤波器(extended Kalman filter,EKF)的连续离散状态估计器,对于高度非线性动态系统或中低采样频率,EKF提供了更好的精度和收敛性。文献[6]考虑非线性状态估计受到线性和非线性矩阵不等式形式的不等式约束,重写用于导出卡尔曼滤波器的标准最大似然目标函数,通过求解具有受线性矩阵不等式约束的线性目标函数的约束优化问题来找到卡尔曼增益,所提出的约束估计方法应用于EKF和sigma点卡尔曼滤波器(sigma point Kalman filter,SPKF)框架。
本文在GVI方法的基础上提出精确稀疏高斯变分推理(exactly sparse Gaussian variational inference, ESGVI)方法对非线性系统进行批量状态估计。ESGVI方法利用Stein引理[8]以及逆协方差矩阵的稀疏性,对所求期望进行边缘采样,降低均值以及协方差在迭代过程中的计算量,同时提高批量状态估计的精确性,进一步近似完整的贝叶斯后验。同时在ESGVI框架中对噪声模型进行参数学习[9-14],使用期望最大化方法从传感器数据中学习估计所需的模型参数,实现更加精确的状态估计。通过在协方差中引入逆Wishart先验对时变的协方差进行学习,并且抑制测量噪声过大以及离群值对状态估计精度带来的影响。
本文提出的ESGVI状态估计与参数学习方法应用到无人机轨迹估计中[15-26],通过学习传感器测量噪声参数减小轨迹估计误差。并且在仿真过程中测试了训练中是否添加真实值对估计结果的影响、算法在测量噪声过大时的估计精度表现以及对测量离群值影响的抑制能力。
1 ESGVI状态估计方法
1.1 损失函数
变分推理方法目的是将真实贝叶斯后验px|z)和后验的估计qx)之间的库尔贝克-莱布勒(Kullback-Leibler,KL)散度最小化。x是系统状态(xRN),z是传感器观测数据(zRD)。假设状态x满足如下所示的高斯分布:
q(x)=N(μ,Σ)=1(2π)N|Σ|exp-12(x-μ)TΣ-1(x-μ)
(1)
式中,μ为均值,Σ为协方差矩阵。
使用S表示后验估计qx)对真实贝叶斯后验px|z)的近似程度:
S=-- q(x)lnp(xz)q(x)dx=Ep[lnq(x)-lnp(xz)]
(2)
式中,Ep[·]表示贝叶斯后验px|z)的期望。
将式(2)的KL散度写成:
S=Eq[-lnp(x,z)]-12ln(2πe)N|Σ|+lnp(z)
(3)
式中,lnp(z)是常数,Eq[·]表示后验估计qx)的期望。
将KL散度最小化,转化为损失函数,定义为:
V(q)=Eq[ϕ(x)]+12lnΣ-1
(4)
引入系统中希望学习的参数θ,将损失函数写为:
V(qθ)=Eq[ϕ(xθ)]+12lnΣ-1
(5)
1.2 状态估计
1.2.1 迭代更新
式(5)的损失函数关于μ以及Σ-1的微分如下:
V(qθ)μT=Σ-1Eq[(x-μ)ϕ(xθ)]
(6)
2V(qθ)μTμ=Σ-1Eq(x-μ)(x-μ)Tϕ(xθ)Σ-1-Σ-1Eq[ϕ(xθ)]
(7)
V(qθ)Σ-1=-12Eq(x-μ)(x-μ)Tϕ(xθ)+12ΣEq[ϕ(xθ)]+12Σ
(8)
联立式(7)~(8)得到:
2V(qθ)μTμ=Σ-1-2Σ-1V(qθ)Σ-1Σ-1
(9)
将式(9)中微分VqθΣ-1设为零,得到Σ-1的更新:
Σ-1(i+1))=2V(qθ)μTμq(i)
(10)
式中,i表示迭代次数。
得到Σ-1的变化量:
δΣ-1=-2Σ-1(i)V(qθ)Σ-1q(i)Σ-1(i)
(11)
假设f(·)是任意非线性二阶可微函数,引入Stein引理:
Eq[(x-μ)f(x)]ΣEqf(x)xT
(12)
Eq(x-μ)(x-μ)Tf(x)ΣEq2f(x)xTxΣ+ΣEq[f(x)]
(13)
利用Stein引理代换式(6)~(8)中的损失函数微分项,得到迭代更新:
Σ-1(i+1)=Eq(i)2xTxϕ(xθ)
(14)
Σ-1(i+1)δμ=-Eq(i)xTϕ(xθ)
(15)
μ(i+1)=μ(i)+δμ
(16)
1.2.2 稀疏性与边缘采样
假设φx|θ)可以被分解,将其负对数似然写为:
ϕ(xθ)=k=1K ϕkxkθϕkxkθ=-lnpxk,zkθ
(17)
其中,xkx中与第k个因子关联的状态子集,zkz中与第k个因子关联的数据子集。
引入投影矩阵Pk,其作用是从状态集x中提取状态子集xk,映射关系为:
xk=Pkx
(18)
高斯边缘化等价于投影,使得:
qkxk=Nμk,Σkk=NPkμ,PkΣPkT
(19)
Σ-1写成:
Σ-1=k=1K PkTEqk2xkTxkϕkxkθPk
(20)
使用子块Σkk=PkΣPkT计算每个因子的期望,将结果返回到Σ-1的对应元素中。
利用分解式,并且反向利用Stein引理以达到避免求微分、简化计算以及减少可微性要求的目的,最后使用高斯容积方法近似积分,得到迭代更新:
Σ-1(i+1)=k=1K PkTEqk(i)2ϕkxkθxkTxk
(21)
Σ-1(i+1)δμ=-k=1K PkTEqk(i)ϕkxkθxkT
(22)
μ(i+1)=μ(i)+δμ
(23)
1.3 ESGVI状态估计算法具体实现过程
ESGVI状态估计算法如算法1所示。
算法1 ESGVI状态估计算法
Alg.1 ESGVI state estimation algorithm
2 ESGVI参数学习方法
2.1 期望最大化分解
将数据的负对数似然进行期望最大化分解:
-lnp(zθ)=- q(x)lnp(xz,θ)q(x)dx-- q(x)lnp(x,zθ)q(x)dx
(24)
式中,-- qxlnpxzθqxdx为证据下界(evidence lower bound,ELBO)。
期望最大化(expectation maximization,EM)方法在两个步骤中进行迭代,即期望步骤(E步骤)以及最大化步骤(M步骤)。
2.1.1 E步骤
当式(5)中的参数θ为协方差矩阵W时,负对数似然变为:
ϕ(xW)=12e(x)TW-1e(x)-lnW-1
(25)
式中,e表示待估计的状态向量。
利用Jensen不等式,并且去掉在E步骤中为常数的ln(|W-1|)项,得到:
Eq[e(x)]TW-1Eq[e(x)]Eqe(x)TW-1e(x)
(26)
利用式(26)中的关系,定义E步骤中的损失函数:
V'(q)=12Eq[e(x)]TW-1Eq[e(x)]+12lnΣ-1
(27)
2.1.2 M步骤
当协方差矩阵恒定时,定义M步骤的损失函数:
V(qW)=Eqϕm(xW)+12lnΣ-1
(28)
将负对数似然ϕmxW分解为:
ϕm(xW)=k=1K ϕkmxkW=k=1K 12ekxkTW-1ekxk-lnW-1
(29)
式中,K因子被未知参数W所影响,W是一个恒定的协方差矩阵。
对式(28)求微分得到式(30),并将微分设为零,计算出最优W的最小结果,如式(31)所示。
V(qW)W=Eqϕm(xW)W=Eqk=1K ϕkmxkWW=k=1K EqkϕkmxkWW
(30)
Wmin=1Kk=1K EqkekxkekxkT
(31)
2.2 白噪声加速度先验参数学习
本节将通过间接估计因子协方差的方法以实现参数学习。以状态的白噪声加速度(white-noise-on-acceleration,WNOA)动力先验为例,希望估计的参数为功率谱密度矩阵QC。定义:
(32)
其中:表示高斯过程,Tt)∈SE(3),是用于表示无人机姿态的特殊欧几里得群;ωtR6,是物体中心的速度;ωtR6,是一个零均值白噪声高斯过程,算子∧将R6中的元素转换到李代数向量空间se(3)。tk时刻的状态xk=(Tkωk)。
WNOA中的先验因子为:
ϕpxQC=k=2K ϕkpxk-1,kQC=k=2K 12ep,kTQk-1ep,k+lnQk
(33)
其中,
ep,k=lnTkTk-1-1-tk-tk-1ωk-1J-1lnTkTk-1-1ωk-ωk-1
(34)
J表示wt)的协方差矩阵与标准差矩阵之积。
先验Qk的协方差为:
(35)
其中,是克罗内克内积。
计算式(5)中损失函数关于QCij的微分,QCij是矩阵QC中位于(ij)位置的元素,可以得到:
V(qθ)QCi,j=12trk=2K Eqk-1,kep,kep,kTQΔt-11i,j-12(K-1)dimQΔtQCi,j
(36)
qk-1,k是两个连续时刻tk-1tk的边缘后验。将微分设为零,得到参数的最优估计值:
QCi,j=trk=2K Eqk-1,kep,kep,kTQΔt-11i,j(K-1)dimQΔt
(37)
2.3 协方差的逆Wishart先验
本节通过将先验合并进一步扩展协方差估计。将联合似然函数重新表达为:
p(x,z,A)=p(x,zA)p(A)
(38)
式中将协方差矩阵视为一个随机变量A=(A1A2,···,AK)。将后验估计重新表示为高斯分布qx)和协方差sA)后验分布的乘积:
q'(x)=q(x)s(A)
(39)
式中协方差的后验为:
s(A)=δ(A-Υ)
(40)
其中,δ(·)是狄拉克δ分布函数,Υ=( Υ 1Υ 2,···,Υ K)是最优协方差的设置值。
将式(24)的ELBO项进行简化:
-q(x)s(A)lnp(x,zA)p(A)q(x)s(A)dxdA=-q(x)ln[p(x,zΥ)p(A=Υ)]dx+q(x)lnq(x)dx+s(A)lns(A)dA
(41)
式中最后一项为狄拉克函数的微分熵,因为它与Υ无关,故将其从损失函数中去掉。
假设pΑ= Υ)因子为:
p(A=Υ)=k=1K pAk=Υk
(42)
在分解后的协方差因子上应用逆威沙特(inverse Wishart,IW)先验:
pAk=Υk=|Ψ|ν22νd2Γdν2Υk-ν+d+12exp-12trΨΥk-1
(43)
式中,dΥ k的维数,ΨR6×6为比例矩阵且正定,νd-1为自由度,Γd(·)为多元伽马函数。对比例矩阵参数Ψ进行估计,并将自由度ν视为元参数。
将因子设定为:
-ln(A=Υ)=k=1K -lnpAk=Υk=k=1K ϕkwΥkΨ=ϕw(ΥΨ)
(44)
舍去常数项,将式(28)写成:
Vq'Υ,Ψ=k=1K EqkϕkmxkΥk+ϕkwΥkΨ+12lnΣ-1=k=1K Eqk12ekxkTΥk-1ekxk-lnΥk-1-α-12lnΥk-1-ν2ln|Ψ|+12trΨΥk-1+12lnΣ-1
(45)
式中,α满足α=ν+d+2。
在E步骤中,保持Ψ不变以优化Υ k。对式(45)求微分,得到:
Vq'Υ,ΨΥk-1=12EqkekxkekxkT-12αΥk+12Ψ
(46)
将微分设为零得到Υ k的最优值:
Υk=1αΨ+1αEqkekxkekxkT=α-1αΨα-1+1αEqkekxkekxkT
(47)
式(47)是IW分布的模Ψα-1以及式(38)在单边际因子下的最优静态协方差估计的加权平均。
在M步骤中,保持Υ不变以优化Ψ。对式(46)的损失函数求微分,得到:
Vq'Υ,ΨΨ=k=1K -ν2Ψ-1+12Ak-1
(48)
将微分设为零得到Ψ-1的最优值:
Ψ-1=1Kνk=1K Υk-1
(49)
加入约束常数β以确保协方差的估计值不会趋向于正定边界,在训练过程中利用运动先验的噪声模型确定β的具体值。更新方式为:
Ψcβ|Ψ|-11dΨ
(50)
根据E步骤的式(47)以及M步骤的式(49)即可得到协方差A的最优估计值。
2.4 ESGVI参数学习算法具体实现过程
ESGVI参数学习算法如算法2所示。
算法2 ESGVI参数学习算法
Alg.2 ESGVI parameter learning algorithms
3 实例分析与验证
使用无人机运动模型对ESGVI参数估计方法的表现进行评估,在对无人机进行批量轨迹估计的同时对噪声模型进行参数学习。仿真实验将在Ubuntu系统中使用Eigen、Sophus以及Pangolin等软件的帮助下进行。
系统的运动方程以及观测方程为:
xk=fxk-1,uk,wkyk=gxk,nk
(51)
其中:函数f(·)为非线性运动模型,uk为输入,wk~N0Ωk)为过程噪声;函数g(·)为非线性观测模型,nk~N0Ψk)为测量噪声。f(·)的非线性部分以及g(·)为:
f=xk+x˙cosθk-y˙sinθkΔtyk+x˙sinθk+y˙cosθkΔt+wk
(52)
g=mlx-xk2+mly-yk2arctanmly-ykmlx-xk-θk+nk
(53)
3.1 无人机轨迹估计与噪声模型参数学习
本节将在训练中不添加无人机运动状态真实值的情况下对无人机进行轨迹估计,同时对无人机运动模型的过程噪声以及传感器模型的测量噪声的协方差进行学习以实现更加精确的轨迹估计。无人机设置为定高飞行模式,由无人机在飞行过程中构建地标地图,并且同时估计无人机自身位置以及速度。整个数据集包含10 000个时间步长,将其分为1 000个时间步长的10个子序列。图1为问题的因子图。
1无人机轨迹估计与参数学习因子图
Fig.1Factor diagram of UAV trajectory estimation and parameter learning
图中方框表示需要估计的变量,包括无人机状态x、测量噪声协方差Υ与地标位置m,黑点表示数据以及状态联合似然的因子,二元运动先验因子φpxk-1,k|QC)由参数QC决定,一元真实姿态因子φmxk|Wgt)由参数Wgt决定,因子φmxk| Υ k)和φwΥ k|Ψ)用于IW先验测量姿态协方差,Υ取决于参数Ψ。本文方法可以在不需要虚线框中的真实值因子的情况下学习参数QCΨ。仿真实验将分别在加入以及不加入真实值的情况下进行轨迹估计,并将两种方法的结果进行对比。
需要估计的状态x为:
(54)
其中:xk是无人机状态,xkykθkx˙ky˙kθ˙k分别为无人机的x轴位置、y轴位置、偏航角以及xy方向对应的速度与角速度;ml是地标位置。对于每一个子序列,K=2 000,L=10。
对于线性先验因子有:
ϕk=12x0-xˇ0TPˇ-1x0-xˇ0,k=012xk-Axk-1TQ-1xk-Axk-1,k>0
(55)
式中,
(56)
其中,T是离散时间采样周期,QC,i是功率谱密度,σx2σy2σθ2σx˙2σy˙2σθ˙2是对应的方差。非线性里程因子为:
ψk=12vk-CkxkTS-1vk-Ckxk
(57)
式中,
(58)
其中:vk是速度,包含x轴上的分量uky轴上的分量vk以及角速度ωkσu2σv2σw2是各分量对应的测量噪声方差。
非线性方位测量因子为:
ψl,k=βl,k-gml,xk22σr2
(59)
式中,βlk是第k个无人机位姿与第l个地标位置之间的方位测量值,σ2r是测量噪声方差。
gml,xk=atan2yl-yk,xl-xk-θk
(60)
结合式(55)、式(57)、式(59)得到数据和状态的联合似然函数:
-lnp(x,z)=k=0K ϕk+k=0K ψk+k=1K l=1L ψl,k+const
(61)
参数学习对应的损失函数为:
Vq'Υ,Ψ,Wgt,QC=Eq'ϕpxQC+ϕmxWgt+ϕm(xΥ)+ϕw(ΥΨ)+12lnΣ-1
(62)
式中:ϕpxQC是WNOA先验因子,定义由式(33)给出;ϕmxWgt是真实值因子,定义由式(29)给出;φmx| Υ)和φwΥ |Ψ)是测量协方差的IW先验因子,定义由式(29)、式(43)~(44)给出。
式(34)为φp所需的WNOA误差函数,φm所需的姿态测量误差函数为:
em,k=lnTkTmeas ,k-1
(63)
式中,Tk表示估计的k时刻的状态,Tmeas,k表示测量的k时刻状态。
令参数ν=6,β=1,对参数ΨQC以及Wgt进行学习。
3.2 轨迹生成
实验采用SICK TIM571红外雷达,扫描频率为15 Hz,测量量程为0.05~10 m,测量精度误差为±60 mm,角度分辨率为0.33°。
将无人机真实轨迹、有真实值估计轨迹以及无真实值估计轨迹叠加以进行比较,结果如图2所示。
2无人机轨迹生成
Fig.2UAV trajectory generation
图2可知,无论在训练中是否加入真实值,估计的轨迹与真实轨迹之间的拟合度都很好,验证了算法在缺少真实值情况下也能得出精确的估计值。
3.3 误差分析
无人机轨迹估计仿真中每个子序列的平移误差绝对值平均值如表1所示。
1无人机轨迹估计平移误差绝对值平均值
Tab.1 Mean value of the absolute value of the translation error of UAV trajectory estimation
表1可知,无真实值估计轨迹平移的平均误差为0.153 8 m,有真实值估计轨迹平移的平均误差为0.158 6 m,GVI方法估计轨迹平移的平均误差为0.261 4 m。本文所用的ESGVI状态估计与参数学习方法能在不加入真实值的情况下达到和加入真实值的情况下相同的算法性能。
无人机轨迹估计仿真中不加入真实值训练估计的轨迹在x轴和y轴方向上的误差以及偏航角误差如图3所示。
图3中不加入真实值训练估计的轨迹在x轴上的误差均保持在±0.1 m内,y轴上的误差均保持在±0.06 m内,并且波动小;偏航角误差波动稍大,但也保持在±6°内。图3中同时给出采用GVI方法进行估计的实验结果,可以看出,偏航角的误差与ESCVI方法相差不大,但在x轴和y轴上,最大误差均超过了0.15 m。结果表明,ESGIV方法能在不加入真实值的情况下对系统参数进行有效估计,并对无人机轨迹进行精确估计,且平动状态上的估计效果比GVI方法要好。
3无人机轨迹误差分析
Fig.3UAV trajectory error analysis
3.4 测量噪声对参数学习的影响
为验证本文方法可以使用测量噪声进行训练,本节在训练过程中将测量噪声统计数据设为未知,并且在测量值中添加额外的噪声误差。在位姿测量部分注入噪声:
Tnoise =expξTmeans ξ=ξ1:30ξ1:3N0,σ2I
(64)
其中,Tnoise表示噪声状态,Tmeans表示测量状态的平均值,ξ1:3表示噪声向量,ξ表示调整矩阵行数后的噪声向量,再使用∧算子得到ξ
调整σ的值为0.25~1 m,步长为0.2 m,在测试量和训练量中注入相同的噪声。估计平移误差的统计结果如表2所示。
表2中可见,当σ增加时,测量误差显著增加,但轨迹估计的平移误差仍然保持在0~0.5 m之内。结果表明,本文方法能够在没有真实值以及噪声过大的情况下对系统参数进行学习,以达到对无人机轨迹的精确估计。
2增加测量噪声时的轨迹估计平移误差
Tab.2 Trajectory estimation translation error when adding measurement noise
3.5 测量离群值对轨迹估计的影响
本节将在训练集和测试集中以5%的概率人为引入离群值,以测试IW先验能否有效抑制离群值对轨迹估计精度的影响。将以下的扰动应用到实际的姿态测量。
Toutlier =expξTmeans ξR6u(-200,200)
(65)
其中,Toutlier表示离群值的状态,ξ的每个分量从均匀分布u独立采样,单位为m。将测量协方差W作为静态参数学习,将每次测量协方差作为随机变量以对IW先验参数Ψ进行学习。
静态测量协方差对应的损失函数为:
Vq'W,QC=Eq'ϕpxQC+ϕm(xW)+12lnΣ-1
(66)
IW先验的测量协方差对应的损失函数为:
Vq'Υ,Ψ,QC=Eq'ϕpxQC+ϕm(xΥ)+ϕw(ΥΨ)+12lnΣ-1
(67)
无人机轨迹估计仿真中,在训练集和测试集中加入离群值后,是否引入IW先验的轨迹估计平移误差如表3所示。
3加入离群值后的轨迹估计平移误差
Tab.3 Trajectory estimation translation error after adding outliers
表3中,不引入IW先验的估计轨迹平移误差平均值达到6.285 2 m,而引入IW先验的估计轨迹平移误差仅为0.149 6 m。可见,在训练中引入IW先验能有效抑制离群值对参数学习以及轨迹估计结果产生的影响,提升参数学习以及轨迹估计的精确性。
4 结论
本文针对非线性系统中系统状态以及系统参数难以精确估计及学习的特性,结合高斯变分推理不需要对系统进行精确建模的特点,提出了精确稀疏高斯变分推理的非线性系统状态估计与参数学习方法,利用传感器数据对状态的概率分布进行迭代修正,使其更加近似于状态的真实分布,并且通过期望最大化方法对传感器参数进行学习,使状态估计更加精确。将算法应用于无人机模型的轨迹估计,结果表明:本文方法的估计轨迹准确性较好,并且在参数学习的训练中不加入无人机状态真实值也能实现轨迹精确估计;在人为增加测量噪声的情况下,本文算法也能在参数学习时有效缩小测量噪声带来的影响;在训练以及测试中人为加入测量离群值的情况下,本文算法通过引入IW先验,有效抑制了离群值对轨迹估计精度的影响。综上所述,本文提出的ESGVI参数学习与状态估计算法在精确性以及鲁棒性两个方面都有较好的性能表现。
1无人机轨迹估计与参数学习因子图
Fig.1Factor diagram of UAV trajectory estimation and parameter learning
2无人机轨迹生成
Fig.2UAV trajectory generation
3无人机轨迹误差分析
Fig.3UAV trajectory error analysis
1无人机轨迹估计平移误差绝对值平均值
2增加测量噪声时的轨迹估计平移误差
3加入离群值后的轨迹估计平移误差
SHEN H M, ZONG Q, LU H C,et al. A distributed approach for lidar-based relative state estimation of multi-UAV in GPS-denied environments[J]. Chinese Journal of Aeronautics,2022,35(1):59-69.
GILLIJNS S, DE MOOR B. Unbiased minimum-variance input and state estimation for linear discrete-time systems[J]. Automatica,2007,43(5):934-937.
DEMİRBAŞ K. Oba filter for online-adaptive nonlinear state estimation with interference[J]. IEEE Transactions on Aerospace and Electronic Systems,2019,55(3):1347-1356.
SARKKA S. On unscented Kalman filtering for state estimation of continuous-time nonlinear systems[J]. IEEE Transactions on Automatic Control,2007,52(9):1631-1641.
GUIHAL J M, AUGER F, BERNARD N,et al. Efficient implementation of continuous-discrete extended Kalman filters for state and parameter estimation of nonlinear dynamic systems[J]. IEEE Transactions on Industrial Informatics,2022,18(5):3077-3085.
MEI W J, USHIROBIRA R, EFIMOV D. On nonlinear robust state estimation for generalized Persidskii systems[J]. Automatica,2022,142:110411.
AUCOIN R, CHEE S A, FORBES J R. Linear-and linear-matrix-inequality-constrained state estimation for nonlinear systems[J]. IEEE Transactions on Aerospace and Electronic Systems,2019,55(6):3153-3167.
STEIN C M. Estimation of the mean of a multivariate normal distribution[J]. The Annals of Statistics,1981,9(6):1135-1151.
CHEN S C, LIU Y. Robust distributed parameter estimation of nonlinear systems with missing data over networks[J]. IEEE Transactions on Aerospace and Electronic Systems,2020,56(3):2228-2244.
NA J, XING Y S, COSTA-CASTELLÓ R. Adaptive estimation of time-varying parameters with application to roto-magnet plant[J]. IEEE Transactions on Systems, Man,and Cybernetics: Systems,2021,51(2):731-741.
BURT DAVID R, EDWARD R C, VAN DER WILK M. Convergence of sparse variational inference in Gaussian processes regression[J]. The Journal of Machine Learning Research,2020,21(1):5120-5182.
VAKILI S, SCARLETT J, SHIU D S,et al. Improved convergence rates for sparse approximation methods in kernel-based learning[J]. Proceedings of Machine Learning Research,2022,162:21960-21983.
SAFAEI A, MAHYUDDIN M N. Adaptive model-free control based on an ultra-local model with model-free parameter estimations for a generic SISO system[J]. IEEE Access,2018,6:4266-4275.
BONNEXIE R, SCHMIDT MIKKEL N. Matrix product states for inference in discrete probabilistic models[J]. Journal of Machine Learning Research,2021,22:1-48.
RANGANATHAN A, KAESS M, DELLAERT F. Loopy SAM[C]//Proceedings of the 20th International Joint Conference on Artificial Intelligence,2007:2191-2196.
TANG Y Y, HUANG P K. Boost-Phase ballistic missile trajectory estimation with ground based radar[J]. Journal of Systems Engineering and Electronics,2006,17(4):705-708.
ZHANG X L, YANG Z, WU C S,et al. Robust trajectory estimation for crowdsourcing-based mobile applications[J]. IEEE Transactions on Parallel and Distributed Systems,2014,25(7):1876-1885.
TANG K, CHEN S Y, LIU Z Y. Citywide spatial-temporal travel time estimation using big and sparse trajectories[J]. IEEE Transactions on Intelligent Transportation Systems,2018,19(12):4023-4034.
程媛, 迟荣华, 黄少滨, 等. 基于非参数密度估计的不确定轨迹预测方法[J]. 自动化学报,2019,45(4):787-798. CHENG Y, CHI R H, HUANG S B,et al. Uncertain trajectory prediction method using non-parametric density estimation[J]. Acta Automatica Sinica,2019,45(4):787-798.(in Chinese)
WANG Y, WANG X G, SHAN Y Z,et al. Quantized genetic resampling particle filtering for vision-based ground moving target tracking[J]. Aerospace Science and Technology,2020,103:105925.
WALTER M R, EUSTICE R M, LEONARD J J. Exactly sparse extended information filters for feature-based SLAM[J]. The International Journal of Robotics Research,2007,26(4):335-359.
CHO G R, LI J H, PARK D,et al. Robust trajectory tracking of autonomous underwater vehicles using back-stepping control and time delay estimation[J]. Ocean Engineering,2020,201:107131.
PERETROUKHIN V, VEGA-BROWN W, ROY N,et al. PROBE-GK:predictive robust estimation using generalized kernels[C]//Proceedings of the IEEE International Conference on Robotics and Automation(ICRA),2016:817-824.
ZHANG Z H, ZHOU G J. Maneuvering target state estimation based on separate modeling with B-splines[J]. Aerospace Science and Technology,2021,119:107172.
宋宇, 孙富春, 李庆玲. 移动机器人的改进无迹粒子滤波蒙特卡罗定位算法[J]. 自动化学报,2010,36(6):851-857. SONG Y, SUN F C, LI Q L. Mobile robot Monte Carlo localization based on improved unscented particle filter[J]. Acta Automatica Sinica,2010,36(6):851-857.(in Chinese)
DELLAERT F. Factor graphs:exploiting structure in robotics[J]. Annual Review of Control, Robotics,and Autonomous Systems,2021,4:141-166.