SPOT和Bayes递推估计融合的运载火箭样本量设计
doi: 10.11887/j.cn.202501020
黄彭奇子1 , 段晓君1 , 张银辉2
1. 国防科技大学 理学院,湖南 长沙 410073
2. 北京跟踪与通信技术研究所,北京 100094
基金项目: 国家自然科学基金资助项目(62103422) ; 湖南省自然科学基金资助项目(2021JJ40680)
Sample size design of launch vehicle combined with SPOT and Bayes recursive estimation
HUANG Pengqizi1 , DUAN Xiaojun1 , ZHANG Yinhui2
1. College of Sciences, National University of Defense Technology, Changsha 410073 , China
2. Beijing Institute of Tracking and Telecommunications Technology, Beijing 100094 , China
摘要
针对运载火箭小子样条件,结合序贯验后加权检验(sequential posterior odd test, SPOT)和Bayes递推估计法,分别从假设检验和参数估计两方面,对传统试验样本量评估方法进行改进。在对运载火箭服从正态分布的性能指标进行评估时,引入复合等效系数来有效融合多源数据,弥补真实试验数据或现场数据的不足。综合考虑两类风险和置信度要求,制定合理的评估方案,有效减少所需试验样本数量,从而控制试验成本。通过算例分析发现,提出样本量评估方法结果真实可信,能够有效降低样本量需求,可较好用于小子样条件下的运载火箭样本量试验设计。
Abstract
Aiming at the small sample data of launch vehicle, combining the SPOT(sequential posterior odd test)and Bayes recursive estimation method to improve the traditional sample size design from hypothesis testing and parameter estimation, respectively. When evaluating the performance indexes of launch vehicle following the normal distribution, the composite equivalent coefficient was introduced to fuse multi-source data, which can make up for the shortage of experimental data or test data. Considering the two types of risks and confidence requirements comprehensively, a reasonable evaluation scheme was designed. Through the analysis of examples, the results verified that the proposed method are authentic and credible, which can reduce the sample size demand effectively, and can be used for the sample size test design of launch vehicle under the small sample condition.
运载火箭的研制具有高成本、小子样和高风险等特点,为保证其执行任务具有足够高的可靠性,开展可靠性分析和评估工作是非常关键的。通常,可靠性统计验证就是在假设检验的基础上,通过对两类风险或参数估计进行分析,用尽可能少的试验来获取充分有效的信息,实现对运载火箭性能指标的统计推断。
样本量确定是运载火箭立项论证和试验鉴定初步方案论证过程中一项非常重要的内容,关系到试验成本和评估质量,并直接影响到最终的装备试验鉴定的结论。样本量的确定方法总体上可分为经典方法和Bayes方法两大类。其中,经典样本量确定方法源于大样本量下的经典统计学;而Bayes样本量确定方法由于利用验前数据构造先验信息,尤其适用于小子样试验的情形。近年来,针对运载火箭的可靠性统计试验,宋征宇等[1]针对Weibull、二项、指数三类分布,提出了基于Bayes理论的可靠性评估方法;周芳等[2]针对服从正态分布的试验数据,利用最大熵先验分布,研究产品指标均值的可靠性抽样检验方案;李大伟等[3]针对成败型装备,提出一种基于最大后验风险模型的可靠性试验风险分析方法,可以有效减少试验总数。以上方法在试验数据充足的情况下,能较好实现统计推断。Raices等[4]提出了一种基于马尔可夫链蒙特卡罗(Markov chain Monte Carlo,MCMC)法抽样的Bayes推理方法,从理论上推导了抽样样本量是否有效的计算公式。Shen等[5]提出了一种基于广义线性模型的样本大小确定算法,通过仿真来评估泊松分布、指数分布等总体的样本量。Bonsaglio等[6]利用试验设计方法对运载火箭样本量设计问题进行了探索。上述文献均针对小子样场景进行了研究,但如何确定装备最优试验样本数,如何从理论来推导样本量大小,并未充分说明。
本文在此基础上,针对运载火箭性能指标中服从正态分布的运载能力,提出一种基于复合等效系数的Bayes融合方法,并对多源融合数据开展序贯验后加权检验(sequential posterior odd test,SPOT)和Bayes递推,求解最小样本量,有效地克服了运载火箭现场数据不足的困难。具体技术流程如图1所示。
1运载火箭样本量评估的技术路径
Fig.1Flowchart of launch vehicle sample estimation
1 基于复合等效系数的多源数据Bayes融合
受成本、资源以及其他方面的限制,运载火箭在研制过程中不可能大量施行外场试验,原型级试验具有小子样性。因此,需要有效利用数值仿真试验、半实物仿真试验等各种先验信息,扩大信息量,补充评估信息源。而这些试验结果和原型试验结果往往不属于同一总体,并不能直接拿来使用。本文提出一种基于复合等效系数的多源数据Bayes融合方法,具体流程如图2所示,完成构造不同样本等效系数水平下的试验数据融合方法。
2基于复合等效系数的多源数据融合
Fig.2Multi-source data fusion based on composite equivalent coefficient
1.1 数据可信度计算
在运载火箭试验评估中,由于实际发射数据少,需要融合仿真试验、半仿真试验等多源试验数据。首先,为了克服每批次试验数据质量参差不齐的影响,结合GJB 526A—98对原始数据进行异常值剔除,删除对数据质量影响较大的野点。其次,为了避免大量仿真数据淹没小子样实际数据,在进行融合时必须对多源数据进行加权,一般解决方法是对多源数据进行数据的一致性检验,并在此基础上计算出数据可信度ωdata作为各组数据的权重。
为计算多源信息的数据可信度,构建如下假设:
H0:X*X ; H1:X* X
其中,设X*为测试性先验数据, X为现场试验数据。数据可信度是指,在采纳了H0之后,H0成立的概率,即X*与X属于同一总体的概率。数学描述为:
ωdata =PH0A
(1)
式中,A 为接受H0
由Bayes公式,式(1)可转化为:
ωdata =PAH0PH0PAH0PH0+PAH11-PH0
(2)
易知:
PA-H0=αPAH1=β
式中:A-为拒绝H0αβ为两类风险,通常采用“平等对待”原则[7],即α=β。将α=β代入式(2)有:
ωdata =PH0A=(1-α)PH0(1-2α)PH0+α
(3)
式中,PH0)为两类数据的一致性检验结果。通过上述分析得到数据可信度。
1.2 引入物理可信度的复合等效系数计算
然而,在小子样条件下,数据的相容性检验结果具有不稳定性[8],并不完全可信。因此,在数据可信度ωdata的基础上,通过引入物理可信度ωphy,将两者结合构成复合等效系数。
物理可信度可看成是不同试验方式物理模型的误差折合。通过对影响精度的不同试验环境及相关因素信息进行分析,对不同类型试验之间的等效折合关系进行研究,并建立起相应的关联关系。通常,在对运载火箭的运载能力进行分析时,可以通过仿真平台获得仿真试验偏差,记为:
σEqu_平均推力 =fΔXFΔXIΔXV
式中,ΔXF是由推力仿真计算产生的平均推力偏差,ΔXI是由比冲计算产生的平均推力偏差,ΔXV是由速度增量计算产生的平均推力偏差,f(ΔXF,ΔXI,ΔXV)是关于上述三者的函数,可由仿真平台的偏差分析计算得到,通常ΔXF和ΔXV之间是不独立的。假设上述误差已知,并且给定σTotal_平均推力为观测总误差,则此时物理等效系数为:
ωphy=1/1+λσEqu-平均推力 σTotal_平均推力 γ
(4)
式(4)用于后续融合评估计算。式中,参数λγ为衡量变化速率的参数,对于不同类型试验应该是不同的。通常选 λ∈[0.5,2],γ∈[1,2],也可以考虑结合工程经验对参数进行选取。
因此,综合物理可信度和数据可信度,定义复合等效系数为:
ω=(1-p)ωphy +pωdata
(5)
式中,p为数据可信度在复合等效系数中所占的比例,可取:
p= (1+3/n) -11+3/n0-1, p[0, 1]
其中,nn0分别是两类试验数据的样本大小。
1.3 基于复合等效系数的Bayes融合估计
设运载火箭的运载能力服从正态总体Nμσ2),有先验样本xi0i=1n0,则先验样本均值和方差分别是:
X- (0) θ0=1n0i=1n0 xi (0) S02τ02=1n0i=1n0 xi (0) -θ02
θ0τ02)为正态总体Nμσ2)的充分统计量。
为了解决小样本信息量不足甚至无信息的问题,将Bayes方法引入先验信息,即将正态总体中的2个未知参数(μσ2)视为随机变量,记为(μσ2)~π(μσ2),称之为先验分布。由于μσ2之间相互影响,则共轭先验分布是2个分布的乘积,即(μσ2)的先验分布为:
πμ, σ2=πμσ2πσ2
其中,π(σ2)是σ2的先验分布,π(μ|σ2)是σ2为条件下μ的先验分布。
根据共轭先验分布,取逆Gamma分布作为σ2的先验分布,正态分布作为μ的先验分布,参数(μσ2)服从正态-逆Gamma分布,即:
μσ2Nθ0, σ2n0σ2Γ-1α0, β0
其中,超参数(α0β0)表示为:
α0=n02τ02β0=n0-12
假设在先验信息基础上,进行第一阶段试验后,得到补充样本xi1i=1n1,记其均值和方差分别为:
X- (1) θ1=1n1i=1n1 xi (1) S12τ12=1n1i=1n1 xi (1) -θ12
考虑第一阶段试验的复合等效系数ω后,根据联合分布有:
πμ, σ2θ1, τ12=Nθ1, η1σ2Γ-1α1, β1
式中:
θ1=ωn1X- (1) +n0X- (0) ωn1+n0
η1=1ωn1+n0α1=n02τ02+ωn12τ12+ωn0n1X- (1) -X- (0) 22n0+ωn1β1=n0+ωn1-12
类似地,进行N个阶段试验之后,有:
πμ, σ2θN, τN2=NθN, ηNσ2Γ-1αN, βN
其中,θNηNαNβN可由θ1η1α1β1类似计算过程递推运算而得。
因此,在平均损失函数下,利用多阶段数据,可得总体未知参数μσ2的Bayes估计为:
μ^=θNσ^2=αN/βN-1
(6)
利用该方法,可以实现多源试验数据的基于复合等效系数的Bayes融合。显然,这种方法本质上是工程化方法与数学方法的结合,拓展了融合先验信息的加权Bayes方法的思路,与物理工程背景结合紧密有其合理性和实用性。
2 基于Bayes递推和SPOT分析的样本量估计
2.1 正态分布的SPOT样本量估计
通过以上分析,可以得到已知的多源数据融合后的正态分布,记运载能力服从X~Nμπσ2π)。根据Bayes定理,开始进行下批次的SPOT,获得样本后将其验后分布记为Nμ1σ21)。
设统计假设为 H0:μμ0H1: μμ0,若将参数空间分割为Θ0={μμμ0},Θ1={μμμ0},则获得样本表现值X后可求得验后加权比[9]
On=θ1 i=1n fxiμdFπ(μ)θ0 i=1n fxiμdFπ(μ)=1-ϕμ0-μ1σ1ϕμ0-μ1σ1
(7)
于是,正态分布均值参数μ(假设总体σ2已知)的SPOT方法如下所示。
事先取定犯两类错误的概率[10]
A=min1, βπ1PH0B=max1, PH1απ0
此外,还可以算出:
PH0=-μ0 12πσπe-μ-μπ22σπ2dμ=Φμ0-μπσπ
PH1=1-PH0=1-Φμ0-μπσπ
计算AB的值,在每次试验获得样本表现值后代入式(7)计算On,将其与AB进行比较即可进行决策。运用如下检验法则:
1)当OnA,终止试验,采纳假设 H0
2)当OnB,终止试验,采纳假设 H1
3)当AOnB,继续下一次试验,此时不做决策。
为了评估运载火箭的最小样本数,找到OminnB,此时的n即为最小的能满足两类风险要求的样本量。
2.2 正态分布的Bayes参数递推
由于SPOT试验仅分析了两类风险,未考虑运载火箭运载能力的参数置信度要求[11]。因此,如果在序贯检验的基础上,给出运载能力的点估计值,将会更有利于对评定数据进行分析。
根据验前估计Nμπ,σ2π),可得到在第一批次试验后运载能力的Bayes估计为:
μ1=σπ2i=1n(1) xi(1)+σ2μπn(1)σπ2+σ2σ12=σ2σπ2n(1)σπ2+σ2
(8)
其中,xi1表示第一批次SPOT获得的n(1)个样本值。在进行第 m 批次试验后,可推导出运载能力的Bayes估计为:
μm=σπ2i=1n(m) xi(m)+ΔXm-1+σ2μπn(m)σπ2+σ2σm2=σ2σπ2n(m)+Δnm-1σπ2+σ2
(9)
其中,xim表示第m批次SPOT获得的nm个样本值;ΔXm-1为前m-1批次试验中所有样本之和,ΔXm-1=i=1n1 xi1+i=1n2 xi2++i=1nm-1 xim-1; Δnm-1为前m-1批次试验中的样本数量,Δnm-1=n(1)+n(2)+···+nm-1)
在得到上述Bayes参数递推结果后,在此基础上利用可靠性置信下限要求对样本量进行分析。设运载火箭的运载能力X不低于规范下限L的可靠度下限为RL,即:
RL=P{XL}
分析可知,其可靠度计算公式为:
RL=tn-1(n/(n+1)K)
(10)
其中,K=μm-Lσm为变异系数。根据国标[12],其对应的置信度计算公式为:
γ=Fn-1,nωL(nK)
(11)
式(11)表示在自由度为n-1时,非中心参数为nωL的非中心t分布的分布函数在nK的值。此时,可查表得到满足要求的最小n,即为最小的能满足置信水平要求的样本量。
2.3 结合SPOT和Bayes递推的数据分析
针对运载火箭的运载能力会给定置信水平和两类风险联合要求的情况,结合SPOT和Bayes递推来进行分析,在可选择的试验方案中,选择同时满足两类要求的最小样本量的试验方案。用数学模型描述为:
On=1-ϕμ0-μ1σ1ϕμ0-μ1σ1>BFn-1,nωLnKLγ
(12)
对式(12)的求解可按如下步骤进行:
1)根据αβ要求,迭代计算选择可行的SPOT方案On,注意此处On的可行方案可能有多个。
2)在所有可行方案中选择满足可靠度置信水平要求的最小的试验样本量n,即为试验方案。
3)若所有可行方案都不能满足置信水平要求,则需要调整装备性能要求。
3 算例分析
对运载火箭开展运载能力试验,从历史资料中查到了5批有效平均推力的“初样数据”,每批进行3发半仿真试验,具体数据如表1所示。
1运载火箭运载能力的平均推力试验数据
Tab.1 Average thrust experiment data of launch vehicle′s carrying capacity
此外,运载火箭在实际发射试验过程中,还进行了3次试验,试验测得的平均推力(单位kN)结果如下:
[14.72    15.34    15.53]
假设运载火箭的平均推力误差已知,为σ2=0.7(kN)2。此时,若要求该型运载火箭的平均推力规范下限为13.2 kN,并且平均推力的可靠度设计需优于0.95(置信度为0.7),两类风险不超过0.2,对样本量进行设计和验证。
3.1 多源数据的Bayes融合
首先,利用基于Bootstrap的方法,计算出平均推力的初样数据先验分布点:μ0=15.086 2 kN,σ20=0.578 9(kN)2。同理,可以计算出平均推力在实际现场数据中的先验分布点:μ1=15.177 0 kN,σ21=0.313 8(kN)2
接着,利用秩和检验得到仿真试验数据和真实试验数据的数据一致性检验的p值是0.553 9。结果表明,在置信水平为0.95的情况下,认为两组数据的分布情况是一致的。根据两类风险的“平等对待”原则,算得仿真试验数据和真实试验数据的数据可信度ωdata=0.832 4。
通过仿真平台获得σEqu=f(ΔXF,ΔXI,ΔXV)=30,σTotal=50,则此时物理等效系数(取γ=1,λ=1)为:
ωphy =1/1+λσEqu σTotal γ=0.6250
因此,综合物理可信度和数据可信度信息,计算得到复合等效系数为:
ω= (1-p) ωphy +pωdata =0.70796
式中:p=(1+3/12)-1×(1+3/3)-1=0.400 0。
最后,在平均损失函数下,根据式(6)可得总体未知参数μπσ2π的Bayes点估计为:
μπ=15.1061kNσπ2=α2β2-1=0.6690 (kN) 2
3.2 传统样本量估计
传统的样本量估计方法是在获取多源数据融合的基础上,将性能参数的置信度要求和两类风险要求联合,可利用包络法求解出最优样本量,即求解:
Pμπ<M, μμ0Pμμ0αPμπM, μ<μ0Pμ<μ0βM=μ0-θNσ2nτN2+μ0μπ-σπ2t1-γ (n-1) /n13.2tn-1n/ (n+1) KL0.95
其中, M为两类风险决策临界值, NθNτ2N)是μ的共轭分布。代入数据求解得到,传统样本量估计需要试验至少5发,才能达到精度要求。
3.3 算例样本量估计
根据应用背景,设μ为该运载火箭的平均推力性能指标,根据SPOT方案对该指标进行检验,做出如下统计假设:
H0:μ<13.2H1:μ13.2
根据先验信息,可以计算出:
PH0=-μ0 12πσπe-μ-μπ22σπ2dμ=Φμ0-μπσπ=0.9901PH1=1-PH0=1-Φμ0-μπσπ=0.0099
α=0.2,β=0.2,则可计算出:A=1,B=4.950 5。
假设在此基础上,后续进行了5次实际试验,测量得到的平均推力(单位kN)分别为:
[14.70,15.38,14.21,15.67,15.71]
下面给出SPOT设计方案。根据On可计算得到,验后加权比On和后验运载能力的均值μn、方差σ2n随样本量变化关系如表2所示。
2SPOT方案中样本数N、验后加权比On、后验运载能力的均值μn与方差σ2n
Tab.2 Sample size N, posterior weighted ratio On, mean μn and variance σ2n of posterior carrying capacity in SPOT scheme
从上表可以看出,当样本量N=1时,有On=569.824>B=4.950 5。也就是说,只需再开展1次真实的运载能力测量相关试验,就可以做出接受备选假设H1的结论,即认为两类风险达标。
同时,根据可靠度需求可知,需要火箭的平均推力(F)规范下限为13.2 kN,并且F的可靠度设计需优于0.95(置信度为0.7),即:
R=P{F13.2}P (R0.95) 0.7
由于此前给出的SPOT方案仅分析了两类风险,此时再结合Bayes递推估计,对性能指标的置信水平进行分析。在原有先验信息基础上,当N=1时,可以根据式(9)得到后验平均推力的均值、方差分别为:μ1=14.908 kN,σ21=0.342(kN)2,计算可求出此时的变异系数为:
K1=μ1-μ0σ1=14.908-13.20.342=2.9197
若要求运载火箭的平均推力可靠度设计需优于0.95(置信度为0.7),根据样本量与可靠度置信下限对应的单侧规范下限KL系数关系,如表3所示。
3置信度为0.7时,样本量与可靠度置信下限(0.95)的单侧规范下限KL系数表
Tab.3 Coefficient table of single side normative limit KL for samples size and reliability confidence lower limit (0.95) with a confidence level of 0.7
此时,N=3即可验证平均推力可靠度设计需优于0.90(置信度为0.7)的要求。
实际上,后验平均推力可靠度估计值随着样本量增加也提升,对应样本量可能减少,同样满足两类风险需求。
N=2时,验后加权比On=19 610.506>4.950 5,即同样可以满足两类风险需求。此时,计算出后验运载能力均值方差分别为:μ2=15.063 kN,σ22=0.230(kN)2,计算可得此时变异系数为:
K2=μ2-μ0σ2=15.063-13.20.230=3.8846
同理,若要求平均推力的可靠度设计需优于0.95(置信度为0.7),根据样本量与可靠度置信下限对应的单侧规范下限KL系数关系,查表3可得仍需要N=3完成验证。
因此,结合基于SPOT的两类风险分析,以及Bayes置信区间要求可知,需要至少3个样本,即可验证达到运载能力的设计需求。相较于传统的样本量设计方法,提出方法降低了40%的样本量需求,有效控制了试验成本。
4 结论
本文针对运载火箭的运载能力这类型服从正态分布的性能指标,综合考虑两类风险和参数置信度要求,进行样本量设计和优化。首先,利用基于复合等效系数的方法,从数据和物理模型两方面,充分融合仿真数据和现场数据;接着,在此基础上结合SPOT试验和Bayes递推进行样本量分析,给出满足性能参数要求的试验约束。结果表明,该方法能有效减少现场试验次数,降低运载火箭发射试验成本。
致谢
多源数据融合工作是在国防科技大学前沿交叉学科学院王正明教授的指导下完成的,特此致谢!
1运载火箭样本量评估的技术路径
Fig.1Flowchart of launch vehicle sample estimation
2基于复合等效系数的多源数据融合
Fig.2Multi-source data fusion based on composite equivalent coefficient
1运载火箭运载能力的平均推力试验数据
2SPOT方案中样本数N、验后加权比On、后验运载能力的均值μn与方差σ2n
3置信度为0.7时,样本量与可靠度置信下限(0.95)的单侧规范下限KL系数表
宋征宇, 方志耕, 赫武乐, 等. 基于贝叶斯理论的小子样运载火箭可靠性评估技术[J]. 深空探测学报(中英文),2021,8(1):62-69. SONG Z Y, FANG Z G, HE W L,et al. Research on launch vehicle reliability assessment of small sample based on Bayes theory[J]. Journal of Deep Space Exploration,2021,8(1):62-69.(in Chinese)
周芳, 王薇, 陈志军, 等. 小子样成败型产品可靠性评估方法研究[J]. 装备环境工程,2019,16(8):91-94. ZHOU F, WANG W, CHEN Z J,et al. Reliability evaluation method for the success or failure product in small-subsample circumstances[J]. Equipment Environmental Engineering,2019,16(8):91-94.(in Chinese)
李大伟, 王国栋, 李永哲. 基于Bayes理论的成败型装备鉴定试验风险分析[J]. 航空动力学报,2021,36(1):157-166. LI D W, WANG G D, LI Y Z. Qualification test risk analysis of binomial equipment based on Bayes theory[J]. Journal of Aerospace Power,2021,36(1):157-166.(in Chinese)
RAICES CRUZ I, LINDSTRÖM J, TROFFAES M C M,et al. Iterative importance sampling with Markov chain Monte Carlo sampling in robust Bayesian analysis[J]. Computational Statistics & Data Analysis,2022,176:107558.
SHEN Y Q, PSIODA M A, IBRAHIM J G. BayesPPD:an R package for Bayesian sample size determination using the power and normalized power prior for generalized linear models[EB/OL].(2021-12-29)[2022-07-21].https://arxiv.org/abs/2112.14616v1.
BONSAGLIO M, FORTINI S, VENTZ S,et al. Approximating the operating characteristics of Bayesian uncertainty directed trial designs[J]. Journal of Statistical Planning and Inference,2022,221:90-99.
HAMADA M. Bayesian reliability[M]. New York: Springer-Verlag,2008.
HUANGPENG Q Z, DUAN X J, ZHANG Y H,et al. Sample size design of launch vehicle based on SPOT and Bayesian recursive estimation[C]//Proceedings of the 41st Chinese Control Conference(CCC),2022.
SINGH S K, ACHARYA S K, CRUZ F R B,et al. Bayesian sample size determination in a single-server deterministic queueing system[J]. Mathematics and Computers in Simulation,2021,187:17-29.
王超. 虚实结合的测试性试验与综合评估技术[D]. 长沙: 国防科学技术大学,2014. WANG C. Testability test and integrated evaluation technology with virtual-physical test[D]. Changsha: National University of Defense Technology,2014.(in Chinese)
王康, 史贤俊, 周绍磊, 等. 基于优化SPOT和D-S证据理论的测试性验证方案[J]. 航空学报,2019,40(11):223064. WANG K, SHI X J, ZHOU S L,et al. Testability verification scheme based on optimized SPOT and D-S evidence theory[J]. Acta Aeronautica et Astronautica Sinica,2019,40(11):223064.(in Chinese)
全国统计方法应用标准化技术委员会. 正态分布完全样本可靠度置信下限: GB/T 4885—2009[S]. 北京: 中国国家标准化管理委员会.National Technical Committee on Application of Statistical Methods Standardization. Lower confidence limit of reliability for complete sample from normal distribution: GB/T 4885—2009[S]. Beijing: Standardization Administration of China.(in Chinese)