摘要
为了实现不同自由来流下壁面转捩热流场的高效预测,基于变分自编码器架构建立了生成式转捩热流预测模型。选取不同自由来流条件下的高超声速圆锥模型作为研究对象,采用数值模拟方法构建转捩热流数据集。搭建变分自编码器模型,在转捩热流数据集上进行了训练和验证,结果分析表明变分自编码器模型能够有效提取热流场隐变量,并精准重构了背风面流向涡转捩的热流场结构。搭建全连接神经网络模型,构建了自由来流与热流场隐变量的非线性映射关系。串联全连接神经网络模型和变分自编码器模型解码器部分,构建高超声速圆锥转捩热流预测模型,预测结果表明,该模型能够有效学习复杂转捩机制作用下的热流分布特征,对不同自由来流下的热流预测精度较高,误差不高于0.024。
Abstract
To enable efficient prediction of transition heat flux fields under diverse freestream conditions, a generative transition heat flux prediction model based on variational autoencoder architecture was developed. The hypersonic cone configuration under different freestream conditions was selected as the research object, with numerical simulation method being employed to generate the transition heat flux dataset. A variational autoencoder model was constructed and was trained and validated on the transition heat flux dataset. The analysis of results demonstrates that the latent variables of the heat flux field can be effectively extracted by the variational autoencoder model, and the heat flux structure of the transition process induced by leeward-side streamwise vortices was accurately reconstructed. A fully connected neural network model was established to construct a nonlinear mapping relationship between the freestream conditions and the latent variables of the heat flux field. By connecting the fully connected neural network model with the decoder part of the variational autoencoder model, a hypersonic cone transition heat flux prediction model was developed. The prediction results indicate that this model effectively learns the characteristics of heat flux distribution under complex transition mechanisms, achieves high prediction accuracy for heat flux under various freestream conditions, with errors not exceeding 0.024.
Keywords
高超声速飞行技术是21世纪航空航天技术领域新的制高点,也是世界各国的重大战略需求之一[1]。然而,在高超声速飞行器的发展过程中面临着诸多困难。美国国家航空航天局把转捩列为第一类急需解决的物理模型问题[2]。高超声速转捩是指高超声速边界层从层流向湍流的过渡,转捩伴随着飞行器表面气动热的陡增,有研究表明,转捩后的气动热通常为层流状态的3~5倍,这对热防护策略的设计提出了较高的要求。作为高超声速飞行器热防护策略设计的先决条件,精准且高效的高超声速转捩热流预测技术能够有效减少热防护系统设计的冗余度,降低飞行器的成本与质量,提高飞行器的设计效率和性能。
现有高超声速转捩热流预测技术主要以工程算法、风洞试验和数值计算为主[3-5]。工程算法主要通过边界层相似解并经过理论分析和合理的假设推导得到,或利用试验与数值模拟结果得到的半拟合公式获得。其具有预测效率高的优点,但存在泛化性差的缺点。风洞试验在高超声速风洞中开展模型表面气动热测量,获得的热流结果较为准确,但试验数据获取成本较高。随着计算机和数值模拟技术的快速发展,通过计算流体力学(computational fluid dynamics,CFD)求解Navier-Stokes方程,可获得飞行器表面热流分布特征,适用于复杂外形的热流数值预测,是获取高精度转捩气动热数据较为理想的手段之一。
在多年的数值模拟和风洞试验中积累了大量高超声速气动热结果,如何对这些数据进行有效融合和再利用,探索高超领域的“第四范式”,逐渐成为目前研究的前沿与热点[6-10]。随着数据驱动和深度学习方法的快速发展,国内外研究者尝试采用深度学习方法,基于积累的大量气动数据,搭建数据驱动的气动特性预示技术,取得了不少成果[11-16]。Wang等[17]针对超临界翼型的复杂绕流场,建立了基于变分自编码器(variational autoencoder,VAE)的深度学习模型,对翼型周围的速度场和压力场进行了预测研究,预测模型能够准确捕捉激波区域的流动细节,并实现了比传统CFD方法快1 600倍的计算加速。在跨音速三维机翼的压力分布预测方面,Francés-Belda等[18]建立了基于 β-变分自编码器与高斯过程回归(Gaussian process regression,GPR)的代理模型,结合主成分分析(principle component analysis,PCA)预处理数据,对不同飞行条件(马赫数、攻角)下的机翼压力场预测进行了研究,模型在激波区域和高攻角条件下能够高效高精度预测机翼表面压力场分布。
在气动热预测方面,Liu等[19]构建了流-热-结构耦合的二维圆柱气动热数据库,采用本征正交分解(proper orthogonal decomposition,POD)技术,结合径向基函数构建不同来流条件下圆柱气动热流场的高效、高精度预测模型。袁佳铖等[20]建立了基于卷积神经网络的预测模型,对钝锥、钝双锥、升力体和双椭球四类典型外形的表面热流分布进行了预测研究,预测模型对复杂外形预测精度较U-Net更高,且在较少训练样本时仍保持良好的性能。晏筱璇等[21]针对高超声速机翼表面气动热流场,采用POD方法对其进行特征降维,得到热流场POD基和基系数,基于Chebyshev多项式构建输入为来流参数、输出为POD基系数的代理模型,实现气动热的快速预测。陈鑫等[22]使用POD方法对100个F104机翼表面气动热流场进行特征降维,构建了输入为来流参数、输出为温度场POD基系数的代理模型,该方法在预测效率上相比于数值计算方法提高了5个量级。基于通过空间散点代表全局气动热分布的思想,张智超等[23]提出了基于径向基函数神经网络的气动热逐点快速预测代理模型,通过多个模型的协调训练与预测,高效获得飞行器表面热流场分布。Ding等[24]利用直接Monte Carlo模拟数据构建稀薄流下圆柱表面气动热数据集,搭建输入为自由流参数、输出为圆柱表面9个位置气动热分布向量的人工神经网络。上述气动热特征空间降维建模和逐点建模两类预测方法因线性降维和缺失外形对热流分布的影响信息等特点,无法做到在不同自由来流参数条件下开展受复杂转捩机理控制的气动热流场高效高精度预测。
综上,本文以在不同自由来流条件下高超声速圆锥的壁面转捩热流场高效高精度预测为目标,采用具有非线性降维能力和耦合外形参数能力、基于变分自编码器架构的生成式深度学习方法,建立转捩复杂机制控制下的高超声速气动热高效高精度预测模型。采用数值模拟方法建立不同自由来流和几何参数下的转捩气动热数据集,利用生成式深度学习模型对气动热分布进行训练和预测,展示了预测模型的热流场重构能力和预测效果。
1 研究方法
1.1 基于变分自编码器的壁面热流预测模型
1.1.1 主成分分析
主成分分析是一种统计分析方法,将多组具有一定相关性的样本数据,重新组合成一组新的线性无关向量的线性组合。这是一种最小均方意义上的最优变换,目的是去除输入随机向量之间的相关性,突出原始数据中的隐含特性。主成分分析方法的优势在于数据压缩以及对多维数据进行降维,操作简单且没有参数限制,已被广泛应用于人脸识别、图像压缩和特征提取等领域,是在高维数据中寻找特征模式的一种技术。
主成分分析方法被用于确定变分自编码器模型最优隐变量空间维数,以实现特征空间的有效提取和高精度热流场重构。最优隐变量空间维数是从香农熵的概念中得出的,利用每个状态出现的可能性来确定保存最多有用信息所需的最小隐向量空间维数[25],通过确定在主成分分析中保留主成分的数量实现。从数学上讲,当仅使用线性变换模块搭建自动编码器时,隐变量空间维数将近似为主成分分析的主成分模式[26]。基于上述考虑,本文通过主成分分析方法研究了不同隐变量空间维数对热流重构精度的影响。
1.1.2 变分自编码器模型
首先构建以卷积神经网络[27]为基础,包含残差卷积编码器[28]和解码器的变分自编码器[17]。所谓的“变分”,是指变分自编码器认为数据是由某些涉及连续随机变量的随机过程生成的[29-30]。因此,变分自编码器中的编码器作为推理模型,在训练过程中通过学习到的概率分布从输入x中分别推断k个隐变量对应的均值与标准差,并利用下式得到隐变量z:
(1)
式中,r是分量均在0~1之间的随机向量。从数学上看,k个隐变量的后验分布是均值μ=(μ1,···,μk)、标准差σ=(σ1,···,σk)的对角高斯分布;先验分布p(z)是均值μ=0、标准差σ=1的标准高斯分布。KL(Kullback-Leibler)散度被用于描述先验分布与后验分布的差异程度,在此,KL散度作为损失函数直接参与模型训练和参数学习过程。
(2)
解码器作为生成模型,基于给定的隐变量z,在学习到的概率分布p(z)中随机采样,在训练过程中重构出与输入x尽可能接近的xR。因此,构建重构均方根损失(x,xR),最小化输入x与重构输出xR的区别:
(3)
变分自编码器网络训练过程中减小式(4)所示损失函数,每个训练迭代过程采用反向传播算法更新网络参数,整个训练过程结束后,变分自编码器网络能够精准重构输入x。
(4)
综合编码器与解码器结构,变分自编码器模型结构如图1所示。
图1变分自编码器模型结构
Fig.1Structure of variational autoencoder model
输入数据x为真实壁面热流场,以三维张量1×512×512形式输入编码器,获得热流场有效特征编码,即隐变量z;解码器基于隐变量z重构输出xR,同样以三维张量1×512×512形式输出。通过Adam优化算法减小以式(4)构建的损失函数,迭代训练模型参数,得到预训练变分自编码器模型。
1.1.3 全连接神经网络模型
根据预训练变分自编码器提取的壁面热流场有效特征编码(即隐变量z),搭建全连接神经网络以构建自由来流参数与隐变量z之间的映射关系,全连接神经网络结构如图2所示。
图2全连接神经网络模型结构
Fig.2Structure of fully-connected neural network model
全连接神经网络的优化目标为最小化预测隐变量zp与真实隐变量z的均方根损失函数:
(5)
式中,M为采样点数量。神经网络损失通过反向传播算法优化神经网络参数。全连接神经网络拥有64个隐藏神经元构成的4层隐藏层和对应的4层Tanh激活函数层。
完成变分自编码器模型与全连接神经网络模型的训练后,串联全连接神经网络模型与变分自编码器中的解码器部分,搭建转捩热流预测的预训练模型。给定自由来流参数,预训练模型中全连接神经网络生成对应的隐变量(特征向量),随后,隐变量通过解码器,得到高精度预测壁面热流场。转捩热流预测预训练模型结构如图3所示。
图3高超声速转捩热流预测预训练模型结构
Fig.3Pretraining model structure for predicting heat flux during hypersonic transition
1.2 高超声速转捩数值模拟
1.2.1 计算模型和条件
转捩热流预测模型训练、验证数据集均利用Fluent软件数值模拟生成。采用圆锥模型,头部钝度(圆锥前端球形钝头半径)为0.05 mm,半锥角为7°,圆锥长为0.55 m。计算模型示意图如图4所示。其中,(x,y,θ)是圆锥坐标系。气体参考量选取参考温度为52 K,来流马赫数为6,单位雷诺数选取范围为4.0×106~9.0×106/m,攻角α选取范围为1°~9°。
图4计算模型示意图
Fig.4Sketch map of computational model
圆锥计算域及网格如图5所示,采用Pointwise软件进行网格划分,圆锥流向网格间距为1 mm,法向上一个边界层内至少布有50个点,第一层法向网格间距为0.000 05 mm,保证第一层网格y+小于1。无黏通量采用AUSM格式,选用SST四方程湍流模型。
1.2.2 网格无关性验证
图6给出了1 500万、3 000万、6 000万三种规模网格在背风面中心线(θ=180°)的热流曲线,可以看出,三种网格模型计算得到的结果基本一致。为了平衡计算精度与计算效率,采用3 000万网格进行计算。
图5高超声速圆锥计算网格
Fig.5Computational mesh of hypersonic cone
图6背风面中心线热流曲线
Fig.6Centerline heat flux curves on the leeward side
2 结果与讨论
2.1 数据集构建
数据集的构建是模型训练前最重要的步骤之一,数据集的好坏直接影响着预测模型训练的成败。
2.1.1 数据准备
高超声速圆锥三维边界层转捩过程及机理较为复杂,导致不同来流参数下模型表面转捩阵面及热流分布差别较大。为保证数据集样本的可靠性与特征鲜明,在圆锥三维边界层转捩参数研究的基础上,对自由来流参数空间进行均匀采样,共获得91个圆锥三维边界层转捩热流分布样本,其中随机选取77个样本作为训练数据集,其余14个样本作为验证数据集,具体参数空间采样如图7所示。
图7训练集和验证集样本对应的参数空间采样点
Fig.7Parameter space sampling points corresponding to training and validation datasets
2.1.2 数据预处理
首先,考虑到圆锥三维边界层转捩特征,数据集样本采用背风面转捩区热流分布。选取流向坐标x为0.1~0.5 m和周向坐标θ为45°~135°的区域作为热流计算及预测区域。
其次,将圆锥壁面三维热流分布通过坐标变换,映射到二维坐标平面上。由于壁面热流在圆锥表面分布,即法向坐标y=0,则可忽略法向坐标,三维热流分布自动坍缩为二维热流分布,仅包含流向坐标x与周向坐标θ。为保证卷积操作的可行性,生成均匀结构网格(xn,yn)∈[0,1],网格量为512×512,通过式(6)所示坐标变换将(x,θ)热流分布线性插值到(xn,yn)结构网格上。
(6)
最后,采用最小值-最大值归一化操作,使热流值均处于[0,1]的范围内。
如图8所示,对所有壁面转捩热流样本开展以上数据预处理操作,构建生成式热流预测模型训练数据集,以提高模型训练过程的数值稳定性。
图8数据预处理示意图
Fig.8Diagram of data preparation
2.2 高超声速圆锥转捩热流预测模型
2.2.1 最优隐变量空间维数
图9所示为不同主成分数量下的可解释方差比。可解释方差比用于量化流场特征模态对原始流场总方差的贡献程度,定义为流场模态的特征值占总方差的比例。对于第k个主成分,可解释方差比为:
(7)
式中:λk是流场数据协方差矩阵的第k个特征值,对应第k个主成分的方差;d为流场数据的总数量;是总方差,即协方差矩阵的迹——所有特征值之和。
图9前20个主成分的可解释方差比
Fig.9Explained variance ratios of first 20 principle components
前10个主成分方差比能够达到99.86%,而16个主成分方差比达到99.98%,热流场重构精度较高。随着主成分数量继续增多,重构精度会随之提高。从重构精度角度考虑,具有较高维度隐变量空间的模型训练效果更好,但从物理特征分析的角度考虑,较低维度的隐变量空间更有利于提取隐变量和热流场之间的联系。综合以上考虑,主成分数量即隐变量空间维数选为16。
2.2.2 训练过程
热流预测模型的训练、验证过程均在PyTorch架构下进行。下面简要介绍模型的超参数调节:模型单步训练的样本数量定为16;模型隐变量空间维数为16;模型优化器采用Adam优化器;利用学习率预热策略,保证训练过程数值稳定,在前1 000步中,学习率预热过程使学习率从0逐渐增大到0.004,随后,进入学习率衰减过程,每1 000步学习率降低50%。模型训练过程损失曲线如图10所示。
图10变分自编码器模型训练损失曲线
Fig.10Training loss curve of variational autoencoder
训练4 000步之后,模型在训练集和验证集上同时具有良好的表现。
2.2.3 特征提取
图11为热流场重构平均误差和最大误差统计分布。统计结果表明,变分自编码器模型的重构平均误差在训练集均小于0.03,在验证集均小于0.028,表明模型具有良好的泛化性。模型平均误差和最大误差利用以下公式获得:
(8)
(9)
其中,ng为网格数。
具体地,选取了训练集与验证集中重构误差较小(雷诺数5.67×106、攻角4°)和较大(雷诺数7.33×106、攻角5°)的样本数据以作比较,如图12和图13所示。
图11热流场重构平均误差和最大误差统计分布
Fig.11Distribution statistics of the mean absolute error and maxmum absolute error for the reconstructed heat flux fields
重构误差较小的样本中,背风面流向涡转捩区热流场重构结果与真实结果基本一致;重构误差较大的样本中,背风面流向涡转捩阵面重构较为准确,但转捩区热流场重构存在一定的误差。总体来说,壁面重构热流场较为光滑,并不存在数值振荡等非物理解。转捩过程的涡破碎和猝发现象导致转捩狭小区域热流陡增,是变分自编码器模型重构误差集中分布在转捩区域的主要原因。
图12误差较小训练样本的热流场重构结果
Fig.12Reconstruction results of heat flux field for training samples with small errors
图13误差较大训练样本的热流场重构结果
Fig.13Reconstruction results of heat flux field for training samples with large errors
因此,图14展示了训练集与验证集中重构误差较小和较大的样本数据背风面中心线壁面热流曲线。重构热流曲线与真实曲线符合较好,转捩起止点预测有不错的精度,转捩区宽度与真实结果基本一致。重构误差集中在转捩阵面前缘,是转捩过程热流剧烈变化的主要表现。总体来说,变分自编码器模型能够高效、准确地重构高超声速圆锥转捩热流场。
图14不同训练样本中心线热流曲线重构结果
Fig.14Results of the reconstructed centerline heat flux curve for different training samples
2.2.4 热流场预测
变分自编码器以特征提取得到的隐变量z为标签,监督学习全连接神经网络,构建自由来流参数与隐变量z的映射关系,通过串联预训练全连接神经网络预测模型和变分自编码器模型解码器部分,构建热流场预测模型。
其中全连接神经网络模型的训练损失曲线如图15所示。约3 000步后,训练残差逐渐收敛。热流场预测平均误差和最大误差统计分布见图16,全连接神经网络在训练集和验证集表现基本一致,变分自编码器模型的重构损失在训练集均小于0.024,预测误差在验证集均小于0.022,表明该模型的泛化能力较为良好。
图15全连接神经网络模型训练损失曲线
Fig.15Training loss curve of fully-connected neural network model
图17和图18分别是训练集和验证集中预测误差较小与较大的数据样本热流场预测结果。预测误差较小的样本中,转捩区热流场预测结果与真实结果具有较好的一致性,包括转捩阵面、热流陡增都得到很好的预测;预测误差较大的样本中,转捩阵面的预测结果与真实结果较为相似,但转捩区热流场预测存在一定的误差。总的来说,壁面预测热流场较为光滑,并不存在数值振荡等非物理解。转捩狭小区域热流的剧烈变化,是生成式热流预测模型预测误差集中分布在转捩区域前缘的主要原因。
图16热流场预测平均误差和最大误差统计分布
Fig.16Distribution statistics of the mean absolute error and maximum absolute error for the predicted heat flux fields
图17误差较小训练样本的热流场预测结果
Fig.17Results of the predicted heat flux field for training samples with small errors
图18误差较大训练样本的热流场预测结果
Fig.18Results of the predicted heat flux field for training samples with large errors
3 结论
本文结合生成式深度学习方法,融合数值仿真平台转捩热流数据库,基于变分自编码器架构搭建了一套适用于高超声速圆锥转捩阵面及壁面热流场高效、精准预测的人工智能模型。训练数据集和验证数据集误差统计结果及流场重构和预测结果表明,该模型能够对不同自由来流条件下圆锥三维边界层转捩热流场进行精准、高效的重构及预测。主要结论如下:
1)采用主成分分析方法对高超声速圆锥转捩热流场进行了线性模态分解,获得了各模态对应的可解释方差比,确定了变分自编码器模型最优隐变量空间维数为16。
2)经过超参数调节的变分自编码器模型具有较好的壁面热流场特征提取和重构能力。其从512×512的高精度真实壁面热流场中提取16个隐变量。在训练过程中发现,隐变量z是自由来流参数的有效潜在特征,因此变分自编码器是有力的特征提取模型。变分自编码器在训练数据集上热流场重构平均误差均小于0.03,在验证数据集上的平均误差均小于0.028,表现出较好的泛化性能。重构热流场分析表明,在转捩起止位置,热流的剧烈变化是重构误差集中在转捩前缘区域的主要原因。
3)经过超参数调节的全连接神经网络模型主要负责建立自由来流参数与热流场潜在特征之间的非线性映射关系。预训练的全连接神经网络模型与变分自编码器模型解码器部分串联构成高超声速圆锥壁面热流预测模型。统计数据表明,该模型能够高效且准确地预测高超声速三维圆锥背风面流向涡转捩区转捩阵面及壁面热流场分布,预测误差不超过0.024。




