摘要
为解决超临界翼型流场快速预测问题,基于当前深度学习流场预测模型的两种主要思路——卷积神经网络和Transformer,提出一种综合结构的深度学习模型,称为TransCNN-FoilNet。该模型能够预测一系列不同厚度的超临界翼型在不同攻角下的流场,相较于基准模型最高可减少79.5%的平均绝对值误差。还针对超临界翼型流场预测模型的训练提出了一种新的组合损失函数,称为加权L1SSIM损失函数。结果表明,该损失函数可以改善对升阻力系数的预测,阻力系数相对误差最多可以减少17.8%。所提出的模型实现了在降低复杂度的同时提升预测准确性和泛化性能,能够为超临界翼型流场的快速可靠预测提供有力支持。
关键词
Abstract
To address the challenge of rapid flow field prediction for supercritical airfoils, a hybrid deep learning model, termed TransCNN-FoilNet, based on two main approaches in current deep learning flow field prediction models—convolutional neural networks and Transformers was proposed. The model was capable of predicting the flow fields of supercritical airfoils with varying thicknesses at different angles of attack, achieving up to a 79.5% reduction in the mean absolute error compared to the baseline model. Additionally, a new combined loss function for training the flow field prediction model was introduced, referred to as the weighted L1SSIM loss function. The results demonstrate that this loss function can improve the prediction of lift and drag coefficients, with the relative error in drag coefficient reduced by up to 17.8%. The proposed model achieves improved prediction accuracy and generalization performance while reducing complexity, providing a promising tool for fast and reliable flow field prediction of supercritical airfoils.
Keywords
超临界翼型[1]是一种在高亚音速和跨音速飞行条件下,可提高气动效率的翼型。通过特定的几何形状,翼型上表面的气流速度可以得到控制,从而减小超声速区域的大小和激波的强度,进而减小翼型在高速飞行时产生的激波阻力。因此,采用超临界翼型可以显著提高飞机的升阻比,降低燃油消耗。早期的翼型设计优化主要采用风洞试验[2]的试凑法,这种方法通过反复修型和试验进行优化,耗费大量人力物力,且时间成本很高。随着计算流体力学(computational fluid dynamics,CFD)的发展和计算机技术的进步,采用数值模拟方法对翼型进行优化得到了越来越广泛的应用[3]。然而,传统的CFD方法[4-5]主要基于数值求解纳维-斯托克斯(Navier-Stokes,N-S)方程,该方法虽然在理论上比较成熟,但计算成本高昂,并且该方法依赖于迭代求解偏微分方程,导致了在求解过程中面临数值稳定性等约束。这些问题限制了传统方法在迭代设计、多方案比较和实时流场控制等领域的应用。近年来,深度学习技术的快速发展为流场预测提供了新的解决方案[6],在流场预测任务中,深度学习模型可以从已知流场数据中学习物理量分布规律,从而预测出给定几何与工况下的流场物理量分布。
基于卷积神经网络(convolutional neural network,CNN)的U-Net模型和Transformer模型是当前深度学习流场预测领域的两大经典模型。U-Net模型在经典的图像分割任务中表现出了卓越的性能,许多研究[7-12]将其应用于流场的重建和快速预测,展现出该模型在处理复杂流动方面的潜力。U-Net模型通过独特的编码器-解码器架构和跳跃连接,能够有效捕捉流场的局部特征,这对于流场的准确构建至关重要。Transformer模型以自注意力机制为核心,能够处理长距离依赖关系,非常适合用于处理序列和图像数据,为流场的时序预测和空间分布预测提供了新的视角。Zuo等基于其之前提出的卷积神经网络流场快速预测模型[13]进行改进,得到了一种基于Transformer的端到端快速预测网络架构[14],模型基于注意力机制提取几何特征,从而预测不同工况下的翼型流场,并通过可视化翼型数据块特征之间的注意力分数来提高网络的可解释性,用于重建翼型绕流的不可压稳态流场。Jiang等[15]提出了一种基于Transformer解码器架构的TransCFD模型,与传统CFD相比,其能够在将预测速度提高三个数量级的前提下将平均绝对误差(mean absolute error,MAE)控制在1%以内。Miotto和Wolf[16]开发的基于视觉变换器(vision transformer,ViT)模型的计算框架,可以从非定常流的图像中预测感兴趣的量,可用于翼型动态失速分析等场景。
虽然目前通过深度学习方法预测流场已经取得了大量的成果,但对于超临界翼型来说,激波造成的物理量间断给深度学习模型带来了很多难题。Deng等[17]针对此问题进行了讨论,并设计了一种基于ViT改进的编解码器网络,用于预测超临界翼型上的跨声速流动。该模型采用了多种方法对几何输入进行编码,并引入多级小波变换和梯度分布损失到损失函数,以提高在激波区域附近的预测精度,为超临界翼型流场预测问题的解决提供了许多新思路。
为了进一步解决基于深度学习模型的超临界翼型流场预测不够准确、泛化性能差的问题,提出一种结合ViT和U-Net结构的超临界翼型流场快速预测模型——TCFN(TransCNN-FoilNet)模型,其可以很好地综合U-Net结构和ViT结构的优势,得到更佳的预测精度和泛化能力。为了针对性地提高模型对于超临界翼型流场的预测能力,提出将加权L1SSIM损失函数作为模型训练使用的损失函数,并在自建数据集上进行了测试,验证了其对于预测结果的改进。
1 训练数据与深度学习模型
1.1 数据集生成
为了训练适用于在实际翼型设计过程中,用于在给定工况下迭代翼型几何的快速预测模型,本文重点关注模型在特定工况下对不同几何形状和攻角的翼型的泛化性能。因此,所有流场数据的来流工况均为Ma=0.76,Re=5×106。参照先前的相关研究[18],首先使用类-形变换(class-shape transformation,CST)方法对翼型进行参数化造型,其中翼型上下表面分别使用7个CST参数表征,接着对翼型的厚度和攻角(angle of attack,AOA)使用输出空间采样法在一定范围内进行采样,得到训练集(Train)的翼型。然后依次扩大厚度和攻角范围得到测试集Valid-1和Valid-2,用于评估模型的泛化能力。另外,常见的超临界翼型RAE2822也被用于生成数据集,以检验模型对于实际翼型的流场预测效果。造型完成后,使用开源CFD软件CFL3D的剪切应力输运(shear stress transport,SST)模型对各翼型的流场进行雷诺平均N-S方程(Reynolds-averaged N-S equations,RANS)计算,以升阻力系数趋于稳定判断流场收敛,剔除掉因非定常效应导致不收敛的结果后,得到最终的流场数据集。各数据集的具体采样范围和样本数量如表1所示,翼型厚度变化范围可视化为图1。
表1数据集信息
Tab.1Information of datasets
CFD计算网格结构如图2所示,任意网格点都可以由ij索引得到,从尾迹开始围绕翼型的顺时针为i的正方向,从翼型壁面到远场则为j的正方向,共计361×77个点,其中j=1,32≤i≤328范围内的点定义了翼型的表面。通过CFD计算可以得到各网格点上的无量纲压力p、温度T以及x和y方向上的速度u和v (无量纲因子为对应的来流物理量)。根据以上数据,可以构造各数据集的输入与输出真值:输入定义为一个3通道图像,长和宽为i和j,3个通道分别为x、y和攻角;输出真值定义为相同大小的4通道图像,4个通道分别为p、T、u、v。
图1翼型厚度变化范围
Fig.1Variance range of the airfoils′ thickness
图2空间离散化网格
Fig.2Spatial discretization grid
1.2 基准模型
流场预测领域当前比较经典的模型框架主要有CNN和Transformer神经网络,本文分别对其选取了两个经典模型进行实现,用于在相同的数据集下与自建模型对比预测效果。
参考Ronneberger等[19]的标准架构,本文搭建了基于CNN的U-Net模型,该模型由收缩路径的编码器和扩展路径的解码器组成,并在二者之间做跳跃连接。U-Net结构如图3所示,收缩路径和扩展路径均由一系列基本单元组成。收缩路径的基本单元是卷积层、最大池化层以及ReLU激活函数层。为避免数据损失,卷积层引入了大小为1的填充[7,10]。扩展路径的基本单元是反卷积层和卷积层,反卷积层将通道数减半,卷积层以及输出填充将图像大小还原至与收缩路径中相对应的大小,用于跳跃连接。在扩展路径的最后,卷积层将通道数减少至4作为输出。整体来看,数据经历了一个大小先减后增、通道先增后减的过程。
图3U-Net结构
Fig.3Architecture of the U-Net
U-Net结构的优势首先在于参数共享,因此可以使用较少的数据训练,这意味着数据生成成本的降低。另外,U-Net通过多层卷积和池化可以实现从微观到宏观学习流场结构,这与流场多尺度效应的物理实际符合,有利于学习到更本质的流动特征,从而增强泛化性。同时,U-Net在收缩路径和扩展路径之间的跳跃连接有效地融合了不同分辨率的特征图,这有助于在特征提取过程中保留更多的细节信息,并避免网络结构过深造成的梯度消失。
在Transformer结构方面,Zuo等[14]开发的ViT模型在流场预测方面取得了巨大的成功,本文参照其搭建了基准Transformer模型,该模型使用Transformer编码器提取翼型的几何特征,之后通过多层感知机(multilayer perceptron,MLP)作为解码器进行流场预测。与U-Net模型相比,由于考虑到了流场不同位置之间更复杂的相互影响,模型的预测精度和泛化性能会有所提高。
图4展示了本文所使用的ViT模型,该模型编码器的输入为翼型几何和攻角,将数据分块并编码。编码器由多个相同的模块组成,每个模块均包含层标准化、多头自注意力层和MLP。Transformer编码器的自注意力机制允许其在提取特征时更加关注翼型的重要区域,多头注意力则可以捕捉更加丰富的全局特征和局部特征之间的关系。最后,模型的输出由全连接MLP解码器得到,激活函数使用ELU。本文所实现的ViT模型结构超参数如表2所示。
图4ViT模型结构
Fig.4Architecture of the ViT model
表2ViT模型结构超参数
Tab.2Structural hyperparameters of the ViT model
1.3 TCFN模型
为了综合利用Transformer模型和CNN模型的优势,受到前人工作[14,19]启发,本文设计了一款利用ViT作为编码器、CNN作为解码器的流场预测模型,并将U-Net网络结构中的跳跃连接引入了该模型。该模型被称为TCFN模型,结构如图5所示。
图5TCFN模型结构
Fig.5Architecture of the TCFN model
可以看到,该模型的编码器部分与ViT模型类似,先将输入信息分块,然后将每个数据块作为一个令牌进行嵌入。TCFN模型编码器的结构超参数如表3所示,值得注意的是,TCFN模型的输入通道数被增加到了5,除了空间上的x、y坐标和攻角信息,翼型表面坐标点的x和y坐标也被扩展成为两个新的通道,用以增强模型对不同几何形状翼型的泛化能力。
表3TCFN模型结构超参数
Tab.3Structural hyperparameters of the TCFN model
在解码器方面,不同于先前Transformer相关研究使用的MLP解码器[14]和ViT解码器[17],TCFN模型采用了类似于U-Net网络的反卷积解码器。解码器由卷积层和反卷积层组成,前两层用于生成符合输出大小要求的流场,后面两层则是为了缓解反卷积带来的棋盘效应[20]。最后,为了增强模型的泛化能力,避免梯度消失,类似于U-Net结构的跳跃链接被引入解码器。TCFN模型综合了U-Net模型和ViT模型的优势:ViT编码器使其能够更充分地捕捉翼型不同几何位置之间的关联,CNN解码器则在保证预测精度的前提下减少了模型参数量,降低了模型的训练成本。
1.4 加权L1SSIM损失函数
本文针对超临界翼型流场预测问题,对L1误差函数进行加权,并与结构相似性指标(structural similarity index measure,SSIM)函数结合[21],设计了一种新的损失函数用于模型训练。这样做的目的是:①对于翼型流场预测问题,更需要关注的是翼型的升阻力等气动性能信息,这些信息是由靠近翼型的流场所决定的,因此对该部分流场增加权重是合理且有必要的;②卷积类解码器在生成流场时往往会出现流场不光滑的问题,即在视觉效果上与真值相差较大,这对于需要人工评判流场质量的翼型气动设计来说是需要避免的,因此本文引入了在计算机视觉领域用于提升图像视觉效果的SSIM损失函数,定义如式(1)所示,其中σ和μ为滑窗统计的方差和均值,参考原始文献[22]将系数设置为C1=1×10-4,C2=9×10-4。
(1)
L1损失函数在不同法向位置下的权重由式(2)定义,之所以采用非线性分布的权重,是由于翼型空间网格节点在靠近壁面的区域附近更密集,如果权重在此处基于节点坐标的增长率较小,则可以使其在实际物理空间的增长较为合理。式(2)所对应的L1误差权重在节点坐标和翼型物理空间下的分布如图6所示。

(2)
图6权重λ在节点坐标和物理空间上的分布
Fig.6Distribution of weight λ in the node coordinates and physical space
加权L1误差和SSIM损失函数之间的权重系数设为0.5,最终的损失函数如式(3)所示,其中Y和X分别代表真值和模型的预测结果,该损失函数被称为加权L1SSIM损失函数。

(3)
2 实验结果
本节将展示U-Net、ViT两个基准模型以及TCFN模型在各数据集上的性能,并对比了是否使用加权L1SSIM损失函数对TCFN模型预测结果的影响。
2.1 深度学习模型的训练及预测结果的对比
基于PyTorch框架,利用单块RTX4090GPU(24 GB),在Train数据集上对三个模型进行训练,超参数设置均为:批量大小设为64,初始学习率设为0.000 1,学习率每10代减少为原来的9/10,训练总代数为600,损失函数使用L1损失函数。训练开始前随机抽取5%的数据作为验证集,最终得到各模型训练损失函数曲线如图7所示。
图7模型训练损失函数曲线
Fig.7Loss function curves of the models′ training
可以看出,训练600代后,各模型的损失函数均已趋于稳定,未发生过拟合。横向对比来看,不管是对于训练集还是验证集,TCFN模型的损失函数最小,ViT模型次之,U-Net模型则呈现了相对较大的损失函数,这也体现出了三个模型的拟合能力差异。更进一步地,将各模型的性能在Train、Valid-1和Valid-2三个数据集上进行了测试,预测结果与真值的MAE(εMAE)被呈现在图8当中(εMAE计算表达式如式(4)所示,q代表不同物理量)。可以看出,在各个数据集上,TCFN模型的表现均显著优于各基准模型,最高可将εMAE降至基准模型的20.5%,这体现出TCFN模型对于训练数据的拟合能力以及对于外推数据的泛化能力是比较优秀的。

(4)
图8各模型在各数据集上的εMAE对比
Fig.8Comparison of εMAE across different models on different datasets
为了更进一步地呈现各模型预测结果的差异,Valid-1数据集中编号为300的流场云图和绝对值误差(absolute value error,AE)分布被呈现在图9用于对比。从流场云图来看,所有模型都能够准确预测流场的整体形态,能够较好地体现超临界翼型含有激波的流场的主要特征。然而,所有模型的预测结果均在激波附近出现了少许误差,这印证了深度学习模型在预测含有激波间断的流场时所面临的困难,激波位置和强度可能会出现一定偏差。不过横向对比来看,相较于两个基准模型,TCFN模型呈现了较为优秀的性能,预测结果在激波附近的AE更小,整体更接近真值。
图9各模型预测得到的流场云图及绝对值误差
Fig.9Contour of the flow field and absolute value errors predicted by different models
在实际工程应用中,人们更关注的是翼型表面的物理量分布及其积分量(如升力、阻力)。以Valid-1数据集中编号为300和700的两个流场为例,图10呈现了各模型预测得到的翼型表面无量纲压力分布,其中c为翼型弦长。两个流场对应的翼型的最大相对厚度分别为0.098和0.13,相对于训练集来说分别是内插和外插数据。从不同流场的预测结果来看,各模型对于外插数据集的预测准确度普遍差于内插数据集,特别是U-Net模型和ViT模型,其对于激波位置和陡峭程度的预测存在比较大的偏差。从不同模型的预测结果来看,不论是在内插数据还是外插数据上,TCFN模型均得到了显著优于基准模型的预测结果,特别是在外插数据上,TCFN模型也能够准确给出激波的位置。
图10各模型预测得到的翼型表面无量纲压力分布
Fig.10Surface dimensionless pressure distribution of the airfoil predicted by different models
各个模型在各数据集上计算得到的升阻力系数与真值之间的相对误差呈现在图11当中。从不同数据集来看,外插样本更多的数据集普遍更难预测,各个模型的升阻力系数误差均随着外插样本的增多而增加。从不同模型来看,TCFN模型在升阻力系数的预测方面基本显著优于各基准模型,特别是升力系数,TCFN模型可以将基准模型在各个数据集上的相对误差最多减少90.9%,相对于真值的误差控制在不大于0.91%。值得注意的是,由于阻力系数本身是一个相对较小的值,因此微小的绝对误差也会表现为较大的相对误差,所以各模型对阻力系数的预测相对误差普遍偏大。TCFN模型对于阻力系数的预测相对误差可以控制在5.2%以下,虽然不如升力系数那么准确,但也能满足实际工程需要,且基本优于基准模型。
图11各模型预测的升阻力系数相对误差
Fig.11Relative errors in lift and drag coefficient predictions by different models
2.2 损失函数的性能验证
为了说明本文提出的加权L1SSIM损失函数的有效性,接下来使用其作为损失函数再次训练TCFN模型,并与L1损失函数训练得到的模型进行对比。模型结构和超参数保持不变,将损失函数更改为加权L1SSIM损失函数,在Train数据集上训练,得到损失函数曲线如图12所示。可以看出,600代之后,模型损失函数基本趋于稳定,且未发生过拟合。
图12TCFN模型损失函数曲线
Fig.12Loss function curves of the TCFN model
引入加权L1SSIM损失函数的目的之一是通过增大翼型附近数据点的权重,提高模型对升阻力系数预测的准确性。图13对比了采用L1损失函数和采用加权L1SSIM损失函数训练得到的TCFN模型,在各数据集上的升阻力系数相对误差。可以看到,两种损失函数得到的升力系数相对误差相差不大,在外插数据更多的Valid-2数据集上,加权L1SSIM损失函数的结果略好于L1损失函数。对于阻力系数而言,加权L1SSIM损失函数有效地进一步降低了模型预测结果的相对误差,降幅最大可达17.8%,这体现出增加近壁区域数据权重这一策略的有效性。
引入加权L1SSIM损失函数的另一目的是提高预测结果云图的质量。图14选取了Valid-2数据集中编号为1 500的流场,绘制了不同损失函数训练得到的TCFN模型的流场云图及绝对值误差分布。可以看出相较于采用L1损失函数训练的模型而言,采用加权L1SSIM损失函数得到的流场误差更小。图15展示了该流场的翼型表面无量纲压力分布,可以看到采用加权L1SSIM损失函数得到的流场激波位置更准确,且压力分布更光滑,更符合真实流动特征,从而更加方便在实际工程应用中人工判别翼型质量。
图13不同损失函数训练得到的TCFN模型升阻力系数相对误差
Fig.13Relative errors of lift and drag coefficients for TCFN models trained with different loss functions
图14不同损失函数训练得到的TCFN模型流场云图及绝对值误差
Fig.14Contour of the flow field and absolute value errors of TCFN models trained with different loss functions
图15不同损失函数训练得到的TCFN模型预测翼型表面无量纲压力分布
Fig.15Airfoil surface dimensionless pressure distribution predicted by TCFN models trained with different loss functions
2.3 更进一步泛化性能测试
接下来,TCFN模型和基准模型被应用于RAE2822翼型流场的预测。RAE2822翼型是航空领域常见的超临界翼型之一,经常作为标准算例被用于验证求解器对于超临界翼型流场的计算精度。本文选取Ma=0.76,Re=5×106工况的流场进行预测。
图16呈现了各模型对RAE2822翼型流场的升力系数CL曲线的预测结果,可以看出U-Net模型和TCFN模型都基本能够正确预测升力系数变化的趋势,且对于失速拐点有着较为准确的捕捉,相较而言,TCFN模型的预测结果更加准确。ViT模型虽然在升力系数线性段预测误差较小,但其错误估计了大攻角下的升力系数,这对于失速预测等场景来说是十分不利的。
图17呈现了3°和5°攻角下,各模型预测得到的RAE2822翼型表面无量纲压力分布。可以看到对于3°攻角内插的流场来说,U-Net模型和TCFN模型得到的压力分布基本合理,而ViT模型预测得到的压力分布出现了不合理的抖动。当预测对象变为攻角5°这样的外插数据时,ViT模型结果的异常抖动变得更加剧烈,U-Net模型虽然仍保持了正常的压力分布形态,但激波位置略有偏差。对比来看,TCFN模型的结果分布更合理,且激波位置也更加准确。
图16RAE2822翼型升力系数曲线预测结果
Fig.16Predicted results of lift coefficient curve for the RAE2822 airfoil
然而,值得注意的是,虽然TCFN模型得到了基本正确且优于基准模型的压力分布,但在中部和尾缘附近的压力预测存在一定误差,这使得模型得到的升力系数偏大,这应当是未来对模型进行改进时所重点关注的方向。
图17RAE2822翼型表面无量纲压力分布预测
Fig.17Predicted surface dimensionless pressure distribution for the RAE2822 airfoil
3 结论
本文提出了一种针对超临界翼型流场快速预测的深度学习模型,称为TCFN模型,该模型综合了U-Net模型与Transformer模型的结构,能够在提高预测精度和泛化能力的同时控制模型复杂度。在超临界翼型流场数据集上,将TCFN模型的性能与基准U-Net模型和ViT模型预测结果进行了对比,结果表明TCFN模型可以将基准模型对流场预测的MAE最多减少79.5%,对于升阻力系数的预测误差最多减少90.9%。
此外,针对超临界翼型流场快速预测模型的训练,本文还提出了一种更加综合的损失函数,称为加权L1SSIM损失函数,该损失函数更加针对性地考虑了翼型流场预测中所重点关注的升阻力系数和翼型附近物理量分布等问题,从而得到更有利于实际工程应用的结果。实验结果表明,在相同模型结构和超参数设置下,使用加权L1SSIM损失函数训练的模型升阻力系数预测更加准确,物理量分布更加合理,阻力系数相对误差最多可以减少17.8%。
本文在RAE2822超临界翼型算例上对模型进行了更进一步的泛化能力测试,结果表明即使在外插几何和攻角下,TCFN模型依然能够得到较为合理的流场和翼型表面压力分布,并能够得到相对准确的激波位置,这体现出其对于超临界翼型流场特征的学习和捕捉。然而,在测试过程中TCFN模型也体现出一定程度的误差,如何减小模型在外插数据集上的误差,增强泛化性能,并将其预测推广到三维实际流动中,将是之后相关工作的研究重点。




