(合肥工业大学电气与自动化工程学院合肥230009)
摘要物理信息神经网络(PINNs)将偏微分方程(PDEs)及其定解条件编码进网络中,使PDEs残差最小化的同时逼近定解条件,实现PDEs的求解。由于电磁场计算时存在局部高梯度问题、含源方程引发的训练困难问题和高对比系数界面识别问题等,PINNs在用于电磁场方程求解时训练效率低、计算精度不高,因而目前应用较少。该文对于PINNs在电磁场中的训练困难问题进行理论分析,提出了针对电磁场PDEs形式和神经网络架构的修改方法,实现了基于PINNs的静电场和稳恒磁场求解,计算结果准确性较好。将该方法推广到方程更加复杂的频域涡流场求解中,求解结果表明PINNs可以在复杂的频域方程上保证良好的精度。该研究工作为实现电磁场快速计算提供了新思路。
关键词:物理信息神经网络电磁场数值计算深度学习
目前,深度学习已经在自然语言处理、计算机视觉等领域取得显著性成果[1],例如,ChatGPT是一种基于Transformer的语言模型。深度学习由于其对高维参数空间的强大计算能力,目前已经在电磁场逆问题中实现了应用,成为了电磁优化设计的未来趋势,最终服务于电磁场的快速计算[2]。尽管仅依靠标签数据会使得实施过程变得简单,然而这些基于数据驱动的深度学习模型目前仍存在低精度或非物理解问题[3]。
近年来,深度神经网络更是成为偏微分方程(PartialDifferentialEquations,PDEs)正反问题求解领域的研究热点,M.Raissi等[4]于2019年提出的物理信息神经网络(PhysicsInformedNeuralNetworks,PINNs)被广泛用于多个领域的偏微分方程求解,此方法以下称为标准PINNs。此类使用神经网络参数化PDE解的方法还包括鄂维南院士等[5]基于能量泛函提出的深度里兹方法(DeepRitzMethod,DRM),用于求解各种PDE变分问题;文献[6]依据Petrov-Galerkin方法与神经网络的相似性,将分片多项式的基函数空间更换成神经网络空间,提出了深度伽辽金方法(DeepGalerkinMethod,DGM)并在高维问题上进行了验证。在这些偏微分方程求解的智能算法中PINNs的应用最为广泛。
PINNs的思想是将控制方程作为神经网络的损失函数的一部分,在确保网络输出逼近边界条件(BoundaryConditions,BCs)或观测数据的同时约束其在求解域内满足控制方程。尽管使用神经网络进行PDE的求解的思想早在20世纪90年代已经出现[7],但是出于硬件、算法和软件的原因并没有得到发展。如今得益于计算机并行计算硬件图形处理单元GPU、非凸优化算法的发展以及自动微分方法的部署[8],目前PINNs已经被应用到包括电磁波[9]、声波[10]、流体[11-12]和力学[13-14]等众多领域,并且涌现出众多PINNs架构,如DeepXDE[15]、Modulus[16]和Mindspore[17]等。PINNs的优势是可以直接使用基于链式求导法则的自动微分方法计算时空导数,是一种典型的无网格算法。区别于基于径向基、移动最小二乘法等形函数对于空间位置进行插值拟合,PINNs使用神经网络可以对除时空变量以外的其他变量进行插值,从而直接求解参数化PDE,因此PINNs在高维问题上具备优势,Nvidia公司于2020年将其应用于DGX-1散热器的设计式仿真[18],大幅节省了计算成本。
频率偏好指的是神经网络倾向于优先使用低频或大尺度特征来拟合目标函数,如果目标函数具有低频占优的特性,那么深度学习比较容易取得很好的效果[23]。在电磁场中的高梯度现象属于高频特性的一种,因此考虑数据驱动深度学习中傅里叶特征嵌入神经网络的方法进行解决[24]。
本文对标准PINNs法在正问题中的原理和实施过程做简要介绍。PDE的一般形式为
式中,表示实数域;d为空间维度;和分别为要求解的区域和边界;x(),x()为对自变量x的线性或非线性微分算子。文献[4]提出的标准PINNs法求解PDEs的步骤如下:
首先,建立一个深度神经网络来估计解u(x)。深度神经网络基本架构如图1所示。神经网络的第一部分是线性变换,第层线性变换可以表达为Τ():n-1n,n为第隐藏层中神经元个数,隐藏层层数=1,×××,L,对于每一层的输入z,Τ()可以表述为
式中,Wn×n-1和bn分别为神经网络的权重和偏置参数,被称为可学习参数;W1∈N×1,W2∈1×N为神经网络权重;b1∈N,b2∈1为神经网络偏置。第二部分是非线性激活函数ψ:,PINNs中常用的激活函数有Tanh和Sigmoid。将ψ运用于向量zn进行逐元素运算。第层神经网络被表达为线性变换T()和非线性激活函数ψ的复合,即
图1深度神经网络基本架构
Fig.1Basicarchitectureofdeepneuralnetworks
记:n-1n,L层的神经网络可以被表达为所有的复合。特别地,对于输入特征xn0,一般的L层神经网络可以被表示为
式中,“”表示函数的复合;ΘN代表L层神经网络中所有的可训练参数,Θ={W,b|=1,×××,L},对于全连接神经网络,。
其次,定义PDE和BCs的残差为
式(5)中的导数部分可以通过自动微分方法进行计算[8],该方法可以在深度学习工具如PyTorch[26]和Tensorflow[27]中通过计算图实现。
之后,利用现有的采样策略,如均匀采样、拉丁超立方采样等对空间Ω进行离散化。将采样点输入神经网络中得到估计解,然后将其代入式(5)得到残差估计值f(;Θ)和b(;Θ)。
式中,Nf、NW分别为Ω和W上的采样点个数;、分别为PDE、BCs损失函数;集合指的是各损失项对应的权重,在标准PINNs中ω均设置为1。
标准PINNs中的模型参数包含两部分,一部分是以全连接神经网络为代表的超参数、一般指的是隐藏层神经元层数和每层神经元的个数、求解器的学习率等;另一部分是由于控制方程和边界条件的引入导致的模型参数,主要是各项损失函数权重系数。超参数的概念来自数据驱动方法,在传统计算机视觉任务中,以卷积神经网络等为例,在此类方法中约束条件是以标签数据为代表的逐点约束方法,其大多可以通过调节超参数实现良好的精度。然而,PINNs中存在特有的梯度病理性问题使边界损失项的梯度消失,导致得到满足控制方程的任意解[22]。因此在PINNs中对于权重参数的处理至关重要。本文从减少或者消除边界条件的角度提升PINNs收敛速度和精度。
静电场的泊松方程定解问题如式(9),参考解为式(10)。设求解域(Ω)的几何区域如图2a所示,边界施加0V电压,材料的介电常数为1F/m,并假设内部电荷密度分布函数为r(x,y)=-2p2sin(px)sin(py)。
式中,为参考解;u为电压。
图2几何模型及标量电位结果对比
Fig.2Geometrymodelandcomparisonofscalarpotentialresults
2.1.1PINNs中各损失函数梯度不平衡问题
使用标准PINNs求解以上泊松方程定解问题时出现如下困难:损失函数梯度下降的过程中,与之间往往会存在差异,使得与之间的优化不平衡导致边界条件不能很好地满足,因此需要平衡边界条件与PDEs残差之间的权重系数。针对该问题一般性计算方法的研究很多[30-31],但其因PDE、边界条件类型、实施难度和作用范围各不相同,需要进行合理选择。
2.1.2电磁场中0值边界条件的处理方法
对于电磁场中常见的空气域外边界条件,由于边界形状规则且为齐次BCs,根据文献[30]提出的硬约束方法将Dirichlet边界条件编码进神经网络中,使得边界强制满足,如图3所示,进而在总损失函数中消除边界损失。解的结构如式(11)所示,g(x)为Dirichlet边界条件的右端项,满足式(12),与解析解的结果对比如图3所示,其中为新的估计值。
图3带硬边界的全连接神经网络架构
Fig.3Fully-connectedneuralnetworkswithhardconstraints
使用Adam求解器进行梯度下降,经过式(13)可以计算得出PINNs与解析解之间L2相对误差ε为9.15×10-6,同时边界条件几乎完全满足。由此可见,在边界损失权重参数消除后,PINNs模型可以得到较高的求解精度为
式中,uref为u的参考解;M为采样点个数。
本案例选自文献[20],其拉普拉斯方程的定解问题见式(14),几何模型参考图3a。边界条件式(14)表明解在上边界两端存在尖锐梯度,这里标量电位u从0V跃变至1V,通过文献[20]研究发现标准PINNs不容易训练这类边界条件。
2.2.1PINNs中的跃变边界条件
关于标准PINNs对于高梯度求解困难的原因可以从两方面进行解释:一方面,由于神经网络的学习过程具有谱偏移的特点使其更倾向于学习低频问题[24],这导致神经网络对于高频成分的训练效率和准确性降低,因此需要对标准PINNs的网络架构进行改进以加快学习过程;另一方面,标准PINNs的损失函数权重系数均设置为软边界[4],由于梯度的病理性问题,在反向传播的过程中,损失函数的梯度在上边界和其余边界存在差异,这就会导致由边界与PDEs残差损失组成的多目标优化系统的失衡,使得边界条件不能很好地满足,因此需要对权重系数在每次梯度下降的过程中进行控制。依据以上两方面对神经网络架构进行如下的改进。
首先,参考数据驱动深度学习中对于高梯度问题的常用手段,在神经网络中嵌入傅里叶特征对输入进行处理的过程如式(15)所示,由于本文不涉及神经网络基本理论研究,该方法详细原理见文献[24]。
式中,B∈m×d,其中元素服从N(0,σ2)分布,σ2为协方差,与几何尺寸有关,考虑到将其作为超参数进行调节是困难的,这里将其经验性地选择为最大几何模型尺寸。事实上在数据驱动中仅凭借式(15)有助于但不能完全解决高梯度问题[24],需要通过平衡BCs项与PDE项的损失函数权重系数来解决梯度病理性问题[22]。为实现权重系数的自适应调整,这里使用式(16)计算当前边界损失权重系数,再按照式(17)以移动平均的方法更新下一次迭代的权重系数,使得边界处误差减小[31]。
式中,为上次迭代中的权重系数;和分别为PDE损失和边界损失对所有网络参数Θ梯度的平均值。使用λ来控制一个先前动态权重贡献的衰减速度,λ越小表示上次的贡献要比当前动态权重的贡献大,这使得在训练中的调整是稳定的,本案例中选取λ=0.1。
在施加权重系数平衡方法(式(18)和式(19))后导致网络不收敛,为增强神经网络的收敛性,这里使用文献[32]提出的基于全连接神经网络改进网络架构,其考虑了输入层与每一个隐藏层之间的联系进而增强收敛性,前向传播规则如式(18)~式(22)所示。该架构通过两个变换层W1、b1、W2、b2将傅里叶特征映射到高频特征空间中,之后通过哈达玛积⊙将不同的输入相乘,文献[22]指出此结构提高了训练的准确性和收敛性。
式中,x∈n0,为输入特征个数,这里为空间维数,取;T(z,)可以理解为前向传播的神经网络,该网络的可学习参数集合为{Wz,1,bz,1×××,Wz,L+1,bz,L+1},T(z,)每次前向传播都会考虑输入层的抽象特征T(1)和T(2),它们的可学习参数维度分别为W1∈n1×n0,b1∈n1×1,W2∈n1×n0,b2∈n1×1,n1为第一隐藏层中神经元的个数;这里式(18)和式(19)中的x为经过式(15)后的结果γ(x),同时注意到傅里叶特征并不会影响网络的可训练参数,当前神经网络的参数集合为Θ={W1,b1,W2,b2,Wz,1,bz,1,×××,Wz,L+1,bz,L+1,W,b},选用Adam法进行梯度下降更新Θ参数可以得到结果如图4所示。
图4标量电位结果对比
Fig.4Comparisonofscalarpotentialresults
经过式(13)可以计算得出图4a和图4b中PINNs与FEM解之间的L2误差ε为2.4×10-3,同时边界两端高梯度问题得到解决。训练过程中的损失函数以及逐点误差值如图5所示。图5a中标签与分别指的是PDEs以及BCs的训练损失,由此可见,BCs损失在训练的过程中有效下降至10-7左右,使得跃变BCs合理满足。为与文献[20]相对比,由图5b所示逐点误差可以看出,经过傅里叶特征的嵌入、损失函数权重系数的平衡后,边界附近的误差明显消除,同时区域内部误差几乎为0。
图5训练过程中的损失函数以及逐点误差值
Fig5Lossfunctionandpointbypointerrorvalueduringtraining
设求解域Ω为正方形,代表空气域,内部存在矩形导体,磁导率μ取真空磁导率μ0。通入I=420A的电流,空气域外边界使用0值边界条件。求解空间中矢量磁位u的分布,其定解问题如式(23)所示。
式中,和分别为空气和导体区域的磁导率;为法向导数;u为矢量磁位;Js为源电流密度;表示在界面Γ上存在跃变,被定义为
式(24)中,u(x)为Ω上的分片连续函数,即
式中,和分别为空气和导体区域的矢量磁位。
在磁导率相同的条件下,式(23)自然满足不予以考虑,本案例中的边界处理方法采用2.1节中的0值边界处理方法。
PINNs在面对电磁场中的含源问题(旋度源或散度源)时,在反向传播中,会发生梯度爆炸问题导致网络难以训练。为方便起见,下面以一维泊松方程和单隐藏层神经网络为例进行解释和推导PDE损失项对于网络参数的梯度,其结果同样可以推广到高维和深层神经网络。
考虑式(26)所示的一维泊松方程,Ω是上的有界开集。
单隐藏层全连接神经网络通过前向传播可以得到的估计解为
式中,为(W1x,b1),同样对标量运用多元微分可得
式中,为第i个样本。
因此,由式(30)可以得知,在神经网络初始化和训练过程中,由于源项的作用使得权重参数的初始梯度变得非常大,导致网络无法收敛或者收敛速度非常缓慢。这与深层神经网络中常见的由激活函数引发的梯度爆炸现象原因不同,需要对PDE本身进行处理。
式中,为矢量磁位的无量纲形式;指的是对无量纲位置坐标的导数。在无网格点下,使用PINNs求解式(23)PDE后的空间中矢量磁位分布结果如图7a所示,图7b为FEM参考解,这里只要计算出即可通过式(32)得到原解u(x)。
图6几何模型
Fig.6Geometrymodel
图7矢量磁位结果对比
Fig.7Comparisonofvectormagneticpotentialresults
由图7a与图7b之间的对比可知,在边界损失权重参数消除后,PINNs模型可以得到较高求解精度。经过式(13)可以从图7中计算得出本案例PINNs与FEM解之间L2相对误差ε为2.24×10-2。
设矩形母线依次为A、B、C三线和N线,三相母线中依次通入频率f为50Hz、幅值I为420A的三相正序电流I,其中A相的初始相位为0,其几何模型如图8所示,空气外边界采用磁力线平行边界条件,求解所在空间位置的矢量磁位分布u和涡流损耗密度分布Qe。
该案例中涡流场的控制方程如式(33)所示,界面条件及外边界Dirichlet条件参考式(23)。
式中,为电导率,其取值为3.225×107S/m;ω为角频率,其取值为314rad/s;j为虚数单位。A,B,C和N线矩形导体为金属材料,因此需要对每个导体的标量电位做耦合,其耦合过程如式(34)和式(35)所示。
图8三相涡流场的几何模型
Fig.8Geometrymodelofeddycurrent
式中,Se为每个区域Ωe所对应的面积。由于在每个导体中标量电位相等,因此由式(34)可以得到
频域涡流损耗密度Qe可以通过式(36)进行计算[33]。
式中,|J|为总电流密度的模。PINNs求解以式(23),式(25)组成的微分代数方程。
利用2.1.2节的0值边界处理方法和2.2节的神经网络架构,设置导体材料与空气的相对磁导率相同,于是可以使用同一个神经网络进行表达。在PINNs中将频域量u分解为实部Re(u)和虚部Im(u),这两部分由同一个神经网络经过输出得到。u表示为
由于PINNs是无网格方法,在具体计算时可以通过蒙特卡洛积分法对式(35)中的积分进行离散处理可得
式中,为无量纲角频率,其可以通过以上特征尺度得出。将式(39)的残差作为PDE损失函数,利用TensorFlow提供的自动微分工具对式(39)中的拉普拉斯算子进行计算,使用Adam求解器进行梯度下降得到矢量磁位分布如图9a和图9b所示,可以看到PINNs能够解析涡流场。通过式(36)计算获得电磁损耗密度如图10所示,可以发现N相中存在涡流损耗。
图9矢量磁位结果对比
Fig.9Comparisonofvectormagneticpotentialresults
图10电磁损耗密度
Fig.10Electromagneticlossdensity
由图9a与图9b之间的对比可知,PINNs可以解析受多相交变电流影响而在各自导体中产生涡流的分布情况,经过式(13)运算可得本案例PINNs与FEM解之间矢量磁位的相对L2误差ε为1.3×10-2。由图10a和图10b可知,PINNs解析出的电磁损耗分布情况与FEM法的结果几乎一致,经过式(13)可计算出PINNs的电磁损耗密度与FEM解之间的误差ε为3.3×10-2。
尽管PINNs具备无需网格划分、易于融合观测数据等优势,但目前仍存在训练成本较高、求解精度较低、超参数调节困难等局限性,本文初步将PINNs方法应用于在电磁场分析中,并针对电磁场在PINNs中应用中的典型问题给出相应的解决方法,得到了以下结论:
1)针对边界条件损失项梯度差异引发的训练困难问题,本文分别使用硬边界条件方法和权重自适应方法,通过简单算例与解析解对比证实了消除损失函数中的边界条件损失项可以实现较高的求解精度。
2)对于电磁场中的高数量级源引发的训练困难问题,提出无先验解下无量纲方程的方法进行解决,通过静磁场算例可得矢量磁位的误差量级在10-2左右,证实了无量纲方法处理控制方程可以提高PINNs的求解效率。
3)本文进一步使用PINNs求解频域涡流问题,在导体标量电位耦合与保持区域电流恒定的约束下,通过频域三相涡流场算例可得矢量磁位和电磁损耗密度的误差量级均在10-2左右,证实PINNs方法可以求解较为复杂的频域涡流问题。
参考文献
[1]金亮,尹振豪,刘璐,等.基于残差U-Net和自注意力Transformer编码器的磁场预测方法[J].电工技术学报,2024,39(10):2937-2952.
JinLiang,YiZhenhao,Liulu,etal.MagneticfieldpredictionmethodbasedonresidualU-netandself-attentiontransformerencoder[J].TransactionsofChinaElectrotechnicalSociety,2024,39(10):2937-2952.
[2]张宇娇,赵志涛,徐斌,等.基于U-net卷积神经网络的电磁场快速计算方法研究[J].电工技术学报,2024,39(9):2730-2742.
ZhangYujiao,ZhaoZhitao,Xubin,etal.FastcalculationmethodofelectromagneticfieldbasedonU-netconvolutionneuralnetwork[J].TransactionsofChinaElectrotechnicalSociety,2024,39(9):2730-2742.
[3]ZuoKuijun,YeZhengyin,ZhangWeiwei,etal.Fastaerodynamicspredictionoflaminarairfoilsbasedondeepattentionnetwork[J].PhysicsofFluids,2023,35(3):037127.
[4]RaissiM,PerdikarisP,KarniadakisGE.Physics-informedneuralnetworks:adeeplearningframeworkforsolvingforwardandinverseproblemsinvolvingnonlinearpartialdifferentialequations[J].JournalofComputationalPhysics,2019,378:686-707.
[5]EWeinan,YuBing.Thedeepritzmethod:adeeplearning-basednumericalalgorithmforsolvingvariationalproblems[J].CommunicationsinMathematicsandStatistics,2018,6(1):1-12.
[6]SirignanoJ,SpiliopoulosK.DGM:adeeplearningalgorithmforsolvingpartialdifferentialequations[J].JournalofComputationalPhysics,2018,375:1339-1364.
[7]LagarisIE,LikasA,FotiadisDI.Artificialneuralnetworksforsolvingordinaryandpartialdifferentialequations[J].IEEETransactionsonNeuralNetworks,1998,9(5):987-1000.
[9]FujitaK.Physics-informedneuralnetworkswithdataandequationscalingfortimedomainelectromagneticfields[C]//2022Asia-PacificMicrowaveConference(APMC),Yokohama,Japan,2022:623-625.
[10]ShuklaK,DiLeoniPC,BlackshireJ,etal.Physics-informedneuralnetworkforultrasoundnondestructivequantificationofsurfacebreakingcracks[J].JournalofNondestructiveEvaluation,2020,39(3):61.
[11]MaoZhiping,JagtapAD,KarniadakisGE.Physics-informedneuralnetworksforhigh-speedflows[J].ComputerMethodsinAppliedMechanicsandEngineering,2020,360:112789.
[12]ChenDonglin,GaoXiang,XuChuanfu,etal.FlowDNN:aphysics-informeddeepneuralnetworkforfastandaccurateflowprediction[J].FrontiersofInformationTechnology&ElectronicEngineering,2022,23(2):207-219.
[13]唐和生,何展朋,廖洋洋,等.基于物理驱动深度迁移学习的薄板力学正反问题[J].工程力学:1-10.
TangHesheng,HeZhanpeng,LiaoYangyan,etal.Forwardandinverseproblemsofthinplatemechanicsbasedonphysics-informeddeeptransferlearningfor[J].EngineeringMechanics:1-10.
[14]唐明健,唐和生.基于物理信息的深度学习求解矩形薄板力学正反问题[J].计算力学学报,2022,39(1):120-128.
TangMingjian,TangHesheng.Aphysics-informeddeeplearningmethodforsolvingforwardandinversemechanicsproblemsofthinrectangularplates[J].ChineseJournalofComputationalMechanics,2022,39(1):120-128.
[15]LuLu,MengXuhui,MaoZhiping,etal.DeepXDE:adeeplearninglibraryforsolvingdifferentialequations[J].SIAMReview,2021,63(1):208-228.
[16]HennighO,NarasimhanS,NabianMA,etal.NVIDIASimNet:anAI-acceleratedmulti-physicssimulationframework[C]//InternationalConferenceonComputationalScience,Cham,Springer,2021:447-461.
[17]HuaweiMindSporeAIdevelopmentframework[M]//Artificialintelligencetechnology.Singapore:Springer,2023:137-162.
[18]阮江军,张宇,张宇娇,等.电气设备电磁多物理场数值仿真研究与应用[J].高电压技术,2020,46(3):739-756.
RuanJiangjun,ZhangYu,ZhangYujiao,etal.Numericalsimulationresearchandapplicationsofelectromagneticmultiphysicalfieldforelectricalequipment[J].HighVoltageEngineering,2020,46(3):739-756.
[19]仲林林,吴冰钰,吴奇.基于元学习的气体放电等离子体电子Boltzmann方程数值求解[J].电工技术学报,2024,39(11):3457-3466.
ZhongLinlin,WuBingyu,WuQi.NumericalsolutionofelectronBoltzmannequationingasdischargeplasmasbasedonmetalearning[J].TransactionsofChinaElectrotechnicalSociety,2024,39(11):3457-3466.
[20]KhanA,LowtherDA.Physicsinformedneuralnetworksforelectromagneticanalysis[J].IEEETransactionsonMagnetics,2022,58(9):7500404.
[21]Beltrán-PulidoA,BilionisI,AliprantisD.Physics-informedneuralnetworksforsolvingparametricmagnetostaticproblems[J].IEEETransactionsonEnergyConversion,2022,37(4):2678-2689.
[22]WangSifan,TengYujun,PerdikarisP.Understandingandmitigatinggradientflowpathologiesinphysics-informedneuralnetworks[J].SIAMJournalonScientificComputing,2021,43(5):A3055-A3081.
[24]TancikM,SrinivasanPP,MildenhallB,etal.Fourierfeaturesletnetworkslearnhighfrequencyfunctionsinlowdimensionaldomains[C]//Proceedingsofthe34thInternationalConferenceonNeuralInformationProcessingSystems,Vancouver,BC,Canada,2020:7537-7547.
[27]AbadiM,BarhamP,ChenJ,etal.{TensorFlow}:asystemfor{Large-Scale}machinelearning[C]//12thUSENIXsymposiumonoperatingsystemsdesignandimplementation(OSDI16).2016:265-283.
[28]赵洪山,孙京杰,彭轶灏,等.基于多尺度窗口和区域注意力残差网络的无线电力终端身份识别方法[J].电工技术学报,2023,38(1):107-116.
ZhaoHongshan,SunJingjie,PengYihao,etal.Wirelesspowerterminalidentificationmethodbasedonmultiscalewindoweddeepresidualnetwork[J].TransactionsofChinaElectrotechnicalSociety,2023,38(1):107-116.
[29]FeiYun,RongGuodong,WangBin,etal.ParallelL-BFGS-BalgorithmonGPU[J].Computers&Graphics,2014,40:1-9.
[30]LuLu,PestourieR,YaoWenjie,etal.Physics-informedneuralnetworkswithhardconstraintsforinversedesign[J].SIAMJournalonScientificComputing,2021,43(6):B1105-B1132.
[31]JinXiaowei,CaiShengze,LiHui,etal.NSFnets(Navier-Stokesflownets):physics-informedneuralnetworksfortheincompressibleNavier-Stokesequations[J].JournalofComputationalPhysics,2021,426:109951.
[33]曾非同,关向雨,黄以政,等.基于多尺度多物理场的油浸式变压器流动-传热数值研究[J].电工技术学报,2020,35(16):3436-3444.
ZengFeitong,GuanXiangyu,HuangYizheng,etal.Numericalstudyonflow-heattransferofoil-immersedtransformerbasedonmultiple-scaleandmultiple-physicalfields[J].TransactionsofChinaElectrotechnicalSociety,2020,35(16):3436-3444.
ZhangYujiaoSunHongdaZhaoZhitaoXuBinHuangXiongfeng
(SchoolofElectricalandAutomationEngineeringHefeiUniversityofTechnologyHefei230009China)
AbstractInrecentyears,theadventoflanguagemodelssuchasGPTandSorahasunderscoredthecomputationalprowessofdata-drivenmodelswithinhigh-dimensionalparameterspaces.Thishaspositionedthemastheforefrontofelectromagneticoptimizationdesign,andservesthefastcomputationofelectromagneticfields.However,theefficacyofthesedata-drivenmodelshingessignificantlyonlabeleddata,andtheygrapplewithchallengessuchasoverfittingandalackofphysicalunderstanding.Divergingfromnaturallanguageprocessing(NLP),physicalfieldsareusuallydescribedbyasetofpartialdifferentialequations,theemergenceofphysicsinformedneuralnetworks(PINNs)addressesthisgap.
ThecoreconceptofPINNsinvolvesincorporatingcontrolequationsintotheneuralnetwork'slossfunction.Thisintegrationensuresthatthenetworkoutputapproximatesboundaryconditionswhileadheringtothecontrolequationswithinthesolutiondomain.Nevertheless,PINNsencounterhurdlessuchaslocalhighgradientissues,trainingcomplexitiesarisingfromsourceequations,anddifficultiesinidentifyinginterfaceswithhigh-contrastcoefficientsinelectromagneticfieldcomputations.Consequently,thetrainingefficiencyandcomputationalaccuracyofPINNsinsolvingelectromagneticfieldequationsremainsuboptimal,limitingtheircurrentapplications.
InordertousePINNsforthestabilizationtrainingofelectromagneticfields,thispaperfirstlyexploresamethodforhandlingzero-valueboundaryconditionsinelectromagneticfieldsbyemployingafullyconnectedneuralnetworkarchitecturewithhardboundaries.Thisapproacheffectivelyeliminatesboundarylossinthetotallossfunction.Takingelectrostaticfieldequationswithsourcesasanillustration,theL2errorusingthismethodagainsttheanalyticalsolutionis9.15×10-6,withalmostcompletesatisfactionofboundaryconditions.
Recognizingtheneuralnetwork'sinclinationtoprioritizelow-frequencyorlarge-scalefeatures,thepaperintroducesembeddedFourierfeaturestoprocessnetworkinputs.Additionally,anadaptiveadjustmentstrategyforweightcoefficientsisproposed.Toenhanceconvergence,animprovedfullyconnectedneuralnetworkframeworkisutilized,consideringconnectionsbetweentheinputlayerandeachhiddenlayer.Thisframeworkisexemplifiedwithboundaryconditionsinvolvingleapfrog,resultinginasubstantiallyreducedlossofabout10-7duringtraining,withnearlyzerointernalerror.
TomitigatethegradientexplosionissueinPINNscausedbyhigh-ordersourcetermsduringelectromagneticfieldtraining,thisstudyformulatesdimensionlessequationsfortheelectromagneticfieldwithoutpriorconditions.Theseequationsareincorporatedintotheneuralnetworkasanovellossfunction.TherelativeL2errorbetweenthePINNsandtheFEMsolutionismeasuredat2.24×10-2forthestaticmagneticproblem.
Expandingthistrainingmethodologytothefrequency-domaineddycurrentfield,thestudytackleseddycurrentscenarios.Solvingthecorrespondingdifferential-algebraicequationswithPINNsrevealsthedistributionofvectormagneticpotentialsandelectromagneticlossdensityinthefrequency-domaineddycurrentfield.TheproposedrelativeL2errorεforvectormagneticpotentialsbetweenPINNsandFEMsolutionis1.3×10-2.TheresolvedelectromagneticlossesbyPINNscloselymatchtheFEMmethod,withanerrorof3.3×10-2.
Inconclusion,thispaperpresentstailoredsolutionsfortypicalchallengesinapplyingelectromagneticfieldswithPINNs,significantlyenhancingtrainingefficiency,reducingcosts,andintroducinginnovativeapproachesforswiftelectromagneticfieldcalculations.
keywords:Physicalinformedneuralnetworks,numericalcomputingofelectromagneticfields,deeplearning
中图分类号:TM15
DOI:10.19595/j.cnki.1000-6753.tces.231063
国家自然科学基金资助项目(523770058)。
收稿日期2023-07-04
改稿日期2023-09-04
作者简介
张宇娇女,1978年生,教授,博士生导师,研究方向为电气设备多物理场建模与仿真、电磁多物理场快速计算方法、基于数字孪生技术的电气设备故障诊断与健康寿命管理。
E-mail:zhangyujiao@hfut.edu.cn
孙宏达男,1998年生,硕士研究生,研究方向为电气设备多物理场建模与仿真、电磁多物理场快速计算方法。