基于迁移学习和降噪自编码器

(1.哈尔滨理工大学测控技术与通信工程学院哈尔滨1500802.黑龙江大学电子工程学院哈尔滨150006)

摘要针对锂离子电池退化数据噪声大、数据量少以及不同生命时期的退化趋势不同而导致的模型预测精度低、泛化能力差等问题,从数据预处理、预测模型的构建与训练三方面展开研究:首先结合变分自编码器(VAE)和生成对抗网络模型(GAN)构建VAE-GAN模型生成多组数据,实现电池的退化数据增强;然后结合降噪自编码器(DAE)和长短时记忆(LSTM)神经网络构建DAE-LSTM模型进行数据降噪和容量预测,为了降低模型参数,此过程中的数据降噪和预测共享同一个损失函数;最后先利用生成数据对DAE-LSTM模型进行预训练,再利用真实数据对其进行迁移训练。在CACLE和NASA公开数据集进行性能测试,实验结果表明该文所提方法精度高、鲁棒性强,能够有效提高锂离子电池剩余寿命的预测效果。

关键词:锂离子电池剩余寿命预测降噪自编码器长短时记忆神经网络迁移学习

锂离子电池凭借其能量密度高、使用寿命长且绿色环保等特点,被广泛应用于消费电子、新能源汽车及航空航天领域[1]。在面对不同的工作环境时,频繁充放电及环境温度变化等因素都可能会导致锂离子电池的使用寿命受到影响[2]。电池的老化主要表现在容量的减少及等效内阻的增加上[3]。当电池达到其规定的寿命阈值时,便要进行及时更换,以保证电池及其运行系统的安全性[4]。因此,锂离子电池剩余使用寿命(RemainingUsefulLife,RUL)的精准预测十分必要。

由于锂离子电池在退化过程中常出现容量回升现象[12],并且实验过程中的电磁干扰、充放电倍率差异等因素都会导致电池容量数据中包含噪声,这对于数据预测模型的建立具有极大的干扰,所以电池容量数据的降噪处理是有必要的。QiaoJianshu等[13]通过自适应双指数模型(AdaptiveBi-exponentialModelSmooth,ABMS)和完全自适应噪声集合经验模态分解(CompleteEnsembleEmpiricalModeDecompositionwithAdaptiveNoise,CEEMDAN)算法对电池容量数据进行了降噪处理,并利用LSTM网络进行容量预测,对比未降噪数据的预测结果,进行数据预处理的预测模型展现出更高精度的预测能力。WangZhuqing等[14]通过局部切线空间对齐(LocalTangentDpaceAlignment,LTSA)的方法进行电池容量数据的特征提取,降低退化数据中的波动数据,并利用自适应滑动窗口LSTM模型进行寿命预测,实验结果表明,进行数据降噪的预测模型在预测RUL时更加准确。尽管现有的大多数预测模型都展示出了不俗的预测能力,但是他们普遍存在以下三个问题:

1)预测模型局限性:由于锂离子电池不同寿命阶段的退化速度不同,只采用局部退化数据进行寿命建模具有一定的局限性。

2)降噪预测关联性:大多数的预测方法中,数据降噪和容量预测常常分开处理,被视为两个独立的任务,这忽略了二者之间的关联性。

3)退化数据稀少性:基于深度学习的训练方法需要有一定的数据量作为支撑,但现实的电池退化数据有限,这对于预测模型的建立具有一定的影响。

为了降低上述问题对结果的影响,本文提出基于迁移学习的DAE-LSTM锂离子电池RUL预测模型。首先,结合变分自编码器(VariationalAutoencoder,VAE)和生成对抗网络(GenerativeAdversarialNets,GAN)构建VAE-GAN数据生成模型:将小样本全周期电池退化数据输入模型中,VAE的编码器会先提取输入数据的分布状况,然后利用解码器和判别网络实现容量数据的再生,既弥补了VAE模型生成数据的单一性,又解决了GAN模型难以收敛的问题,最终生成多组电池全周期退化数据;其次,利用降噪自编码器(DenoisingAutoencoder,DAE)和LSTM网络构建容量预测模型DAE-LSTM:降噪自编码器对利用滑动窗口分割后的输入数据进行降噪处理,数据输入编码器前会被添加高斯白噪声,以使得整体模型的鲁棒性更强,然后压缩成隐藏向量传输到LSTM网络当中。多层的LSTM网络学习隐藏向量之间的时序特征,通过全连接层映射为容量预测值。为了使模型具有更好的泛化能力,本文提出一个全新的目标函数用来连接数据降噪和寿命预测两个任务,使其能够在学习过程中同时得到优化。

本文通过消融试验,找到最优的训练方式。首先利用VAE-GAN模型生成的退化数据对DAE-LSTM预测模型进行预训练,然后将除被测电池外的真实退化数据对预测模型的全部网络层进行微调,使模型更加适应真实数据的分布状况,更具针对性。此外,本文增设基础模型的对照试验,通过对比未降噪处理和未数据增强的模型预测结果,验证了DAE-LSTM模型的优越性。

本文采用两种电极材料在室温环境下的锂离子电池数据集进行模型性能验证。

第一组数据由马里兰大学CALCE研究中心的CS2_35、CS2_36、CS2_37和CS2_38四组电池的容量退化数据组成[15]。CS2系列电池属于钴酸锂电池,以碳作为导电添加剂混合的LiCoO2为阳极,以与聚丙烯氟化物结合在一起的层状石墨作为阴极,额定容量为1.1A×h。试验过程为:首先以0.55A的电流恒流充电,直至截止电压4.2V;然后恒压保持,直到充电电流降至0.05A;最后以0.55A的电流进行恒流放电,将电压降至2.7V。锂离子电池寿命循环试验的结束条件为电池容量降为额定容量的70%。对于此数据集,阈值容量设置为其额定容量的80%[16]。

第二组数据由NASAPcoE研究中心的B5、B6、B7、B18四组电池的容量退化数据组成[17]。NASA电池组属于三元锂电池,其阳极材料为镍钴铝酸锂,阴极材料为石墨,额定容量为2A·h。试验过程为:首先以1.5A恒定电流充电,直至截止电压4.2V;然后恒压保持,直到充电电流降至0.02mA;最后以2A恒定电流进行放电,直到B5、B6、B7、B18电池电压分别降至2.7V、2.5V、2.2V和2.5V时停止。对于此数据集,阈值容量设置为其额定容量的70%,即1.38A·h。由于B7号电池容量始终大于1.38A·h,所以其阈值容量设置为其额定容量的74.5%,即1.47A·h[18]。图1为两组数据的容量衰减曲线。

深度学习网络需要有足够多分布均衡的数据作为支撑才能够发挥较好的效果,但这两组数据集的数据量均较小,特别是NASA数据集,每个电池的退化数据不足200个,仅使用这些数据进行深度学习建模是远远不能满足建模要求的,因此需要提出一种数据增强的方法来解决数据量少的问题。

图1电池容量衰减曲线

Fig.1Decaycurvesofbatterycapacity

深度学习领域常使用的生成模型包括VAE[19]和GAN[20],虽然二者都可进行数据再生,但是各自应用起来都有一定的缺陷。VAE模型可以通过重采样得到原始数据的分布状况,但生成数据的多样性较低;GAN模型生成数据更具多样性,但是训练过程异常困难,生成器和判别器难以同时收敛。因此,本文结合VAE模型的数据生成和GAN模型的对抗学习机制,提出VAE-GAN模型。

VAE-GAN模型总共分为三部分,分别为编码网络、解码网络(生成网络)和判断网络,对应VAE模型的Encoder、Decoder和GAN模型的Discriminator部分。可以理解为在GAN网络的基础上增添了真实数据的编码过程,利用具有先验信息的隐式z代替原本输入生成器的随机向量,使模型的表达能力大大提升,VAE-GAN模型结构如图2所示。

编码网络由三个全连接层构成,第一个全连接层对输入的高维数据进行下采样操作,激活函数采用Relu;其余两个全连接层分别将下采样后的样本映射成两个低维的参数特征,即正态分布的均值和方差。编码网络的损失函数为KL散度,用来衡量隐式向量分布和标准正态分布之间的差异,KL损失函数为

图2VAE-GAN结构

Fig.2StructurediagramofVAE-GAN

式中,和分别为编码网络输出的均值和方差。式(1)表示计算两个近似分布的KL散度,这里用来表示本文所求的数据分布与标准正态分布N(0,1)之间的KL散度。

解码网络(生成网络)由两层全连接网络构成,这两层网络的参数设置和编码网络的参数设置相反,将输入的低维隐藏变量进行特征放大,最终生成和输入数据相同尺寸的生成数据,两个网络层间采用Relu激活函数,最终的输出层采用Sigmoid激活函数。生成网络的优化目标既要保证最小化生成样本与真实样本之间的特征损失,还要保证生成数据能够欺骗判别网络,其损失函数为

式中,右侧第一项表示编码器的损失重构,和为真实样本和预测值;z为参数重构生成的隐藏变量,服从p(z)分布;E表示期望;G(z)为生成样本;D(×)为判别网络对于生成数据的真伪判断。

判别网络由2个卷积层和3个全连接层组成,每个网络层之间的激活函数采用LeakyRelu,输出层通过Sigmoid激活函数输出真伪标签,判别网络的损失函数采用更加稳定的最小二乘损失函数为

式中,表示真实样本服从分布。

VAE-GAN模型利用VAE的编码优势,将蕴含先验信息的隐藏向量代替随机向量输入给GAN模型进行数据生成,缓解模型训练不收敛的问题。GAN网络通过对抗学习,改善生成数据的质量,完成对VAE模型的改善,二者相辅相成。

VAE-GAN模型训练时的迭代次数设置为500次,由于总共只有四组数据,所以Batchsize设置为2,采用Adam优化器进行参数优化,学习率设置为1×10-4,训练前需要对输入数据进行归一化,否则生成网络的输出层所连接的Sigmoid激活函数无法对数据进行完整的映射,输出数据可进行反归一化还原到原来的值域。具体参数设置见表1,其中神经元个数括号中的数值分别代表当前网络的输入节点数和输出节点数。

表1VAE-GAN模型参数设置

Tab.1ParametersetupofVAE-GAN

网络名称结构组成主要参数输出尺寸编码网络输入层神经元个数630630全连接层(隐层)神经元个数(630,300)300全连接层(输出)神经元个数(300,150)150全连接层(输出)神经元个数(300,150)150生成网络输入层150全连接层+Relu神经元个数(150,300)300全连接层+Sigmoid神经元个数(300,630)630判别网络输入层630一维卷积+LeakyRelu卷积参数(1,32,12)32×619一维卷积+LeakyRelu卷积参数(32,1,12)1×608全连接层+Relu神经元个数(630,256)256全连接层+Relu神经元个数(256,256)256全连接层+Sigmoid神经元个数(256,1)1

本文利用VAE-GAN模型分别对两组数据集各生成十组完整的退化数据,如图3所示。为了衡量生成数据与真实数据之间的相似性,采用文献[21]中的相似度计算法,求解真实数据与生成数据的方均根误差并对其进行归一化,结果越接近1表示二者的相似程度越高,相似度计算式为

图3VAE-GAN扩充数据

Fig.3VAE-GANexpandeddata

式中,为生成样本。

对比每组电池和所有生成数据之间的平均相似度,结果见表2。可以看出,十组生成样本与每组真实样本的平均相似度都达到了0.95以上,可以有效表示出锂离子电池真实的退化趋势,并且相较原始数据而言,生成数据更加符合产品退化的浴盆曲线[22],适合用来进行后续锂离子电池RUL预测的模型训练。

表2生成数据相似度计算

Tab.2Similaritycalculationofgenerateddata

序号平均相似度序号平均相似度CS2_350.9668B50.9656CS2_360.9530B60.9359CS2_370.9712B70.9672CS2_380.9755B180.9248

容量大小可以直接反映锂离子电池的老化情况,但电池的老化过程中容易出现容量回升现象,并且试验过程中的电磁干扰、充放电倍率差异等因素会导致测得的电池容量数据波动较大,这为电池RUL的精准预测增加了许多难度。因此,本文基于数据降噪和容量预测任务设计DAE-LSTM预测模型,模型包括两部分:DAE数据降噪和LSTM容量预测,两个任务在一个模型框架中实现。DAE-LSTM网格架构如图4所示。

图4DAE-LSTM网络架构

Fig.4DAE-LSTMnetworkarchitecture

降噪自编码器(DAE)是一种具有数据降噪功能的特征提取算法[23],DAE的编码器将充满噪声的输入数据压缩成低维向量,尽量保留数据的原始特征,然后解码器将低维向量还原成退化趋势明显的原始数据,本文采用该算法作为容量数据的降噪算法。

DAE的编码器在对原始数据进行压缩前,会向输入数据中加入高斯白噪声使其变成输入向量,目的是为了增加模型的鲁棒性和非线性表达能力。编码器会将输入数据压缩成低维的中间向量,过程表示为

式中,W为编码器权重矩阵;b为偏置项;a(×)为激活函数;z为压缩而成的隐藏向量。

解码器进行信息重构,将携带原始数据信息的中间向量映射成与输入数据尺寸相同的输出向量,过程可表示为

式中,为解码器的权重矩阵;为偏置项;为激活函数;为解码得到的输出向量。

为了增加网络的稀疏性,缓解过拟合现象的出现,选择Relu函数作为编码器和解码器中隐藏层的激活函数。为了有效地将输出数据映射到有效的值域内,输出层的激活函数选择Sigmoid函数。故此,DAE部分的损失函数定义为

锂离子电池的容量退化过程是一个具有时序特性的动态过程,当前时刻的容量与之前多个历史时刻的退化容量均存在依赖关系。LSTM网络的隐藏层具有记忆功能,能够分析不同时刻容量的时序关系,因此本文将LSTM网络用于单个锂离子电池容量的预测任务。

相较于循环神经网络,LSTM网络给原始的隐藏层ht添加了一个单元状态ct,单元状态ct内部设置了三个类似于开关的门机制,能够控制状态单元内信息流的更新与遗忘[24],具体公式为

式中,it、ft和ot分别代表输入门、遗忘门和输出门的激活向量;xt和ht分别表示当前时刻的输入和隐藏状态;W和b分别代表网络中需要学习的权重矩阵和偏置向量;、为单元的中间状态和输出状态;sg为Sigmoid激活函数。LSTM的神经元内部结构框图如图5所示。

图5经典LSTM框图

Fig.5ThediagramofLSTM

容量预测阶段将DAE的Encoder生成的隐藏向量z作为输入数据,通过LSTM层和全连接层建立预测数据与隐藏向量z之间的映射关系,通过反向传播优化模型参数,完成容量预测任务。

本文提出的DAE-LSTM模型没有将数据降噪和预测任务分割开来,而是提出一个新的损失函数,在训练过程中对两项任务同时进行优化,最大程度地保证数据降噪和容量预测之间的关联性。方均根误差(RootMeanSquareError,RMSE)作为统一的损失重构函数,进行降噪和预测部分的损失评估,DAE-LSTM模型完整的损失函数为

式中,为用来平衡两个任务之间的优化力度;W(×)为正则化项;l为正则化参数;q为模型参数。DAE-LSTM模型的参数设置见表3。参数均为网格搜索优化结果,详见后文。

表3DAE-LSTM模型参数

Tab.3ParametersetupofDAE-LSTM

网络名称结构主要参数输出尺寸降噪网络输入层神经元个数6464噪声层Noiselevel(0.01)64编码层Linear(64,32)32解码层Linear(32,64)64预测网络LSTMLSTM(32,64,2)1×1×64输出层Linear(64,1)1

锂离子电池RUL预测方法,是将容量数据利用滑动窗口进行数据分割,保留相邻容量间的关联性,并将数据变为有监督学习的形式供模型训练。设置适当的迭代步长,将预测数据替换到训练数据中并不断迭代,最终可以获得长序列的预测结果。样本生成过程如图6所示。

图6滑动窗口结构

Fig.6Architectureoftheslidingwindow

锂离子电池的寿命退化曲线是非线性的,其寿命前中期的退化速度低于寿命后期的退化速度,单凭某一阶段的退化数据训练模型具有局限性。因此,本文为提高预测精度采用多组全周期退化数据训练模型。首先通过VAE-GAN生成十组电池退化数据进行数据增强,然后利用迁移学习降低生成数据与实际数据的差异。

在迁移学习中,首先会用大量数据训练一个基础模型,面对新任务时,基础模型的网络参数会作出针对性的修改。常见的迁移策略有两种:一种是训练基础模型的输出层;另一种是训练基础模型的全部层。但不论哪种迁移方式,都要用较小的学习率进行训练,充分利用模型预训练时学习到的知识。

3.2.1基础模型

迁移学习的难点在于迁移策略的选择上,考虑锂离子电池RUL预测的特殊性,本文采取的迁移策略如下:首先利用生成的十组数据对模型进行预训练;然后利用真实退化数据对模型进行微调,使得模型能够适应真实电池退化数据的噪声分布状况和退化趋势。这样的训练方法能够保证模型从大量的先验数据中学习大概的退化趋势,然后通过针对性的训练保证模型能够适应真实的退化情况。

表4超参数空间和最优值

Tab.4Hyperparameter’rangeinhyperparameterspaceandopitimalvalues

超参数范围数值Inputsize[16,32,64]64Lr[0.001,0.0001,0.00001]0.0001Numlayers[1,2,4]2Hiddendim[16,32,64]64Noiselevel[0.001,0.01,0.1]0.01alpha[0.001,0.01,0.1]0.01

3.2.2迁移策略

基础模型训练完毕后,需要确定合适的迁移策略,保证迁移学习的效果最佳。本文采用留一法训练全部网络层的迁移方式,完整的电池RUL预测流程如图7所示。

图7电池RUL预测流程

Fig.7PredictionflowchartofbatteryRUL

实际中尝试过多种迁移策略,包括:①只训练输出层,冻结其他网络层;②训练VAE部分和输出层,冻结LSTM网络层;③训练全部网络层。实验结果表示训练全部网络层的迁移方式最优,同时修改数据降噪和预测部分的网络权重,既能够使模型适应真实数据的噪声分布,又能学习真实数据的退化趋势,并且训练方式较为简单,不需要再进行额外的超参数优化,只需要降低迁移训练时的学习率即可。因此,本文将迁移学习率设置为1×10-5,迭代次数为1500次。

本文的模型评价指标采用回归问题中常用的平均绝对误差(MAE)、方均根误差(RMSE),另外引入针对锂离子电池容量预测任务的RUL误差RE(relativeerror)和相对精度Pre,分别为

(11)

(12)

式中,和分别为第i次循环时锂离子电池的真实容量和预测容量;表示真实容量的平均值;RULpred和RULtrue分别为电池容量达到失效阈值时,剩余寿命的预测值和实际值。在进行容量预测任务时,Pre为主要的评价指标。

为了验证本文提出的基于迁移学习和DAE-LSTM方法(M3)的可靠性,从训练数据和网络结构上设计了两组对照试验。M1为未经迁移学习的LSTM方法;M2为未经迁移学习的DAE-LSTM方法。通过M1和M2验证DAE-LSTM模型的优越性;通过M2和M3验证数据增强的优越性。评价指标为MAE、RMSE、RE和Pre,其中RE和Pre作为主要的参考目标。

4.2.1CALCE数据验证

首先在CALCE电池数据集上进行实验,每个测试电池设置两个不同的预测起点,分别为第364次和第464次循环。表5和表6为不同起点实验结果。

表5CACLE数据集在364次循环的实验结果

Tab.5ExperimentalresultsofCACLEbatteriesat364cycles

电池组方法REMAERMSEPreCS2_35M1250.02340.02700.8469M2250.02370.02740.8469M3130.00960.01230.9177CS2_36M1260.04500.05500.7955M2120.03260.04070.9091M360.01560.01900.9531CS2_37M1210.01570.02210.8937M2200.03650.04160.8907M330.00900.01060.9892CS2_38M1310.01520.02040.8525M2210.02160.02510.8991M350.00970.01160.9763

观察评价指标可以看出,M3方法的所有评价指标在绝大部分任务中均为最优值,RE和Pre值表明其预测精度高;MAE和RMSE表明退化曲线拟合情况好。CS2_35号电池在364预测起点前有一个幅度较大容量波动状况,对预测结果产生较大影响,但是M3方法仍然取得了较好的预测效果。CS2_36号电池的退化曲线的单调性更强,不符合产品退化时中期退化慢、前期和后期退化快的特点,与其他数据相差较大,所以三种方法在464起点均有较大误差。图8~图11为三种方法在不同预测起点的迭代曲线。

表6CACLE数据集在464次循环的实验结果

Tab.6ExperimentalresultsofCACLEbatteriesat464cycles

电池组方法REMAERMSEPreCS2_35M1100.00930.01220.8275M2140.00680.00830.7586M360.00950.01260.8966CS2_36M1330.03330.0371—M2750.05690.0617—M3410.03920.0358—CS2_37M1130.01230.01570.8571M230.00980.01150.9670M310.00950.01090.9890CS2_38M160.01110.01240.9439M210.01340.01570.9906M320.01560.01790.9813

图8CS2_35号电池RUL预测结果

Fig.8RULpredictionresultsofCS2_35

图9CS2_36号电池RUL预测结果

Fig.9RULpredictionresultsofCS2_36

图10CS2_37号电池RUL预测结果

Fig.10RULpredictionresultsofCS2_37

图11CS2_38号电池RUL预测结果

Fig.11RULpredictionresultsofCS2_38

观察容量退化曲线可以看出,M3方法可以准确地捕捉电池容量的退化趋势。不同预测起点的预测结果表明,起始预测位置越靠近失效阈值,其预测精度越高,表明模型对于寿命后期退化趋势明显的数据,具有更加敏锐的识别能力。M1和M2方法的实验结果表明,加入降噪部分的DAE-LSTM方法可以有效地减少噪声干扰,对退化数据进行准确的退化分析;M2和M3方法的实验结果表明,进行数据增强是有必要的,通过生成数据预训练模型能够有效地缓和模型的过拟合现象,并且对电池的整体退化趋势有更精准的把控。

CALCE的电池退化趋势都有较大的起伏,难以用简单的线性关系表示,这对模型的鲁棒性要求极高。因此从预测结果中可以看出,本文的预测方法具有较高的鲁棒性和预测精度。

4.2.2NASA数据验证

为了全面展示M3方法的适应性,本文在数据量更少的NASA数据集上进行验证。数据增强实验见1.3节,由于NASA数据的波动情况较大且数据长度较小,所以Noiselevel设为0.008;Inputsize设为48;Batchsize设为168,其他参数不变。预测起点设为60,评价指标选择MAE、RMSE、R2和Pre。为了提高说服力,增设100次运行结果的RUL概率密度函数和90%置信区间。图12为三种方法在NASA四块电池上的迭代曲线,表7为所有的实验结果。

图12NASA电池RUL预测结果

Fig.12PredictionresultsforNASAbatteries

表7NASA数据集实验结果(起点为60)

Tab.7ExperimentalresultsofNASAbatteries(thestartingpointis60)

电池M1M2M3REMAERMSEPreREMAERMSEPreREMAERMSEPreB5350.05940.68410.437590.02870.03410.887520.02240.02860.9705B6170.04900.05360.7344100.06440.07090.812530.02480.03090.9444B790.01470.02010.892960.01690.02170.928620.01680.02020.9762B18330.07500.08060.3529140.04470.0490.725530.02460.03760.9608

观察评价指标和退化曲线可以看出,M3方法在NASA数据上同样具有优秀的预测精度和稳定性,其MAE、RMSE、R2和Pre四个评价指标均为对比方法中的最优值。表明本文所提方法具有良好的适应性,在不同的数据集上展现出较强的泛化能力。

另外,由于B18电池在预测起点前的波动严重,未加降噪的M1方法预测效果格外糟糕,但M3方法仍然可以精准地捕捉到电池的退化趋势,这表明DAE部分具有极强的抗干扰能力,展现出降噪和预测阶段同处一个框架的统一性和关联性。表8为所有NASA数据集100次RUL预测结果90%置信区间。

表8NASA数据集的RUL90%置信区间(100次运行结果)

Tab.8The90%confidenceinterval(100runresults)ofNASAbatteries

电池置信区间B5[133,139]B6[103,109]B7[107,113]B18[133,143]

通过两组数据的仿真结果和评价指标对比可概括规律如下:

1)本文提出的基于迁移学习的DAE-LSTM模型的预测精度明显高于其他对照方法,预测效果更加稳定,除了CACLE数据中CS2_36号电池的退化趋势较为异常,大部分电池的退化趋势都能被很好地捕捉,MAE和RMSE两个指标分别控制在2.46%和3.76%以内,最低为0.95%和1.06%。

2)通过观察不同预测起点的结果可以发现,预测位置越靠近失效阈值预测精度越高,表明模型对于寿命后期退化趋势明显的数据具有敏锐的识别能力。

3)更换不同的实验数据集,表明M3方法具有极强的适应能力和泛化能力,能够有效地完成小数据样本下的锂离子电池RUL预测任务,NASA预测任务中RUL90%置信区间范围较窄,表明模型具有较强的鲁棒性。

为了进一步验证本文方法的性能,在NASA数据集上与四种现有预测方法进行比较,分别为基于优化组合策略的无痕卡尔曼滤波的方法(UnscentedKalmanFilterandOptimalCombinationStrategy,UPF-OCS)[25]、基于自适应莱维飞行优化的粒子滤波及长短时记忆神经网络的方法(AdaptiveLevyFlightoptimizedParticleFilterandLongShort-TermMemorynetwork,ALF-PF-LSTM)[26]、基于无痕卡尔曼滤波和遗传算法优化支持向量回归的方法(AdaptiveUnscentedKalmanFilterandGeneticAlgorithmoptimizedSupportVectorRegression,AUKF-GASVR)[27]和基于容量增量分析和高斯回归过程的方法(IncrementalCapacityAnalysisandGaussianProcessRegression,ICA-GPR)[28]。预测起点设为60,评价指标选用RMSE和Pre。对比结果见表9,可以看出本文所提方法具有最小的Pre值,能够提供精度较高且稳定的预测效果。

表9其他方法的预测结果比较

Tab.9Comparisonofpredictionresultsofothermethods

电池MethodMAERMSEPreB5UPF-OCS20.0400.971ALF-PF-LSTM20.0180.971AUKF-GASVR00.0231ICA-GPR100.0390.8571DAE-LSTM20.0280.971B6UPF-OCS30.0440.944ALF-PF-LSTM70.0290.868AUKF-GASVR100.0510.689ICA-GPR100.0360.689DAE-LSTM30.0310.944

(续)

电池MethodMAERMSEPreB7UPF-OCS70.0480.911ALF-PF-LSTM30.0050.961AUKF-GASVR30.0130.961ICA-GPR———DAE-LSTM20.0200.976B18UPF-OCS50.0440.875ALF-PF-LSTM———AUKF-GASVR40.0230.900ICA-GPR40.0210.900DAE-LSTM30.0380.961

表10耗时情况统计

Tab.10Timeconsumptionofthemethod(单位:s)

数据集数据再生预训练迁移训练预测总耗时CACLE22.08152.1315.460.97190.64NASA15.6650.164.090.0469.95

本文针对锂离子电池退化数据噪声大、数据量少以及不同生命时期的退化趋势不同而导致的模型预测精度低、泛化能力差等问题,本文从数据预处理、预测模型的构建与训练三方面展开了研究:

2)利用降噪自编码器(DAE)和长短时记忆(LSTM)神经网络构建DAE-LSTM模型进行容量预测,数据降噪阶段和预测阶段共享同一个损失函数,使得降噪和预测过程得以同时优化。

3)通过多组模型的不同训练方法,确定出最优预测方案,即先利用VAE-GAN模型的生成数据对DAE-LSTM网络进行模型预训练,再利用真实数据迁移训练全部网络层。实验结果表明,在相同的预测条件下,基于迁移学习和DAE-LSTM方法总能取得最好的预测结果,预测RUL的90%置信区间较窄反映了本文方法具有强鲁棒性。

通过对比不同方法在不同起点的预测结果,并且横向对比现有文献的预测结果,证明本文提出的基于迁移学习的DAE-LSTM模型在保证鲁棒性的同时,能够有效地提高锂离子电池剩余寿命的预测效果,为锂离子电池的RUL预测提供参考。此外,本文所提模型的结构待继续优化,降低模型耗时,以满足实时性要求较高的任务需求。

参考文献

[1]黄凯,丁恒,郭永芳,等.基于数据预处理和长短期记忆神经网络的锂离子电池寿命预测[J].电工技术学报,2022,37(15):3753-3766.HuangKai,DingHeng,GuoYongfang,etal.Predictionofremainingusefullifeoflithium-ionbatterybasedonadaptivedatapreprocessingandlongshort-termmemorynetwork[J].TransactionsofChinaElectrotechnicalSociety,2022,37(15):3753-3766.

[2]肖迁,焦志鹏,穆云飞,等.基于LightGBM的电动汽车行驶工况下电池剩余使用寿命预测[J].电工技术学报,2021,36(24):5176-5185.XiaoQian,JiaoZhipeng,MuYunfei,etal.LightGBMbasedremainingusefullifepredictionofelectricvehiclelithium-ionbatteryunderdrivingconditions[J].TransactionsofChinaElectrotechnicalSociety,2021,36(24):5176-5185.

[3]徐佳宁,倪裕隆,朱春波.基于改进支持向量回归的锂电池剩余寿命预测[J].电工技术学报,2021,36(17):3693-3704.XuJianing,NiYulong,ZhuChunbo.Remainingusefullifepredictionforlithium-ionbatteriesbasedonimprovedsupportvectorregression[J].TransactionsofChinaElectrotechnicalSociety,2021,36(17):3693-3704.

[4]牛志远,姜欣,谢镔,等.电动汽车过充燃爆事故模拟及安全防护研究[J].电工技术学报,2022,37(1):36-47,57.NiuZhiyuan,JiangXin,XieBin,etal.Studyonsimulationandsafetyprotectionofelectricvehicleoverchargeandexplosionaccident[J].TransactionsofChinaElectrotechnicalSociety,2022,37(1):36-47,57.

[5]AhmadRahmoun,HelmuthBiechl.Modellingofli-ionbatteriesusingequivalentcircuitdiagrams[J].PrzegladElektrotechniczny,2012,88(7):152-156.

[6]QuentinBadey,GuillaumeCherouvrier,YvanReynier,etal.Ageingforecastofli-ionbatteriesforelectricandhybridvehicles[J].Curr.Top.Electrochem,2011,16:65-79.

[7]王义军,左雪.锂离子电池荷电状态估算方法及其应用场景综述[J].电力系统自动化,2022,46(14):193-207.WangYijun,ZuoXue.Reviewonestimationmethodsforstateofchargeoflithium-ionbatteryandtheirapplicationscenarios[J].AutomationofElectricPowerSystems,2022,46(14):193-207.

[8]ShahidF,ZameerA,MuneebM.AnovelgeneticLSTMmodelforwindpowerforecast[J].Energy,2021,223:120069.

[9]ZhangYongzhi,XiongRui,HeHongwen,etal.Longshort-termmemoryrecurrentneuralnetworkforremainingusefullifepredictionoflithium-ionbatteries[J].IEEETransactionsonVehicularTechnology,2018,67(7):5695-5705.

[10]KhumpromP,YodoN.Adata-drivenpredictiveprognosticmodelforlithium-ionbatteriesbasedonadeeplearningalgorithm[J].Energies,2019,12(4):660.

[11]李超然,肖飞,樊亚翔,等.基于卷积神经网络的锂离子电池SOH估算[J].电工技术学报,2020,35(19):4106-4119.LiChaoran,XiaoFei,FanYaxiang,etal.Anapproachtolithium-ionbatterySOHestimationbasedonconvolutionalneuralnetwork[J].TransactionsofChinaElectrotechnicalSociety,2020,35(19):4106-4119.

[12]YuYong,HuChanghua,SiXiaosheng,etal.AveragedBi-LSTMnetworksforRULprognosticswithnon-life-cyclelabeleddataset[J].Neurocomputing,2020,402:134-147.

[13]QiaoJianshu,LiuXiaofeng,ChenZehua.Predictionoftheremainingusefullifeoflithium-ionbatteriesbasedonempiricalmodedecompositionanddeepneuralnetworks[J].IEEEAccess,2020,8:42760-42767.

[14]WangZhuqing,LiuNing,GuoYangming.AdaptiveslidingwindowLSTMNNbasedRULpredictionforlithium-ionbatteriesintegratingLTSAfeaturereconstruction[J].Neurocomputing,2021,466:178-189.

[15]HeWei,WilliardN,OstermanM,etal.Prognosticsoflithium-ionbatteriesbasedonDempster–ShafertheoryandtheBayesianMonteCarlomethod[J].JournalofPowerSources,2011,196(23):10314-10321.

[16]WangHaiyang,SongWanqing,ZioE,etal.RemainingusefullifepredictionforLithium-ionbatteriesusingfractionalBrownianmotionandFruit-flyOptimizationAlgorithm[J].Measurement,2020,161:107904.

[18]DongHancheng,JinXiaoning,LouYangbing,etal.Lithium-ionbatterystateofhealthmonitoringandremainingusefullifepredictionbasedonsupportvectorregression-particlefilter[J].JournalofPowerSources,2014,271:114-123.

[19]KingmaDP,WellingM.Auto-encodingvariationalBayes[C]//InternationalConferenceinLearningRepresentations,Banff,Canada,2014,10.48550/arXiv.1312.6144.

[20]GoodfellowIJ,Pouget-AbadieJran,MirzaM,etal.Generativeadversarialnets[C]//NeuralInformationProcessingSystems,2014:2672-2680.

[21]郑华林,王超,潘盛湖,等.基于EEMD和分层阈值的磁记忆信号降噪方法研究[J].工程设计学报,2020,27(4):433-440.ZhengHualin,WangChao,PanShenghu,etal.ResearchonnoisereductionmethodofmagneticmemorysignalbasedonEEMDandlayeredthreshold[J].ChineseJournalofEngineeringDesign,2020,27(4):433-440.

[22]FrangopolDM,LinKY,EstesAC.Life-cyclecostdesignofdeterioratingstructures[J].JournalofStructuralEngineering,1997,123(10):1390-1401.

[23]VincentP,LarochelleH,BengioY,etal.Extractingandcomposingrobustfeatureswithdenoisingautoencoders[C]//Proceedingsofthe25thinternationalconferenceonMachinelearning,Helsinki,Finland,2008:1096-1103.

[24]HochreiterS,SchmidhuberJ.Longshort-termmemory[J].NeuralComputation,1997,9(8):1735-1780.

[25]YangJinsong,FangWeiguang,ChenJiayu,etal.Alithium-ionbatteryremainingusefullifepredictionmethodbasedonunscentedparticlefilterandoptimalcombinationstrategy[J].JournalofEnergyStorage,2022,55:105648.

[26]ZhangYong,ChenL,LiYi,etal.Ahybridapproachforremainingusefullifepredictionoflithium-ionbatterywithadaptivelevyflightoptimizedparticlefilterandlongshort-termmemorynetwork[J].JournalofEnergyStorage,2021,44:103245.

[27]XueZhiwei,ZhangYong,ChengCheng,etal.Remainingusefullifepredictionoflithium-ionbatterieswithadaptiveunscentedKalmanfilterandoptimizedsupportvectorregression[J].Neurocomputing,2020,376:95-102.

[28]PangXiaoqiong,LiuXiaoyan,JiaJianfang,etal.Alithium-ionbatteryremainingusefullifepredictionmethodbasedontheincrementalcapacityanalysisandGaussianprocessregression[J].MicroelectronicsReliability,2021,127:114405.

YinJie1LiuBo1Sunguobing2Qianxiangwei1

(1.SchoolofMeasurementandControlTechnologyandCommunicationEngineeringHarbinUniversityofScienceandTechnologyHarbin150080China2.ElectronicEngineeringCollegeHeilongjiangUniversityHarbin150006China)

AbstractDegradationdataofbatterycapacitycanbeusedtopredictthebatteryremainingusinglife(RUL),butthereexistnumerousnoisedatainthebatterydegradationprocesscausedbyfactorssuchasambienttemperature,charge/dischargeprocessandcapacityrecoveryphenomenon.Itmakespredictionofdata-drivenlifelithium-ionbatterychallenging.ToimprovethepredictionaccuracyandgeneralizationabilityofbatteriesRUL,weproposedamethodbasedontransferlearninganddenoisingautoencoder-longshorttermmemory(DAE-LSTM).

Experimentalresultsshowedthattheproposedmethodhasbetterpredictiveperformance,anddegradationtrendofmostbatteriescanbewellpredicted.MAEandRMSEwerecontrolledwithin2.46%and3.76%respectively,andthelowestwas0.95%and1.06%.Experimentalresultswithdifferentpredictionstartingpointsshowedthatthepredictionweremoreaccuratewhenthepredictionstartingpointwasclosertothefailurethreshold.Thisindicatesthatthemethodcanaccuratelypredictthedegradationtrendinlaterstagesofbatterylife.Experimentalresultswithotherdatasetsshowedthattheproposedmethodhasstrongadaptabilityandgeneralizationability.Itcaneffectivelypredictthelithium-ionbatteryRULinsmalldatasamples.The90%confidenceintervalofthepredictionresultswithNASAdatasetisnarrow,indicatingthatthemethodhasstrongrobustness.Inaddition,wecountedthetimetakentocompletetheRULpredictionfordifferentdatasets.AstheRULpredictionofbatteriesisofflinepredictionwithlowreal-timerequirement,thetrainingandtestingtimeofthemethodmeetstheofflinepredictionrequirement.

Thefollowingconclusionscanbedrawnfromthesimulationresults:(1)TheDAE-LSTMmethodcaneffectivelydenoisingthedegradationdataoflithium-ionbatteries,andmakingthepredictionresultmoreaccurate.(2)VAE-GANmethodcangeneratemultiplegroupsofdegradationdataconformingtotherealdegradationtoachievethepurposeofdataenhancement.(3)TransferLearningcanensurethattheeffectiveinformationofgenerateddataandrealdataisfullyutilized,sothatthepredictionmodelhashigheraccuracyandbettergeneralizationability.Bycomparingthepredictionresultsofotherliteratures,itisprovedtheproposedmethodhashigherPreandcanbeusedtopredicttheRULoflithium-ionbatteries.

keywords:Li-ionbattery,remainingusefullife,denoisingautoencoder,longshorttermmemory,transferlearning

DOI:10.19595/j.cnki.1000-6753.tces.221890

中图分类号:TM912;TP206+.3

收稿日期2022-10-05

改稿日期2023-01-09

作者简介

尹杰男,1999年生,硕士研究生,研究方向为复杂系统可靠性与机器学习。E-mail:yin_jie1212@163.com

刘博男,1979年生,副教授,硕士生导师,研究方向为复杂系统可靠性与机器学习。E-mail:liubo1900@hrbust.edu.cn(通信作者)

THE END
1.Python混合注意力机制多变量本文探索长短期记忆(LSTM)循环神经网络的结构以学习变量层面的隐藏状态,旨在捕捉多变量时间序列中的不同动态,并区分变量对预测的贡献。利用这些变量层面的隐藏状态,提出了一种混合注意力attention机制来对目标的生成过程进行建模。随后开发了相关训练方法,以联合学习网络参数、变量重要性和与目标变量预测相关的时间重要性。https://blog.51cto.com/u_14293657/12908622
2.基于增量学习的CNNLSTM光伏功率预测光伏功率预测 长短期记忆(LSTM)网络 增量学习 弹性权重整合(EWC)算法https://www.cnki.com.cn/Article/CJFDTotal-DQJS202405004.htm
3.TensorFlow十三LSTM练习lstm增量学习文章浏览阅读556次。https://yq.aliyun.com/articles/202939Mnist: BATCH_SIZE X 784 arrayCCN:BATCH_SIZE X28X28 -->BATCH_SIZE X28x28X1 arrayLSTM:28(NUM_STEPS)个BATCH_SIZE X28 list先试试数据变换:# coding=utf-8import os_lstm增量学习https://blog.csdn.net/lijil168/article/details/82895080
4.人工智能中小样本问题相关的系列模型(一):元学习小样本学习元学习的主要方法包括基于记忆Memory的方法、基于预测梯度的方法、利用Attention注意力机制的方法、借鉴LSTM的方法、面向RL的Meta Learning方法、利用WaveNet的方法、预测Loss的方法等。 2. 基于记忆Memory的方法 基本思路:既然要通过以往的经验来学习,那么是不是可以通过在神经网络上添加Memory来实现呢? https://www.nowcoder.com/discuss/432735
5.lstm原理增量迁移原理介绍华为云帮助中心为你分享云计算行业信息,包含产品介绍、用户指南、开发指南、最佳实践和常见问题等文档,方便快速查找定位问题与能力成长,并提供相关资料和解决方案。本页面关键词:lstm原理。https://support.huaweicloud.com/topic/831072-3-L
6.nlp面试题大全LSTM是如何实现长短期记忆功能的? RNN有梯度消失和梯度爆炸问题,学习能力有限。LSTM可以对有价值的信息进行长期记忆,有广泛应用 首先结合LSTM结构图和更新的计算公式探讨这种网络如何实现功能。 与传统的RNN相比,LSTM依然是基于 只不过对内部的结果进行了更加精细的设计:加入了输入门,,遗忘门以及输出门 https://www.jianshu.com/p/c3e3ab89ccab
7.基于LSTM的机场跑道视程预测关键词:长短时记忆网络深度学习跑道视程预测时序预测神经网络预测模型人工智能 Prediction of Runway Visual Range Based on LSTM PENG Lu ,LIU Jun-Kai ,SHENG Ai-Jing,ZHANG Xing-Hai,SUN Wen-Zheng Abstract: Runway visual range (RVR) reflects the pilot’s visual range, which is one of the importanthttps://c-s-a.org.cn/html/2022/5/8492.html
8.一种基于注意力机制的无人机自主导航分层强化学习算法Shin等人[28]使用各种强化学习算法(如无监督学习、监督学习和强化学习)对无人机进行了实验研究。Hodge等人[29]开发了一种通用导航算法,通过无人机机载传感器的数据引导无人机到达问题地点。为了构建通用的自适应导航系统,本研究采用了一种结合增量课程学习和LSTM的近端策略优化DRL算法。Li等[30]提出了一种独特的DRLhttps://www.auto-testing.net/news/show-122010.html
9.一种基于小样本的迭代式增量对话意图类别识别方法1.一种基于小样本的迭代式增量对话意图类别识别方法,其特征在于,该识别方法包括以下步骤:步骤1:针对对话意图中的文本句子进行分词并训练得到词向量;步骤2:针对一部分词向量先后利用LSTM网络和CNN网络特征提取后得到句子向量,将句子向量通过分类单元以训练初步分类模型,将另一部分词向量输入至训练完毕的初步分类模型,得到https://www.qcc.com/zhuanliDetail/94f955987af15c76b7bd63d0b0b01319.html
10.深度学习在基于日志分析的系统异常检测中的应用本文以文献[3]为例,介绍了深度学习模型(LSTM)在基于日志分析的系统异常检测中的应用,详细介绍了日志模板异常检测和日志变量异常检测这两个部分,希望能够带给大家一些启发。 参考文献 [1] Md Zahangir Alom, Tarek M. Taha. The History Began from AlexNet: A Comprehensive Survey on Deep Learning Approaches.https://cloud.tencent.com/developer/news/230251
11.基于BLS和LSTM的剩余使用寿命预测方法及系统9.有鉴于此,本发明提供了一种基于bls和lstm的剩余使用寿命预测方法及系统,其中,bls具有强大的特征表征和预测能力,能够准确地表示数据特征与预测结果之间的关系;训练速度高且具有增量学习的优势,当网络没有达到预期的性能时,只需要增量学习,且只需要计算增量部分而无需重构整个网络,这大大提高了数据处理的效率。同时,https://www.xjishu.com/zhuanli/55/202211426550.html
12.一文概述联邦持续学习最新研究进展澎湃号·湃客澎湃新闻当前,一般认为持续学习 (Continual Learning) 和增量学习(Incremental Learning)、终身学习 (Lifelong Learning) 是等价表述,它们都是在连续的数据流中训练模型,随着时间的推移,更多的数据逐渐可用,同时旧数据可能由于存储限制或隐私保护等原因而逐渐不可用,并且学习任务的类型和数量没有预定义 (例如分类任务中的类别数)https://www.thepaper.cn/newsDetail_forward_23531390
13.机器学习期末复习题.pdf监督学习 B. 无监督学习 C. 线性决策 D. 增量学习 6. 以下属于聚类方法的是( ABD ) A. k-means B. 层次聚类 C. Fisher鉴别 D. 密度聚类 7. 以下可用于聚类性能测量的评估方法 ( ABCD ) A. Jaccard系数 B. FM指数 C. Rand指数 D. DB指数 8. 以下可行的最近邻分类的加速方案 ( AB ) 14 A. https://m.book118.com/html/2023/0910/5120210043010324.shtm
14.北京大学计算语言学教育部重点实验室10.董秀芳,从动作的重复和持续到程度的增量和强调,《汉语学习》2017年第4期:3-12页。 11.董秀芳,汉语词汇化研究的意义、存在的疑问以及新的研究课题,《历史语言学研究》第11辑:272-283页。商务印书馆,2017年10月。 12.Xiaodong Zhang, Sujian Li, Lei Sha, Houfeng Wang, Attentive Interactive Neural Networhttps://klcl.pku.edu.cn/xzyj/lwfb/article.html