批次过程的本质特性明显区别于连续过程,可以归纳为“多样产品”、“重复运行”、“时段切换”和“变换指标”四个方面[8].自20世纪90年代起,由于产品种类增多、市场需求变化加快导致批次生产方式愈受青睐,批次过程控制也逐渐成为一项独立的研究课题.总体来说,批次过程控制研究历经了连续过程控制方法、迭代学习控制(Iterativelearn-ingcontrol,ILC)和迭代学习模型预测控制(Iterativelearningmodelpredictivecontrol,ILMPC)三个阶段,图1显示了其发展历程.
历经20多年的发展,ILMPC已经成为批次过程控制领域的主流方法[41].本文将在分析现有成熟的迭代学习模型预测控制理论的基础上,指出其面临的挑战,综述该领域的研究动态,并展望迭代学习模型预测控制的未来研究方向.本文的结构框架及主要内容如图3所示.
MPC的预测功能需要基于预测模型实现,预测模型的形式灵活多变.在经典的MPC理论中,MAC采用的脉冲响应预测模型和动态矩阵控制(Dynamicmatrixcontrol,DMC)采用的阶跃响应预测模型均是通过工业试验得到的非参数模型;GPC采用的受控自回归积分滑动平均(Controlledautoregressiveintegratedmovingaverage,CARIMA)预测模型和非线性MPC经常使用的状态空间预测模型都可划分为参数模型.随着现代工业系统逐步朝着高复杂度和高集成度方向发展,利用机器学习技术建立数据驱动非参数预测模型对提高模型精度和控制品质具有重要意义.
ILMPC需要根据过去批次的过程数据沿迭代轴进行控制律更新,这通常是通过沿批次的迭代优化实现的.现有ILMPC研究工作主要围绕着两种优化结构展开:1)将ILC和MPC集成为一个二维优化问题,在每个采样时刻对当前控制律进行更新;2)按顺序分别进行ILC优化和MPC优化,在每个批次开始前基于2D模型求解整个批次内的ILC控制律,再采用MPC基于2D预测模型进行滚动时域优化,在ILC控制律的基础上进一步修正.通常,具有第1种优化结构的ILMPC算法称为整体式(Intergrated)ILMPC,具有第2种结构的ILMPC算法称为两段式(Two-stage)ILMPC.
两段式ILMPC多基于前馈-反馈机制,通常形式为先基于存储的前一批次数据进行离线ILC优化得到整个批次的前馈控制律,再在每个采样间隔进行滚动时域MPC优化得到反馈控制律,其控制结构如图5所示.这种Two-stage优化方案将ILC功能和MPC功能进行了分离,沿批次进行的ILC控制只处理重复性干扰,沿时域进行的MPC控制负责抑制随机干扰.因而Two-stageILMPC的迭代学习进程不受随机过程信息的影响,其学习效率和收敛速度通常高于整体式ILMPC.文献[39-40]基于2D脉冲响应预测模型,采用前馈反馈机制构建Two-stageILMPC算法,通过ILC优化和MPC优化分别产生ILC控制量和MPC控制量,施加于被控系统的控制作用为两者之和;文献[55]基于2D非线性模糊神经网络模型,先独立优化ILC控制律,再利用已知的ILC控制量和待优化的MPC控制量推导时域隐式预测模型,通过滚动时域优化求解得到MPC控制量.另一种典型Two-stageILMPC保持了ILC和MPC功能的整体性,只根据控制目标将ILMPC优化过程分割为两个阶段,第1阶段抑制非重复性干扰,第2阶段在重复性干扰下最小化跟踪误差,提高系统跟踪精度和收敛速度[62].
综合前述的模型形式和优化结构差异,ILMPC的分类情况及各自优势、局限性如表1所示.
ILMPC的迭代收敛性是指:当迭代次序趋近无穷时,系统跟踪误差收敛到零或者某一常数.ILMPC的收敛性分析主要遵循两种方式:
针对无约束系统,直接求出ILMPC优化问题的显式解,将显式解代入系统模型,推导相邻批次间跟踪误差的迭代关系,从而得到跟踪误差沿迭代轴单调收敛的不等式条件.文献[42]将ILMPC优化问题的显式解代入阶跃响应模型,得到了相邻批次间跟踪误差向量的等式关系,再令转移矩阵的谱半径或范数小于1得到ILMPC系统的单调收敛条件;文献[48]基于所有批次初始状态保持不变的假设,将显式解代入Kalman滤波器作用下的LTI状态模型,得到ILMPC的单调收敛条件.
针对约束系统,首先通过设计稳定预测控制器保证跟踪误差在每个批次内的收敛性或有界性,再利用批次过程的重复特性,证明跟踪误差沿批次的收敛性.文献[38]基于预测控制的稳定性分析方法推得优化目标函数值的时域有界性,进而通过前一批次末端状态和后一批次初态间的关系,证明了跟踪误差沿迭代轴收敛到零;文献[55]基于变时域预测控制目标函数的非增性质,在系统初态保持不变的前提下利用夹逼定理证明了跟踪误差沿迭代轴收敛到某一常数;文献[59]在时域上采用基于终端不变集的MPC优化方法保证了系统跟踪误差的有界性,继而借助最优解的性质递推证明了批次内任意采样时刻跟踪误差沿迭代轴的收敛性.
迭代学习模型预测控制衍生于发展成熟的ILC和MPC技术,具有较为完备的理论基础.但是,ILC和MPC从控制目标、优化结构等方面存在本质区别,将两者融入到一个2D框架下对系统的建模、优化、稳定性分析等带来了挑战.建立从建模、优化到性能分析的完整理论体系仍是批次过程ILMPC的研究难点.同时,批次过程“多重时变”的特点要求ILMPC控制器对变参考轨迹、变批次长度、变模型参数等情况具有良好的适应性.如何在不影响系统2D稳定性的前提下提高对批次过程变工况的适应性是ILMPC控制器设计面临的又一挑战.
随着工程数学与应用物理的深度融合以及人工智能的迅猛发展,机理建模和数据驱动建模技术都日益成熟.然而,批次过程的“多重时变”特性对其建模过程提出了许多新要求.首先,批次过程通常用于生产高精细化产品,控制系统需时刻保持高跟踪精度,这对模型精确性提出了更高的要求.无论是机理建模方法还是数据驱动建模方法都不可避免地存在建模误差,利用迭代轴上累积的过程数据反复进行误差估计和补偿是提高系统跟踪精度的关键,也是批次过程迭代建模中的重点和难点.其次,一个完整的批次过程通常包含多个操作阶段,每个阶段的动态特性存在明显差异,如何实现多阶段精确建模和平滑切换是未来批次过程建模的重要研究方向.
ILMPC控制系统在每个采样间隔需要求解基于2D预测模型的约束优化问题.当采用简单的线性模型为预测模型时,优化问题的求解效率较快,但是线性模型与实际非线性过程的失配问题会导致控制器的最优性下降.当直接采用较为准确的非线性模型作为预测模型时,尽管控制最优性会得到一定程度的提升,但是运用非线性规划求解方法会导致每个采样周期内的计算负担加重,从而造成控制效率的下降.ILMPC优化的研究难点主要在于如何实现最优性和优化计算效率间的平衡.
对于基于预测模型的ILMPC算法,提高控制最优性的首要问题是实现对模型误差的有效补偿.模型失配的程度越小,控制信号对于实际非线性批次过程的适用性就越高.文献[37]将非线性批次过程辨识为线性脉冲响应模型,在每个采样间隔利用Kalman滤波器对预测状态进行反馈校正,使控制信号的最优性提高;文献[54]在ILMPC算法内考虑了线性化导致的模型失配问题,利用Lipschitz连续性条件将优化目标函数表示为真实跟踪误差的上界,从而提高控制输入的最优性.
对于带不确定性的ILMPC系统而言,鲁棒性的提高通常会导致最优性的下降.为降低系统不确定性对跟踪性能的影响,鲁棒ILMPC的设计目标通常是保证已知范围内的所有可能干扰对系统性能指标的影响小于某一界限,或在参数不确定性包含的所有可能情况下满足鲁棒稳定性条件.文献[58]设定系统在所有可能参数下的目标函数小于某一定值,不可避免地造成了控制器的保守性,在一定程度上牺牲了最优性;文献[59]针对约束批次过程设计基于终端椭圆不变集的鲁棒ILMPC策略,由于椭圆不变集无法实现终端域的最大化,这种保证2D稳定性的方法必然以牺牲最优性为代价.因此,在解决系统不确定性问题时,如何定性分析系统保守性并最大限度提高最优性是一项重要研究内容.
在实际非线性批次过程控制中,ILMPC的优化计算效率主要取决于两个因素:预测模型和寻优算法.降低模型复杂度和减小寻优计算负担是提高ILMPC优化效率的两个重要途径.通过对非线性系统进行线性化获得线性预测模型,可以有效降低模型复杂度,将复杂的ILMPC非线性规划问题转化为易于求解的线性规划问题[48].但任何降低模型复杂度的方法势必会导致模型精确度下降,因此需要同时解决模型失配问题.
对于快变非线性批次过程,现有的ILMPC算法难以同时兼顾最优性和计算效率的问题.以寻优算法的内在机制为切入点,对ILMPC的目标函数结构进行改造以提高寻优算法收敛速度或减小每步迭代的计算量,是发展高效ILMPC的潜在方法.
综上,ILMPC特有的二维控制结构给其建模、优化和稳定性都带来了巨大挑战(如图6所示).在建模中实现多阶段迭代误差估计和补偿,在优化中实现最优性和计算效率的平衡,在稳定性分析中突破严重复性条件的桎梏,是ILMPC理论中亟待解决的三个关键科学问题.
1)由基于机理模型的ILMPC向基于数据模型的ILMPC过渡.ILC作为无模型算法,通过学习积累的历史批次数据实现对参考轨迹的高精度跟踪,实际上是一种数据驱动控制策略.而MPC作为一种基于预测模型的优化控制算法,其时域控制效果很大程度上依赖于对系统动态模型的精确掌握.ILMPC继承了ILC的学习能力和MPC的时域鲁棒性,但同时也丢失了ILC不依赖控制对象模型的优势.当被控批次过程具有复杂非线性特征,难以建立精确机理模型时,经典ILMPC的实施面临很大困难.随着机器学习在本世纪的井喷式发展,很多学者开始利用神经网络和强化学习等方法对ILMPC的控制结构进行转化,建立数据驱动ILMPC算法,直接基于历史数据辨识被控系统的2D动态特性用于时域预测,打破了模型预知这一严苛条件对ILMPC理论深化和应用拓展的束缚.
1)基于批次过程不断产生的有限时域过程数据利用神经网络沿迭代轴辨识系统的二维预测模型,再基于神经网络模型进行ILMPC的优化求解.针对仿射型非线性批次过程,文献[56]采用控制仿射型前馈神经网络(Controlaffinefeedforwardneuralnetwork,CAFNN)对复杂非线性批次过程的重复动态特性进行迭代建模,构建基于Tube的数据驱动ILMPC,保证在存在建模误差时系统跟踪轨迹能够收敛至参考轨迹附近的不变集内;针对非仿射型非线性批次过程,文献[73]采用了径向基(Radialbasisfunction,RBF)神经网络对其动态特性进行辨识,并在数据驱动ILMPC中结合CEF实现建模误差和跟踪误差沿迭代轴的收敛.
2)直接利用系统离线数据拟合每个批次内输入序列与输出序列间的转移矩阵,基于所得输入输出模型对未来多个批次的输出序列进行预测.文献[109-110]针对预测所需未来批次过程动态无法获得的难题,提出了一种基于不断积累的批次过程离线数据估计未来批次系统转移矩阵的新算法,成功构造了沿迭代轴的数据驱动ILMPC策略;文献[30]考虑批次过程不确定性未知的情况,利用离线数据中包含的过程信息对未来批次的系统整体动态进行预测,消除不确定项对ILMPC跟踪性能的影响.
为了适应工业机器人[111]、运载工具[112]以及快速化学反应器[113]等快动态非线性批次过程的高效率控制需求,建立计算负担低的优化控制策略也是现今ILMPC领域的研究热点之一.通常采用的手段是将控制对象复杂的非线性动态表征为线性形式,从而实现非凸优化问题到凸优化问题的转化,降低优化求解的在线计算量.文献[114]介绍了一种即时学习(Just-in-time-learning,JITL)方法,根据输入输出数据将非线性模型沿标称轨迹线性化,建立线性时变参数模型;文献[115]直接沿参考轨迹通过泰勒展开线性化非线性模型,并在控制器设计中对线性化高阶项误差进行补偿,能够同时保证计算效率和跟踪精度.
此外,降低待优化变量维数也是提高控制效率的有效途径之一.文献[115-116]在时域控制上采用了具有特殊结构的预测函数控制,通过将待优化变量表示为一系列基函数的加权和,将维数较高的控制时域输入序列求解问题转变为维数较低的基函数权重系数序列求解问题,从而显著提高在线求解速度.
针对变初始条件问题,通常有两种解决思路.一是构造基于终端约束的ILMPC策略[117],利用可行初始状态轨迹计算控制器的终端约束集及终端代价函数,并通过迭代逐步提高控制最优性;二是先采用固定初态的系统方程进行二维预测,再通过系统真实输出与预测输出的差值数据对控制律更新方程不断修正[118].
有关变参考轨迹的ILMPC研究工作主要分为两个方向:经过固定期望点的变参考轨迹跟踪控制和全区间变参考轨迹跟踪控制.前一研究方向针对只需在部分采样点跟踪参考值的特定批次过程,设定系统参考轨迹为穿越各个期望点的随机轨迹,将参考轨迹跟踪问题缩小为固定点跟踪问题,通过建立点对点ILMPC策略[51,119],保证系统对期望点的跟踪精度;后一研究方向针对参考轨迹全工作区间变化的一般情况,将其变化量表示为ILMPC的迭代扰动项,结合鲁棒控制技术加以抑制[120-121],保证系统对整个参考轨迹的跟踪精度.
ILMPC算法的核心思想是在滚动时域下基于前一批次的控制经验对当前批次的控制输入进行校正,其中隐含了相邻批次等长的条件.变批次长度打破了迭代学习功能依赖的基本前提,给ILMPC的2D递归可行性和稳定性分析带来了巨大挑战.因此,变批次长度是实现ILMPC所面临的最严峻的变工况问题,目前还没有建立与之相对应的完善的ILMPC策略.文献[122]中讨论了一种具有预测功能的改进ILC策略,通过建立系统输入输出预测模型,采用预测值对数据缺失的批次进行补充,将每一批次的过程数据重构为相等长度.这为在ILMPC中建立缺失信息预测补偿机制提供了参考,在此基础上继续探索变批次长度下的多学习模式和2D性能分析方法是当今ILMPC的理论研究新趋势.
迭代学习模型预测控制理论正朝着无模型、强鲁棒性、强适应性的方向迅速发展,这为其在实际工业过程中的应用提供了有力支撑.截至目前,ILMPC策略已在化工[123-127]、电力[46]、供热[128]、医疗[129-131]、精密仪器[132]等多个领域取得成功应用.香港科技大学高福荣教授团队在注塑过程迭代学习模型预测控制方面开展了卓有成效的研究工作[47,50,123],实现了对注射速度的精准控制,提升了注塑产品质量和生产效益.山东科技大学王友清教授团队将ILMPC成功应用于人工胰脏智能控制[129-131],根据患者血糖动态变化实时调节胰岛素注射速度.
ILMPC的实际应用不仅限于化学反应器、注塑机、机械手臂等典型间歇过程,也广泛渗透于发电、供热、炼钢等典型连续过程.对于动态变化具有重复性的连续过程,可以对其操作流程进行人为的周期划分,构造ILMPC所需的“迭代轴”.目前,基于模糊建模的ILMPC已应用至火力发电控制[46],通过迭代学习周期性历史数据保证了对负荷指令的快速、准确跟踪.这种周期划分方法打破了迭代学习模型预测控制与连续过程间的应用屏障,ILMPC将向着应用场景多样化、应用形式灵活化的方向继续发展.
作为智能制造的重要生产方式,批次过程的最终控制目标是保证各批次持续产出高质量成品,提高经济效益和社会效益.结合迭代学习模型预测控制的发展现状和批次过程控制的特殊需求,ILMPC的未来研究工作需要在解决复杂非线性建模、2D高效优化以及变工况适应性的基础上综合考虑批次生产过程的经济性问题,其途径主要包含两个层面:设计成品质量预测和控制策略、建立二维动态经济优化机制.
为实现运行优化与反馈控制的有效结合[137-138],实际批次过程通常采用分层控制结构[139-140],如图8(a)所示.在实时优化层(Real-timeoptimization,RTO)优化经济性能指标获得最优参考轨迹,再将参考轨迹传递给动态控制层进行跟踪控制.ILMPC策略通常应用于动态控制层,利用其迭代学习和滚动优化的特点,实现对参考轨迹的高精度稳定跟踪.然而,这种分层结构只在上层考虑了系统经济性能,丢失了动态跟踪过程中的经济信息.当被控过程出现模型失配、随机干扰等不确定性时,上层优化得到的参考轨迹不再是动态跟踪过程的经济最优轨迹.
经济模型预测控制(Economicmodelpredictivecontrol,EMPC)将实时优化和动态控制融合在一个框架下实现,直接采用经济性能指标作为动态跟踪问题的目标函数,可以有效提高系统动态经济性能[141-143].近期,许多学者开始尝试将EMPC理念与传统ILMPC结合[144-147],形成了迭代学习经济模型预测控制(Iterativelearningeconomicmodelpredictivecontrol,ILEMPC),它通过优化基于前次迭代数据的滚动时域经济性能指标获得每一时刻的控制输入,其结构如图8(b)所示.与经典ILMPC沿迭代轴提高跟踪精度不同,ILEMPC沿迭代轴直接实现系统经济性能的稳步提升,目前已在间歇化学反应器[145-146]和太阳能热水器[148]控制中取得成功应用.
然而,作为一种新兴控制结构,ILEMPC在控制性能定性分析方面还存在明显欠缺.首先,经济目标函数通常具有非二次型形式,使得传统的终端约束集方法无法保证系统的时域Lyapunov稳定性,进而会影响迭代收敛性.如何将EMPC的稳定性理论(如基于强耗散性的终端约束EMPC[142]、基于Lyapunov收缩约束的双模EMPC[149])运用至二维的ILEMPC系统是未来研究的重要内容;其次,与传统ILMPC算法需保证跟踪误差沿迭代轴收敛至最小值不同,ILEMPC追求的是动态经济性能沿迭代轴收敛至最优.对于各类批次过程如何设定经济目标函数并建立合理的经济性能迭代分析方案是ILEMPC在未来发展中必须解决的关键问题.
总体来说,ILMPC理论在过去20多年间呈现快速发展趋势,在变工况适应性、鲁棒性、控制效率等方面已取得瞩目成绩,在经济性方面正以完善理论体系、拓宽应用范围为目标逐步深入.未来ILMPC的理论研究需紧密跟随批次过程智能化、精细化的趋势,在深化迭代学习功能的同时加强与工业大数据的交互,汲取工业控制领域与其他交叉学科的最新成果,实现在精度、灵活性、安全性、高效性等控制性能上的不断提升,并兼顾对现有2D稳定性分析方法的拓展和突破.