——《控制理论前沿理论与方法》第一课
引言
大数据时代、信息化时代、网络化时代、智能化时代,也是系统时代。认识系统复杂性与调控复杂系统是当今科学技术发展的前沿。大数据一般来自具有各种反馈回路的复杂动态系统,既反映了系统性质或功能,也为进一步优化或调控系统服务;信息化与网络化使得系统组成部分之间的关联发生深刻变化,深刻影响系统的结构和功能;智能化的核心机制是学习与反馈,也是系统控制科学中处理不确定性的两个主要机制。这些研究都离不开对动态系统的定量认识与科学调控。因此,系统控制是关键基础。
研究领域:控制论,系统科学,学习与反馈,人工智能
郭雷(中科院)|讲者牟牧云|整理
目录1.两位历史人物2.几个基本概念3.若干实际例子4.主要设计方法5.新时代的展望
1.两位历史人物
1.1维纳与《控制论》
诺伯特·维纳(N.Wiener),控制论的创始人,1894年出生于美国密苏里州,以其在数学与控制论等领域的开创性工作而闻名。1906年,仅12岁便进入塔夫茨大学数学系学习,而后于1912年,18岁时获得哈佛大学的博士学位;1932年,维纳成为麻省理工学院(MIT)的正教授;1933年,39岁当选美国国家科学院院士。1935至1936年间,维纳应邀访问中国,在清华大学与电机系的李郁荣教授合作,并在数学系讲学。维纳曾经把他在中国的这一年作为自己学术生涯中一个特定的转折点。在此期间,维纳还曾影响和指导过当时在清华大学工作的华罗庚,并在给英国著名数学家哈代(Hardy)的推荐信中称赞华罗庚是“中国的拉马努扬(Ramanujan)”。
维纳的学术贡献卓著,1964年维纳获“美国国家科学奖章”的授奖词比较全面的概括了其主要贡献:“在纯粹数学和应用数学方面并且勇于深入到工程和生物科学中去的多种令人惊异的贡献及在这些领域中具有深远意义的开创性工作”。科学文献中有许多以维纳命名的重要概念和成果,比如,维纳过程,维纳测度,维纳滤波,维纳-霍普夫方程等。
维纳最具影响力的成就是创立了控制论这一跨学科理论框架。他的里程碑式著作《控制论:或关于在动物与机器中控制和通信的科学》(CyberneticsorControlandCommunicationintheAnimalandtheMachine,1948)[1],不仅开创了控制论这一新兴交叉领域,而且对通信理论、控制理论、自动化和人工智能等众多领域产生了深远影响。继《控制论》之后,1950年维纳在其姊妹篇《人有人的用处》[2]中进一步拓展了对控制论和信息论的哲学与社会学反思,提出了对科技、社会和人类未来深刻的见解,在普及和发展控制论方面发挥了重要作用。
维纳试图建立控制论的统计理论,但他认为吉布斯(W.Gibbs)的统计力学是不能直接用来研究控制系统的,因为“一个控制系统不是一个孤立的系统,而是一个与周围环境密切联系的系统,特别是控制系统通过自身的反馈机构可以减少系统的‘无组织程度’,因此,在控制系统中经常发生熵减少的过程”。
控制论(Cybernetics)的影响远不止上述这些,实际上对当今众多科学技术与社会科学领域都产生了广泛影响。书中的思想洞见对当今系统控制与智能系统的进一步发展仍具有重要意义。此外,赛博(Cyber)语言在当今也广泛流行(如cyber-space,cyber-security,cyber-culture,cyber-game,cyber-physicalsystem,……)。维纳堪称交叉科学研究的典范!
控制论的创立无疑是划时代的,很快从美国传播到世界。上世纪五六十年代《控制论》在苏联曾经历过被“批判-平反-热捧”过程,曾得到著名数学家科尔莫戈洛夫、索波列夫、马尔科夫、李亚普诺夫等积极支持。维纳《控制论》中文版于1961年出版,翻译者的署名是“郝季仁”(“好几人”的谐音,实际上是龚育之、罗劲柏、侯德彭、陈步等四人),这个署名是一段历史的产物。
1.2钱学森与《工程控制论》
钱学森(1911.12.11-2009.10.31),一位在我国家喻户晓的杰出科学家,其科学生涯纵贯70年,可以认为横跨了三个非凡的时期。
第一个时期是20世纪30年代中到50年代中在美国的20年,钱学森以其出众的才华成为那个时代科技前沿的著名专家,特别是在空气动力学研究方面提出了亚音速气流中空气的压缩性对翼型压强分布的修正公式(“卡门-钱学森公式”),并为美国的航空和火箭技术发展做出重要贡献。在他回国之前被限制自由的五年期间,撰写了《工程控制论》。
钱学森在《工程控制论》[4]中提出“工程控制论是一门技术科学,它不同于工程实践”,“工程控制论的目的是研究控制论这门科学中能够直接用在工程上设计被控系统或被操纵系统的那些部分”,“控制论所讨论的主要问题是一个系统的各个不同部分之间的相互作用的定性性质,以及整个系统总的运动状态”。这本经典著作于1956年被翻译成俄文出版,1957年被翻译成德文出版,1958年被翻译成中文出版。1980年,钱学森与宋健出版了《工程控制论》的修订版,扩充了原著的内容。在修订版的序言中,作者进一步阐述了现代化、技术革命与控制论的关系,指出“从科学理论的角度来看,20世纪上半叶的三大伟绩是相对论、量子论和控制论”,并指出核能技术革命、计算机技术革命和航天技术革命等“所有这些技术革命都直接与控制论连在一起”。
2.几个基本概念
2.1系统与系统科学
系统是自然界和人类社会中一切事物存在的基本形式,各式各样的系统组成了我们所在的世界。现代科学在从基本粒子到宇宙的不同时空尺度上研究各类具体系统的结构与功能关系,逐渐形成了自然科学与社会科学的各门具体科学。
什么是系统?通常来讲,一个系统是由相互关联和相互作用的多个部分(或子系统)所组成的具有特定功能的有机整体,这个系统又可作为子系统成为更大系统的组成部分。
系统科学研究什么?系统科学的研究对象是“系统”自身,其目的是探索各类系统的结构、环境与功能的普适关系以及演化、认知与调控的一般规律。
钱学森曾经提出系统科学的体系结构,包含四个层次:第一个层次是哲学层次,称为系统论。值得注意的是,系统论不等于整体论。钱学森认为系统论是还原论与整体论的辩证统一,这个观点很精辟。正是这种辩证统一,使得系统论既可以超越还原论,又可以超越整体论。第二个层次是基础理论,称之为系统学(Systematology)。这个英文单词是钱学森先生给出的,他认为系统学是系统科学的基础理论,有待建立。第三个层次是技术科学,包括运筹学、控制论、信息论等内容。第四个层次是工程技术,包括系统工程、通信工程、自动调节原理等。
2.2系统的控制
2.3前馈与反馈
总的来说,反馈是一条基本的系统学原理,可以产生有序行为,维持系统稳定或平衡,以及应对各种不确定性因素影响以达到控制目的。除此之外,反馈机制在智能行为及系统进化中起着关键作用,反馈控制算法是自动化和智能化系统“大脑”的核心组成部分,反馈控制也被认为是第一个系统学科[7]。从历史上看,正如国际著名控制科学家K.J.Astrom所指出的,反馈的有效利用常常对工程技术领域产生革命性影响。
下面举一些典型例子来说明反馈机制的重要作用。
3.反馈系统的若干实际例子
例1.瓦特蒸汽机
我们讲的第一个著名例子是瓦特蒸汽机。1782年,詹姆斯·瓦特(J.Watt)在前人工作基础上创新性发明“离心调速器”用于反馈控制蒸汽机的速度,以应对负载的变化。这一发明促进了蒸汽机的广泛应用,成为英国工业革命的一个重要标志。离心调速器的反馈工作原理可以简单描述如下(见示意图):当蒸汽机运转过快时,竖轴转速增加,导致两个金属小球在离心力作用下升高。因为小球通过连杆与蒸汽阀门相连,小球的升高会使阀门关小,从而降低蒸汽机的转速。相反,如果蒸汽机转速过慢,小球则下降,连杆随之将阀门开大,从而使蒸汽机转速变快。
尽管调速器的引入最初改善了蒸汽机的运行稳定性,但随着蒸汽机速度的提高,系统开始出现震荡,暴露了调速器设计的问题,这也促使了后续关于调速器和系统稳定性的理论研究。著名的电磁场理论创立者、英国物理学家詹姆斯·克拉克·麦克斯韦(JamesClerkMaxwell,1831-1879)是最早研究调速器稳定性问题的学者。他在1868年发表的《论调节器》中首次用微分方程来描述调速器的运动状态,并对其在平衡点附近进行线性化处理,指出了稳定性取决于特征方程的根是否具有负实部。麦克斯韦被认为是历史上第一个控制理论学家。维纳在他的《控制论》一书的引言中曾提到,选择Cybernetics这个字是想用它来纪念关于反馈机构的第一篇重要论文,就是上面说的麦克斯韦这篇论文。麦克斯韦之后,关于系统稳定性的研究工作先后出现了Routh-Hurwitz判据、Lyapunov稳定性理论和Kharitonov定理等重要理论进展,进一步推动了控制理论的发展。
例2.远距离通讯
例3.扫描隧道显微镜与高性能探测器/观测器
例4.阿波罗登月(1969)
1969年阿波罗登月计划的最终成功,是我要提及的第四个关于系统控制重要作用的突出实例。在这一里程碑式的重大工程任务中,火箭的上升阶段应用了最优控制算法,而在飞行轨道的修正方面则应用了卡尔曼滤波算法。关于数学算法在这项举世瞩目的重大工程中的重要性,1988年美国工业与应用数学学会(SIAM)发布的“控制理论未来方向”研究报告中,有下列一段评述,给人留下深刻印象:“非常普遍地,一片计算机芯片被看作是科学突破,而人们往往忽略了芯片的‘大脑’实际上是数学算法。以阿波罗登月任务为例,许多人强调舱载数字式飞行计算机的关键作用,却忽视了存储在内存中的创新数学算法对任务成功的同等重要性。”这段话强调了数学算法在这一航天重大科技成就中的重要作用。
例5.高机动性战斗机控制
高机动性战斗机控制是系统控制发挥重要作用的又一显著领域。例如,在F-16战斗机中,传统的机械联动装置被先进的数字计算机和电线取代,形成遥控自动驾驶仪系统。这种系统设计有几个关键特点:1)是开环不稳定设计:为了提升战斗机的机动性,F-16被设计成开环不稳定系统。这意味着在没有适当控制系统的情况下,飞行器本身是不稳定的。2)数字式反馈控制系统:这个系统的反应速度很快,能够实时应对空气动力学的不确定性因素,并可以有效地镇定一个不稳定的动态系统。通过这种创新的控制方法,F-16战斗机能够在保持高度机动性的同时,确保飞行的稳定性和安全性。这个例子展示了反馈控制技术对高性能飞行器的重要性。
例6.深海钻井平台的自动定位
控制系统在深海钻井平台的自动定位中发挥关键作用。以我国“海洋石油981”深水半潜式钻井平台为例,该平台在设计上充分考虑了南海恶劣的海洋环境,具备极强的稳定性和抗干扰性,能够在最大3000米的水深作业区域内稳定工作,可抗200年一遇超强台风。能做到这点,关键在于其八个分列四角的螺旋桨推进器,这些推进器通过控制系统进行实时自动定位调节,确保平台的稳定性和抗干扰能力。
例7.生态系统的反馈调节
生态系统的稳定性和平衡依赖于其内部的自我调节机制,其中反馈机制起着至关重要的作用。在生态系统中,如果某一个成分发生了变化,它将必然引发系统内其他成分的一系列响应变化。这些响应变化最终会再次作用于最初发生变化的成分,形成一种自我调节的过程。生态学中著名的Lotka-Volterra方程就是这种现象的一个简单描述。
该方程用于描述两个物种之间的相互作用,特别是在被捕食者和捕食者之间的关系。它揭示了两个物种数量之间的竞争关系如何通过正负反馈机制相互影响。当一个物种的数量增加,可能会导致另一个物种数量的减少,反之亦然。这种动态平衡是生态系统自我调节的一个典型例子,显示了生态系统中复杂的相互依存和调节关系。
例8.生理功能与反馈机理
生物机体能够维持正常的生理功能,依赖于多种反馈调节机制,包括神经调节、体液调节以及局部的自身调节。这些调节机制在生物机体的各种组织、器官和系统中普遍存在,并且在分子、细胞和系统各个层面上都发挥着作用。精确的反馈调节对于机体的正常功能至关重要,如果缺乏这种反馈调节或其功能失效将导致各种疾病的发生。
2017年诺贝尔生理或医学奖的获得者就是因为“发现了调控昼夜节律的分子机制”而获奖。生物钟机制是一个典型的生物反馈调节系统,它调控着生物体内部的节律。虽然不同种生物的生物钟基因多种多样,但他们的工作原理都是类似地的,即基因表达的负反馈调节。此外,糖尿病就是生物机体反馈调节失衡的一个著名例子。在糖尿病患者中,由于胰岛素的调节机制受损,导致血糖水平无法有效控制,从而引发了一系列健康问题。这再次说明了生物机体中精准的反馈调节对于维持生命健康的重要性。
例9.中医理论
中医药在中华民族几千年的生存与发展中做出了巨大的贡献。中医理论是建立在功能结构模型基础上的理论体系,包括精气学说、阴阳五行、藏象学说、经络学说、体质学说、病因病机、辨证施治、三因制宜等概念,体现了丰富的整体思维、辩证思维、唯象思维以及功能建模等系统方法。这一理论体系蕴含着深刻的系统演化论、系统认知论和系统调控论的思想。特别是“阴阳平衡”原则,它不仅是理解生理功能、解释病理变化的核心,也是指导疾病诊断和治疗的关键。中医中的反馈机制是保持生物体动态平衡的基本机制。在中医药现代化的进程中,系统控制科学有望在其中发挥更加重要的作用。系统控制不仅有助于更深层次地理解中医药的内在机理,还可能推动中医药与现代科技的融合,从而促进这一传统医学体系的发展和创新。
例10.市场经济及调控
1776年英国的亚当·斯密(1723~1790)首次发表了《国家财富的性质和原因的研究》(简称《国富论》),书中所论述的那只在暗中推动市场经济行为的“看不见的手”,其工作原理也属于反馈机制。它通过价格波动自动调节市场上商品的种类与数量以达到供需平衡,这一“自组织”原理至今仍在深刻影响着全世界经济发展。此外,政府的宏观调控在本质上也是利用正负反馈原理。
总之,通过上述例子可以看出,反馈机制在自然科学、工程技术、经济社会和生态环境等领域无处不在、无时不有。人们自然关心如下基本科学问题:如何有效利用反馈?如何具体设计反馈规律?如何分析预测反馈系统性能?如何使被控系统达到期望目标?反馈机制的最大能力和根本局限是什么?为了解决这些问题,需要研究系统控制理论与设计方法。
4.主要设计方法概述
下面是关于控制系统的一个一般性框图:
4.1经典方法
在经典控制论中,最著名的反馈控制方法当属下面的“比例-积分-微分(PID)控制”:
在被控的动态系统中有控制输入信号和观测输出信号,通过观测输出信号和理想目标之间的运行偏差来决定反馈控制信号,它是由运行偏差的比例、积分、微分这三项的线性组合来决定,称为PID控制。
PID控制虽然有上百年历史,但因为其具有简单性、实用性和鲁棒性等突出的优点,在当今工程技术系统的控制器设计中仍占据主导地位。事实上,据统计,“90%以上的工业控制问题是采用PID解决的”。控制系统被视为自动化系统的“大脑”,而自动化技术又是将人类从繁重的体力和脑力劳动中解放出来的关键技术之一,对生产力的发展起着重要推动作用。因此,有人认为“没有PID,就没有现代文明”,这在一定程度上反映了PID控制在现代技术社会中的重要性和广泛影响。
正因为如此,对PID控制器的基础理论与参数设计方法的科学研究一直持续不断。但直到前不久[8],才从数学理论上严格证明了线性PID控制可以应对大范围非线性不确定性动态系统,并且证明了PID闭环控制系统无论对非线性函数的不确定性还是对控制器中三个关键参数的设计选取,都具有大范围鲁棒性(称为“双边鲁棒性”),从而说明了PID为何在实际应用中如此成功的基本原理。
尽管PID控制器在工业中影响巨大,但也不是万能的,例如PID控制难以解决控制变量受约束下多输入多输出动态系统在一般性能指标下的优化控制问题。上世纪60年代前后,诞生了现代控制理论。其主要标志是基于状态空间方程的卡尔曼(R.E.Kalman)滤波,线性二次最优控制问题的求解与若干基本概念(能控性、能观性、结构分解与最小实现等)的引进和刻画,以及贝尔曼(R.Bellman)动态规划和庞特里雅金(L.S.Pontryagin)极大值原理等。
4.2优化方法
然而,这些关于动态过程的优化控制方法一般依赖于精确的数学模型,因此在应用于实际中多数不确定性复杂系统时,存在基本的局限性。这激发了对不确定性动态系统控制的深入研究,并促进了许多新方向的发展。
对于不确定性系统的控制律设计,可大致分为三类方法[9]:一是基于先验知识和/或统计数据进行离线建模或学习,然后设计控制器,或直接从强化学习中学习控制规律(适用于可多次重复的情况)。二是直接利用闭环系统运行中的在线观测数据来设计反馈控制规律,无需具体的数学模型。三是前两者的有机结合。实际上,实践中成功的应用往往都是基于系统建模(或离线学习)与反馈控制的有机结合。
4.3学习方法
通过学习可以为控制器设计提供所需的基本模型和状态信息。动力系统的学习问题可以包括系统辨识、状态估计、适应滤波、强化学习和反问题等。系统辨识方法一般要先选定一个含有未知参数的线性或非线性模型集,然后利用预报误差方法从模型集中选出最优的模型参数。信号滤波的目的则从含有噪音的信号过程中提取或者估计出所希望知道的信号。强化学习一般是指在动态系统的输入信号和运行状况可以多次重复的情形下,对控制规律的学习。系统辨识与强化学习大家都应该比较熟悉了。我这里仅谈一点关于滤波问题或运动状态估计问题。
4.4鲁棒方法
任何数学模型在本质上都是对实际复杂系统的抽象或近似表示,数学方法的鲁棒性对于解决实际中的复杂系统问题是至关重要的。具体来讲,基于理想化模型(或标称模型)所设计的控制器在应用于不确定性实际系统时,可能面临模型与实际系统之间存在“较大”偏差的问题。如何确保这样的控制器能够有效控制那些与数学模型有显著差异的不确定性系统,是鲁棒控制研究的主要内容。这要求控制器不仅要在理想条件下表现良好,而且能够在面对系统不确定性或变化的实际环境时依然保持其稳定性和基本性能。目前,无论对线性系统还是非线性系统,关于鲁棒分析与鲁棒控制都有丰富的研究成果。
4.5自适应方法
4.6更“智能化”方法
借助人工智能技术的发展,通过离线学习、强化学习、自适应学习等方法与在线反馈机制的有机结合,充分发挥并有机融合前馈机制与反馈机制的不同优势和功能,处理更大不确定性、混杂性、稀疏性与不完全信息,特别是在博弈控制系统框架内研究具有博弈行为的多主体复杂系统的智能化调控或决策(涉及多主体、多层次、多目标、多约束、博弈性等)。需要人工智能、控制论、博弈论、动力系统乃至法学等社会科学领域有关学科的深度结合。
5.新时代的展望
系统是任何事物存在的基本方式,也是人类认识世界和调控世界的基本概念。认识系统复杂性与调控复杂系统已成为当今科学技术发展的前沿。大数据时代、网络化时代、智能化时代,也是系统时代。事实上,大数据一般来自具有各种反馈回路的复杂动态系统,既反映了系统性质或功能,也为进一步优化或调控系统服务。信息化与网络化不但使得系统组成部分之间的关联发生深刻变化,深刻影响系统的结构和功能,并且造就了大量新的复杂系统。智能化的核心机制是学习与反馈,两者也是系统控制中处理不确定性的主要机制。所有这些问题的深入研究都离不开对动态系统的定量认识与科学调控。因此,系统控制科学仍是关键基础。
另一方面,数字化、网络化与智能化等信息技术的迅猛发展和广泛应用,在助力或赋能复杂系统控制研究和技术实现的同时,也造就了大量新的复杂系统控制问题需要研究解决。例如,“人机融合”或“信息-物理-社会”复杂系统的调控需求,将可能使传统系统控制科学的研究框架或研究范式面临变革。
回顾历史,系统控制思想与方法的应用遍及几乎所有科学技术领域,成就了现代人类文明之美。展望未来,迎接新时代的机遇与挑战,系统控制仍具有非凡的魅力,将助力我们建设更加美好的和谐社会,实现人类文明的持续发展!
学者简介
郭雷,中国科学院院士、现任中科院数学与系统科学研究院研究员、中科院国家数学与交叉科学中心主任、中科院信息技术学部主任、亚洲控制协会主席等。曾任中科院数学与系统科学研究院院长、中国工业与应用数学学会理事长、国际工业与应用数学世界大会主席、中国大百科全书(三版)“系统科学”卷主编等。他是中国科学院院士,发展中国家科学院院士,瑞典皇家工程科学院外籍院士,瑞典皇家理工学院(KTH)荣誉博士,美国IEEE会士,国际自动控制联合会会士,中国工业与应用数学会会士,中国自动化学会会士等。
2019年他因为“在自适应控制、系统辨识、自适应信号处理、随机系统及应用数学领域的根本性和实际性贡献”,被IEEE控制系统学会(CSS)授予其最高奖“波德奖”(HendrikW.BodeLecturePrize),是迄今获该项国际学术大奖(终身成就奖)的唯一华人科学家。多次应邀在控制与数学等领域国际顶级学术会议上作特邀报告,包括先后两次在三年一度的国际自动控制联合会世界大会的大会报告(1999,2014),IEEE决策与控制会议(CDC)的大会报告(2019),四年一度的国际数学家大会(ICM)的邀请报告(2002)以及国际工业与应用数学大会(ICIAM)的大会邀请报告(2023)等。
控制科学前沿理论与方法系列课程
对复杂动态系统的定量认识与科学调控,系统学与控制论是关键基础。集智学园联合中科院数学与系统科学研究院多位控制科学与工程领域专家共同开设了《控制科学前沿理论与方法》系列课程,为面向控制专业领域学生以及跨领域的学习者做深度科普,帮助学习控制论的核心思想、框架与方法。通过学习这些课程,学生将了解控制论的发展历程,掌握经典和现代控制方法,探索控制系统的美妙之处。此系列课程共计10节,从2024年4月2日起,每周二晚19:00-21:00线上上课。欢迎感兴趣的朋友报名参与!