克劳斯?迈因策尔人工智能与机器学习：算法基础和哲学观点|学习算法需要什么基础_在线学习

人工智能(AI)在很多人不知情的情况下统治我们的生活很久了。与我们说话的智能手机、记录我们健康数据的手表、自动安排的工作程序、自动驾驶的汽车和飞机、有自主逻辑的交通和能量系统，以及探测远方星球的机器人，都是连接成网的智能系统世界的例证。它们向我们展示了人们的日常生活是如何受到人工智能功能影响的。

艾伦麦席森图灵(1912-1954)在后来以其姓命名的测试中定义一个系统是否具有智能性的判断校准为：如果该系统的回答和反应与人类的无法区别时，则该系统是智能的。①这个定义的不足之处是用人类作为测试标准。很多生物体也是智能系统的范例，它们和人类一样，在进化中出现并能够或多或少地、独立有效地解决问题。有时自然是技术发展的模板。但是信息科学和工程技术科学也经常会找到一些与自然界不同甚至更好、更高效的解决问题的方法。所以，图灵所定义的智能并不严谨，智能应是指通过技术或自然系统有效而自动地解决问题的程度或者等级。因此，笔者为一个系统的智能性提出一个暂时的工作概念，如果一个系统能独立而有效地解决问题，则它就是智能的。②一个系统的智能度由系统的独立性程度、问题的复杂程度以及解决问题过程的效率大小决定：智能度我们能够测量。据此，动物(和人类)的意识和感觉对于智能来说并非必需的。

二、从图灵到符号主义人工智能和自动证明

1956年，受到图灵“机器会思考吗”这一问题的启发，约翰麦卡锡(JohnMcCarthy)、艾伦纽厄尔(AllenNewell)、赫伯特西蒙(HerbertSimon)等多位权威研究人员出席了在达特茅斯举行的有关机器智能的会议。人工智能研究的第一阶段至少在于形式逻辑中探求解决问题的通用方法上取得了成就。为了证明公式的逻辑上的普遍适用性，设计了一种机械的处理方法。这种处理方法可以被计算机程序执行，也将自动定理证明引入了计算机科学。

在实践中论证一个逻辑推论的普遍适用性可能会非常复杂。因此，1965年鲁滨逊(J.A.Robinson)提出了所谓的归结方法，借此能够推导出逻辑驳议过程的证明。③人们从对立的猜测(否定)，即逻辑推论不具有普遍适用性开始；接着证明这一假设的所有可能的应用实例都将导致自相矛盾的结果。否定之否定和逻辑推论的否定是普遍有效的。鲁滨逊的归结方法使用了逻辑化简法，据此人们可以将所有逻辑公式转换成合取范式。在命题逻辑中一个合取范式由可以否定的和不可否定的命题变量(字符串)组成，这些变量由合取(∧)和析取(∨)符号连接起来。一个常规公式的组成元素被称为子句。

对于谓词逻辑的公式来说，也有一个通用的归结过程，以便再次从一个公式的一般无效假设推导出矛盾。为此，一个谓词逻辑的公式必须被变换为一个常规形式，从它的子句中可以机械地推断出矛盾。但是，因为在谓词逻辑中(不同于命题逻辑)一般不能判断一个公式的普遍适用性，所以，有可能发生归结过程无法结束的情况。计算机程序就这样无限制地运行下去。因此，重要的是找到一些子类，其中的过程不仅有效而且能够结束。机器智能提高并加速决定过程的效率，但机器智能像人类智能一样受制于逻辑决定性的原则界限。

这就产生了一个问题，软件自动提取证据是否可靠。在一个准确地预先确定的框架内，能够对以此为基础的软件进行可靠性论证，顾客就能确定这个计算机程序是否能够正确工作以解决问题。这种“自动证明”不仅对现代软件技术有巨大的影响，④还导致了深刻的哲学问题，即数学的思维可以被自动化到什么程度。⑤但是，这种软件的正确性论证却是由一个数学家进行的。如果我们想要使这种证明自动化，一个基本的认识论的问题就产生了：这是否将我们引入一个回归，它的终点是人类(必须是人类)

三、从一般问题解决器到专家系统

人工智能研究的第一阶段大约在20世纪50年代中期到60年代中期，仍被欣快的期待所刺激着。⑥人们应用计算机来设计通用问题解决方法，但是实践的结果令人非常失望。大约在20世纪70年代中期到80年代中期，以知识为基础的专家系统进入人们视野，这是人工智能的第一次实际应用。有限而明确的人类专家的专业知识，比如工程和医学等领域的专业知识被写进专家系统，应用到日常生活领域。⑦

四、人工智能与自然语言：魏泽鲍姆的ELIZA

以上策略同样适用于用计算机实现基于自然语言的交流。约瑟夫魏泽鲍姆(JosephWeizenbaum)设计的语言程序ELIZA就是一个例子。⑨ELIZA模拟人类专家中的女精神病医师与病人聊天。该程序涉及一些规则，指挥一个“女精神病医师”用怎样的句子模板对病人的某些特定的句子模板做出反应，基本上是根据各种情况对规则进行识别和分类。最简单的情况是确定两个符号结构的等价性，就像它们在符号编程语言LISP中被函数EQUAL确定一样。如果常量和变量被包含在符号表达式中，⑩则出现一些扩展。比如：

(xBC)

(ABy)

这两个项相互匹配，因为变量x和原子A、变量y和原子C互相对应。通过引入变量可以使一个模板的结构通过模式比较被识别。

为此，可以在LISP编程语言中定义一个特殊的运算符MATCH。一个数据和一个结构对应的最简单的情况是常量的相等性，比如列表AB和AB的相等性：

(MATCH‘(AB)‘(AB))=T

符号“‘”表示后面的列表不是函数定义，而是应当理解为符号的排列。

为了实现分类，可以使用各种各样的生成符号，就像逻辑学或数论中的变量那样。比如可以用符号“”来引导出任何对象：

(MATCH‘(B)‘(AB))=T

(MATCH‘(B)‘((AB)B))=T

这个结构将每一个包含两个子列A和B的列表与其中的第二个列表B匹配。

生成符号“*”表示任意多个符号构成的字符串(包括空串)。比如：

(MATCH‘(*B)‘(B))=T

(MATCH‘(*B)‘(ABCB))=T

这样给出的结构表示与所有在尾部包含B的列表相匹配。

以上结构就可以说明ELIZA系统的本质算法结构，它反映了“精神病医师”的知识库内容。请看病人P和ELIZA(简称E)之间的对话：

P：MENAREALLALIKE.(男人们全都一样。)

E：INWHATWAY(在哪些方面)

P：THEY’REALWAYSBUGGINGUSABOUTSOMETHINGOROTHER.(他们总找借口躲避我们。)

E：CANYOUTHINKOFASPECIFICEXAMPLE(你能举个例子吗)

P：WELL，MYBOYFRIENDMADEMECOMEHERE.(好吧，我的男朋友要我到你这里来。)

E：YOURBOYFRIENDMADEYOUCOMEHERE.(你的男朋友要你到我这里来。)

P：YES，IAMVERYSAD.(是的，我很伤心。)

E：YOUAREVERYSAD.(你很伤心。)

P：SADANDDEPRESSED.(伤心而沮丧。)

E：PLEASEGOON.(请继续。)

下列规则可以推导出ELIZA的回答，因为它们可以识别病人和ELIZA使用的某些特定的句子模式：

第二个规则规定：当在句子中存在ARE这个关键词，而在其左右的内容为任意时，用“INWHATWAY”作为回答。在句子“MENAREALLALIKE”中，ARE前的*是“MEN”，ARE后的是“ALLALIKE”。

第四个规则是：当病人的句子中单词MY和ME通过列表*B被分开，并以列表*C结束时，ELIZA的回答首先由YOU和C部分(CONS‘YOUC)构成，然后使用B部分，最后是YOUR。

一段用户与ELIZA之间的对话，与我们所举的编程语言LISP中的句法符号列表没什么不同。在语义学上要尽量使用与日常聊天习惯相符的结构。

最后一个规则是典型的随机响应，就像我们在日常聊天中经常遇到的一样：如果专家无法识别一个任意的符号列表(*L)，他就说“请继续(PLEASEGOON)”。

五、从ELIZA到WATSON系统

自约瑟夫魏泽鲍姆的ELIZA之后，以模式识别为基础的文本比较方法被人们熟知。现在的软件将句子拆分成单独的短语进行分析，迅速计算出对于提出的问题合适的答案模式或者在另一种语言中找出合适的翻译。1993-2000年间由德国人工智能研究中心(DFKI)研发的VERBMOBIL(11)就是一个高效的翻译程序。

IBM公司研制的WATSON系统是一个语义层面上的自动问答系统。(14)它基于并行计算机的强大计算能力和维基(Wikipedia)网站所存储的海量知识，综合应用了语言算法、专家系统、搜索算法、大数据处理等多种技术。与ELIZA不同，WATSON理解某些背景知识和语言的语义，能够理解自然语言的提问，并快速在海量知识库中找到相应的知识和回答。WATSON一方面是IBM公司发明的认知工具平台，另一方面也意味着在经济和企业界的广泛应用可能。按照摩尔定律，WATSON的功能在可以预计的时期内不再需要超级计算机了。一部智能手机上的一个App应用就可以具备这样的功能。不必通过键盘输入来完成这样的操作，而是通过智能语音程序就可以实现自然语言进行的对话。对话中所包含的人类情感也能够被程序识别，就像魏泽鲍姆早就担心的那样。(15)

2013年斯派克琼斯(SpikeJonze)摄制的美国科幻片《她》(her)描绘了一个内向而害羞的男人爱上了一个语言程序。他的职业是给那些难以向别人解释他们感受的人写信。为了减轻工作负担，他得到了一个新的操作系统，该系统配备了女性身份和愉快的声音。使用头戴式耳机和摄像头，他与这个自称为萨曼莎(Samantha)的系统交流。萨曼莎很快就学会了社交互动，并表现得越来越人性化。在频繁而长期的对话中，亲密的情感关系得以发展。

写作机器人在金融行业也应用得越来越普遍。可以在几秒钟内生成多个原来靠人类专家才能完成的报告，比如公司简介。可以提示客户、基金经理采用何种策略投资股票市场以及基金如何发展。保险公司使用智能写作程序来衡量销售业绩并提出改进建议。自动创建的文本可以确认客户的投资策略是否能够取得成功。自动编写程序提供的支持还可以为客户提供更多的个人建议。人力投资顾问并没有被取代，但数字产品的发展速度与IT工具的指数增长一样迅速。

六、神经网络和机器

生物体的自组织大脑则与可编程计算机不同。(16)在演化进程中，网络最开始以复杂基因及蛋白质网络中的亚细胞供应、控制和信息系统的身份出现。(17)基于神经化学信号处理功能的神经细胞的信息、控制和供应系统不断进化。蚂蚁种群的发展就像人类大脑和人类社会的网络物理系统一样。

根据我们的工作定义，如果一个系统能够独立而有效地解决某种问题，那么这个系统就是智能的。传统上我们把在进化过程中发展起来的自然系统和在技术上引入的技术(“人工”)系统区分开来。智能度取决于数学复杂性理论中可以测量的问题的复杂性。

自然进化中产生的有效解决问题的方法并没有通过计算机模型中的符号方法进行表示。亚细胞、细胞和神经元自组装产生适当的复杂网络。神经元由图形网络的节点表示，触连接由图形网络的连线表示。(18)神经化学连接的强度由连接权重来表示。学习在神经元的开关模式建构过程中产生，受到神经网络的学习算法指导。强烈的突触耦合产生了神经元的开关模式，与一个生物体的大脑情感或者肢体动作状态相适应。这个过程也可以通过计算机模型来模拟，这种模拟基于神经网络、自动机与计算机之间的基本的数学等价性。已经得到证明，一个McCulloch-Pitts网络可以通过一个能够终止的自动机模拟。(19)可终止的自动机包括一些简单的系统，比如火车站的自动购票机，它能够识别一些简单的指令语言代码。(20)反过来，一个可终止的自动机的功能也可以由一个McCulloch-Pitts网络来实现。数学上，这样的网络可以通过实数加权。也可以这样说，一个由McCulloch-Pitts网络类型的神经网络系统构成的生物体，只能解决具有这种复杂性的问题，即能够被一个可终止的自动机解决的问题。在这个意义上说，一个这样的生物体的智能与一个可终止的自动机的智能是同等程度的。

不过哪些神经网络相当于图灵机，也就是相当于根据丘奇(Church)论题可以编程控制的计算机呢这些机器和神经网络可以识别哪些语言呢这些语言涉及某些自然语言，它们可以通过乔姆斯基语法体系推导出来，也就是可以递归地建构起来。可以证明，图灵机依据这种语言识别功能能精确地模拟那些突触权重为有理数且有反馈环的神经网络。反过来说，图灵机可以被具有突触权重为有理数的识别递归语言的神经网络精确地模拟出来。(21)

如果我们把图灵机作为程序控制计算机的原型，那么根据这个证明，一个具有有限的突触强度的大脑可以被一个计算机模拟。相反，一个图灵机(即一个计算机)的工作过程可以被一个具有有限的突触强度大小的大脑追踪。换句话说，这种大脑的智能度对应于图灵机的智能度。

这样的神经网络原则上可以在适当的计算机上模拟。事实上实际应用(例如模式识别)的大部分神经网络仍然是在数字计算机(例如诺伊曼机器)上模拟实现的。只有神经形态的计算机才能直接构建神经元网络。

但是，如果神经网络的突触权重不仅允许是有理数(即大小有限的数字，例如2.3715，其中小数点位数有限)，而且还可以使用任意实数(即小数无限多的小数点，例如2.3715……这也是不可计算的)的话，将导致怎样的结果呢从技术上讲，这样的网络不仅可以执行数字计算，而且可以进行模拟计算。

事实上，在一个自然的有机体中，许多过程可以被认为是模拟的。因此，视觉信号处理可以通过触发传感器的连续电磁场来描述。听觉的声学也是基于稳定的声波的。触觉上，皮肤传感器也能提供稳定连续而不是数字化的感觉。现在有人会争辩说，在有限的物理世界中的测量值是有限的，因此原则上是可数字化的。然而对于人工智能具有非常重要意义的是模拟性的神经网络的理论结果。(22)在数学上，如果拥有关于实数的数学理论，突触权重为任意实数的模拟神经网络也可以被明确地定义出来。(23)核心问题是模拟神经网络是否可以比具有有理数的神经网络且因此比图灵机或数字计算机做得“更多”。这可能是人工智能辩论中的一个中心论点，也就是说，具有实数的数学比仅具有比特数的计算机科学可以做得“更多”。(24)

自动机和机器的核心特征是对形式语言的认识和理解。如果一个自动机经过有限多的步骤之后进入一个可以接受的状态并终止了，它就将一个读入的单词识别为某种形式的符号序列。(25)自动机可以接受的语言仅包含可被它识别的词汇。可以证明，有限状态自动机正是可以识别规则语言的简单符号序列。上下文无关语言使用的规则推导出的符号与背景符号无关，它们被更强大的具有特殊存储结构的自动机识别。递归可枚举语言非常复杂，只能被图灵机识别。

无论如何，推广到实数域的普遍性的(模拟性的)可计算性的优点是，它比较客观地概括了生物体、大脑和神经形态计算机中的模拟过程。在这里可以清晰地观察到与进化、数学和技术方法非常相近的一个等价说法，它依赖于丘奇推论的扩展性：(27)不仅数字化上的有效过程可以被计算机模型表示出来，自然过程中模拟有效过程也可以。这是一个关于复杂动态性系统的统一理论的核心。计算机中带有数字的符号代码只是我们的一种信息处理方式，它代表了原子、分子、细胞和进化的过程。

可以这样来区分可计算性的程度：一个非确定性图灵机在计算过程中，除了使用通常的有效计算的基本操作外，还使用随机决策。为此，我们借用图灵定义的Ψ预言机扩展了图灵机的概念：对于Ψ预言机而言，除了一个确定性的图灵机的命令，一个操作Ψ也是可以的，例如给Ψ(x)的x赋值，尽管我们不知道它是否可以计算。这样，这种计算就依赖于这个预言Ψ。大自然中的一个例子是DNA信息有效处理过程中的随机变化。这就是相对可计算性：一个函数相对于Ψ是可计算的，如果它通过一个Ψ预言机是可计算的话。

人类的知识与意识联系在一起。来自长期记忆的相应数据和规则被放置到短期记忆中，可以被象征性地表示为：我知道我是个知道能够或做了某事的人。原则上不能排除人工智能系统将来会有类似意识的能力。这样的系统会创造出与人类截然不同的它们自身的体验、经历和身份。所以，如果将人工智能研究仅仅局限在具有与人类相似的意识的人工智能系统上，将是进入了一个死胡同。

七、机器和大脑的融合

从2006年开始，随着所谓“树搜索”的蒙特卡洛算法的应用，人工智能程序已经成功地模拟了围棋走法，但还没有超过业余爱好者的水平。只有将下棋走法选择的统计性的“树搜索”与深度神经网络学习算法(监督和强化学习)结合，人工智能程序才获得了成功。(28)2016年，谷歌公司的“阿尔法狗”(AlphaGo)软件在围棋比赛中击败了人类冠军，(29)人工智能取得了惊人的突破。谷歌公司的程序员也很惊讶于“阿尔法狗”根据下棋状态学习的速度之快。

八、神经网络与机器学习

具有适当的拓扑结构和学习算法的人工神经网络的机器学习算法模拟大脑信息处理过程：神经元(神经细胞)通过传播神经化学信号的突触相互连接，连接具有一定的强度，通过连接权重来表示。由于Hebb规则，当来自相邻区域的加权输入的总和超过阈值时，神经元激发动作电位。此外，神经元排列成层状，这对应于人脑的皮层结构。

在神经元层面，学习意味着兴奋的神经元相互连接。在神经心理学中，这种互联模式与某些认知状态如感觉、想象、感情、思维和意识有关。在神经网络模型中，这些互联过程由学习算法建模，该学习算法改变突触的权重数值，因为它们表示互联模式中突触连接的各个神经元的强度。

有不同类型的学习算法。在监督学习中，神经网络首先向一个原型学习。例如脸部像素的分布模式。颜色和色调的局部强度由相应的突触权重表示出来。一个神经网络可以通过训练来适当调整权重。通过与训练好的原型比较，可以在各种脸部照片中识别出训练好的脸部照片。在非监督学习中，神经网络能够独立地识别数据的相似性，以便相应地对它们进行分类。所以，这种神经网络算法就可以识别一只猫的面孔，即使在没有先学习了解过猫是什么的情况下。

深度学习只是指神经网络的深度，它对应于神经层的数量。例如，一个面部识别的神经网络中，第一层区分彩色像素，第二层将端点和边连接起来，第三层负责面部部分细节，最后在第四层得到面部的信息。这种算法的数学模型在20世纪80年代就有了，但是最近几年在技术上才可以实现，因为需要强大的计算能力，譬如具有100万个神经元和10亿个突触的谷歌“大脑”。这种技术不能靠少量的神经层来实现。神经层数应该根据可以使用的计算能力随意增加，以提高系统的运算效率。

九、机器学习和自行驶车辆

如果我们现在想象一下，这辆汽车配备了“记忆能力”(数据库)，它可以记住危险的碰撞以避免在未来碰到它们，那么，人们会想到汽车行业未来将如何建立具有自我学习能力的车辆。这些系统将与在某些条件下具有预先编程行为的传统驾驶员辅助系统显著不同。它将是一个神经学习系统，就像高度进化的生物体的学习功能一样。

培训能够自主学习行驶的车辆需要多少次的真实事故为代价如果自动驾驶车辆发生事故，谁负责其道德和法律的挑战是什么对于诸如具有数百万的元素和数十亿的突触连接的神经网络的复杂系统，尽管允许使用统计物理学的定律对整个系统的趋势和收敛行为进行全局性的描述，但是每个元素的经验参数的数量可能如此之大，以至于无法确定局部原因。神经网络对我们来说仍然是一个“黑匣子”。从工程学的角度来看，奈特(Knight)关于机器学习的核心提到了一个“黑暗的秘密”：“即使设计基于机器学习系统的工程师，可能也很难将任何单一行为的原因分离出来。”(30)

软件工程中有两种不同的方法是可以想象的：1.测试只显示(随机)发现的错误，但不是所有其他可能的错误。2.为了避免基本的错误，必须对神经网络进行正式的验证。

自动定理证明的优点是可以证明软件作为数学定理的正确性。自动证明的重要性在人工智能诞生之时就已经被认可了，就像本文之初所介绍的。因此，我建议在机器学习的神经网络之上引入一个形式化的元层次，以自动完成形式化的正确性证明。例如，我们设想一种配备传感器和作为其大脑的相应神经网络的自行驶汽车，它的学习目标是交通法所规定的汽车行为，比如于1968年在《维也纳公约》中制定的《公路法》。在第一步，就像一架飞机那样，这辆汽车配备了黑匣子，以便保存其行为数据。这个数据量应该满足《维也纳公约》所规定的交通规则的要求。这种要求保障消除车辆的不当行为。在元层次上，这个含义被形式化了，以便通过定理证明来实现自动化证明。

为此，首先必须从黑匣子的数据中提取车辆的运动路径。统计学提供模型拟合的一种方法。对车辆轨迹的描述必须在下一个步骤以形式语言在元层次上表示出来。这种形式化的描述必须满足《维也纳公约》的相应正式条款要求。这个要求的形式化证明是由定理证明器自动化实现的，并且可以凭借当今的强大计算能力以闪电般的速度实现。

总之，用神经网络进行机器学习是有效的，但我们无法详细理解和控制神经网络中的过程。机器学习技术类似于统计测试，但对于强调安全性的系统来说还是不够的。因此，机器学习应该与定理证明相结合，这是一种还未形式化的、基于逻辑的人工智能。正确的行为是由逻辑形式化中的形而上的方法保证的，这些方法是可以自动证明的。

十、人工智能和不完整信息的决策

在复杂的市场中，人们并不是按照“代表性经纪人”(经济人)的公理决定的理性预期来行动的，而是根据不完整的知识、情绪和反应来决策和行动。因此，美国诺贝尔奖获得者赫伯特西蒙(HerbertA.Simon)定义了有限理性。(31)这意味着，面对复杂的数据，我们应该选择比较满意的解决方案，而不是寻求最完美的解决方案。

但是，处在有限理性和算法确定的信息条件下的决策是封闭的吗在1997年，IBM公司的超级计算机“深蓝”(DeepBlue)击败了当时国际象棋的卫冕世界冠军。2016年，谷歌公司推出了基于超级计算机的“阿尔法狗”软件系统并击败了围棋冠军。然而，更令人感兴趣的是在扑克大赛中击败人类冠军的超级计算机上的软件系统。(32)不像棋类游戏，扑克是一个不完整的信息决策的例子。日常生活中的很多决策都属于这种类型，例如商务谈判、法律案例、军事决策、医疗计划和网络安全等。相反，国际象棋和围棋这样的棋类游戏的决策是完整信息下的决策，其中每个玩家随时都全面了解全局情况。

人工智能首先是一种想要有效解决问题的工程科学，这一点很清楚，它并不是为人类智能建模、模拟，甚至取代人类智能。即使在过去，某些成功的工程解决方案也不是模仿大自然，如人们试图飞翔，模仿鸟类扇动翅膀，他们就会坠落下来。只有当工程师掌握了空气动力学的基本定律时，他们才能提出解决方案，以便能将沉重的飞机移动到云层之上的高度，而这些解决方案在自然界并没有发现。与人工智能不同的是大脑研究和神经医学，它们想要为人类有机体建模，理解人类有机体，比如人类在自然中是怎样进化发展的。

图形上，可以通过一个“博弈树”来表示一个游戏。一个游戏的情况对应于一个分支节点，从这些节点出发，根据规则不断发展游戏，这些游戏进程由“博弈树”中相应的分支来表示。这些树枝在某些节点(游戏情境)停止，新的分支(游戏进程)又出现了。这就是复杂“博弈树”的产生方式。

在这样的背景下，Pokerlibratus程序(33)使用两种不同的算法：反事实的遗憾最小化(CounterfactualRegretMinimation，简称CFR)是信息不完全的、解决零和博弈的一个迭代算法；遗憾的修剪法(Regret-BasedPruning，简称RBP)则是进一步的发展，允许修剪掉在“博弈树”中不太成功的分支，以便加快CFR算法。在零和博弈中，RBP切断了所有不是一个“纳什均衡”最好响应的行动。一个“纳什均衡”是一种游戏状态，此时没有一个玩家可以通过单方面的策略来改善自己的表现。

人们在信息不完整的博弈中试图找到“纳什均衡”。在少于约10[8]个可能的游戏情形(游戏树中的节点)的2人零和博弈中，可以通过线性算法(计算机程序)精确地找到“纳什均衡”。对于较大的游戏，可以使用迭代算法(例如CFR)收敛于作为极限值的“纳什均衡”。

十一、人工智能、物联网和工业4.0

智能产生在与周边环境的相互作用中。从石器时代到现在，人类大脑从生理学上说几乎没有改变。通过在目前技术社会中的互动可能性，我们才能成为21世纪的人类。与此同时，全球化的知识社会本身也变成了一个复杂的智能系统，这个智能系统整合了各种或多或少的智能功能，具有独立意识的每个人成为这个系统的一个组成元素。赛博物理系统旨在实施人工智能系统中的社交和情境知识，以改善对人类的服务功能。因此，它们是具有分布式人工智能的数字物理系统，而不是孤立的个人机器人或计算机具有的人工智能。与具有数十亿相互作用的细胞、器官、传感器和神经系统的生物体相似，社会体系可以被理解为具有经济代谢周期和体外信息系统的超级生物体。(34)

原则上，这个程序也可以转移到其他应用领域，因此不仅仅是某个领域的专家系统。自适应算法已经以指数级增长的计算能力来控制网络世界的进程。没有它们，互联网上由数十亿传感器和联网设备产生的海量数据将无法管理。传感器使得现在的所有东西都可以彼此通信，而不仅仅是人。这就是我们谈论物联网(InternetofThings，简称IoT)的原因。

大数据不仅在经济上有利可图，而且在政府和行政管理方面也有优势。通过对大规模结构化和非结构化管理数据进行有针对性的评估，可以做出更好的管理决策，并指导公民行为。例如，通过对经济、气候变化、人口统计、城市规划和交通规划的预测可以促进经济发展。同样，网络舆情分析可以成为某些基础设施缺陷的预警系统(如大型技术项目的规划审批程序)。

十二、区块链：进入完全算法化的社会

计算能力的指数级增长加速了社会的算法化。智能算法将逐渐取代机构并创建分散的服务和供应结构。区块链数据库技术(35)展现了这个新数字世界的入门级场景。它类似一种分散的记账系统，银行将经纪人之间的金钱交易用算法代替。这种分权措施是在2008年全球金融危机后发明的，这次金融危机主要是由国家和国际中央银行的人为错误造成的。

分散式加密货币按照以下步骤工作：(37)

1.新交易已签署并发送给参与者的所有节点。

2.每个节点(参与者)在一个块中收集新的交易。

3.每个节点(参与者)搜索所谓的随机值(nonce)，它验证它的块。

4.节点(参与者)发现一个有效的块时，它将块发送给所有其他节点(参与者)。

5.节点(参与者)只有当下列规则有效时才接受该块：

(1)块的哈希值必须与当前难度级别匹配。

(2)所有交易必须正确签署。

(3)交易必须相应地覆盖前面的块(无重复问题)。

(4)新的问题和交易费用必须符合公认的规则。

6.节点(参与者)通过将其哈希值放入其新块中来表示它接受该块。

创建一个新的有效块(挖掘)对应于解决加密任务(工作证明)。在网络中，任务的难度是以平均每十分钟生成一个新块的方式来调节的。成功开采的概率与所使用的计算能力成正比。为此，挖掘的难度必须不断地适应网络的当前计算能力。工作证明算法遵循以下步骤(这里使用的阈值与采矿难度成反比)：(38)

1.初始化块，将根哈希作为交易计算。

2.计算哈希值：H=SHA256(SHA256(块头))。

3.如果h≥阈值，更改块标头并返回步骤2；否则(h＜阈值)，找到有效块，停止计算和发布块。

新块中包含的交易最初只由创建块的参与者确认。这只会给其有限的信誉。如果该块被其他参与者接受为有效，则它们将在其新的块中创建其哈希值。如果大多数参与者认为这个块有效，那么这个链将以最快的速度从这个块继续增长。如果不认为它是有效的，链将从目前为止的最后一块开始增长。这些块演变成了一棵“树”。

只有从第一个块(根)开始的树中生长的最长的链才被认为是有效的。因此，这种形式的记账自动构成了大多数人认为有效的那些块。第一个密码货币开始被称为创世纪块，它是唯一不包含前一个哈希值的块。

参与者在比特币软件帮助下管理所有交易记录的分布式数据库(区块链)，这是比特币网络的基础。可信的第三方和机构(如银行、国家货币管理机构、中央银行)被需要大量计算和防伪的算法代替(如工作证明算法)。比特币所有权的证明可以存储在个人数字钱包中。比特币转换成其他支付方式的比率是由供求决定的。这可能引发投机性泡沫，目前这仍然是比特币能否被普遍接受需要解决的一个问题。

随着区块链的增长，这些任务变得越来越复杂，需要消耗越来越多的计算密集能力。计算强度意味着能源密集型。今天，人们很少考虑到计算密集型算法要消耗大量能源这一事实。2017年11月，比特币的计算网络消费在每个小时消耗的电力，与丹麦整个国家的消耗相当。因此，拥有廉价能源和能够为以高温状态运行的超级计算机降温的国家可以生产出最多的比特币(如中国)。除非采取对策和改进措施，这种计算只会增加能源问题以及相应的环境问题。数字化的发展取决于更好的基础设施的整体平衡、较少的能源消耗和更好的环境。

十三、超级智能

人工智能研究自诞生之日起就与人类未来的伟大愿景联系在一起。人工智能能代替人吗有些人已经在谈论即将到来的“超人”，引发了人们的忧虑和希望。(39)另一方面，这种贡献要求人工智能必须证明自己能够服务社会。笔者从大学时期以来就一直着迷于使人工智能成为可能的算法。但我们必须知道人工智能的基本知识，能够评估其功能和局限性。(40)令人惊讶的是，我所秉持的基本哲学观点还是如此，即最快的超级计算机也不会改变人类智能所能证明的逻辑数学基础。只有基于这方面的知识，才能评估其社会效果。我们应该抓住人类智能的这个机会!

【注释】

①Turing,AlanM.(1950):Computingmachineryandintelligence.In:Mind49.S.433-460.

②Mainzer,Klaus(2016b):Information:Algorithmus-Wahrscheinlichkeit-Komplexitt-Quantenwelt-Leben-Gehirn-Gesellschaft.Berlin:BerlinUniversityPress,p.3.

③Robinson,J.A.(1965):Amachineorientedlogicbasedontheresolutionprinciple.In:JournaloftheAssociationforComputingMachinery12:23-41.

④Schwichtenberg,H.(2006):Minlog.In:F.Wiedijk(ed.):TheSeventeenProversoftheWorld.LectureNotesinArtificialIntelligencevol.3600.Springer:Berlin:151-157.

⑤Mainzer,Klaus(2018):TheDigitalandtheRealWorld.ComputationalFoundationsofMathematics,Science,Technology,andPhilosophy.WorldScientificPublisher:Singapore.

⑥Grz,Günther;Schneeberger,Josef(Hrsg.)(2003):HandbuchderKünstlichenIntelligenz.München:Oldenbourg4.Aufl.Mainzer,Klaus(2003):KI-KünstlicheIntelligenz.GrundlagenintelligenterSysteme.Darmstadt:WissenschaftlicheBuchgesellschaft.

⑦Boersch,Ingo;Heinsohn,Jochen;Socher,Rolf(2007):Wissensverarbeitung.EineEinführungindieKünstlicheIntelligenzfürInformatikerundIngenieure.Heidelberg:Springer2.Aufl.

⑧Mainzer,Klaus(1994):Computer-NeueFlügeldesGeistesDieEvolutioncomputergestützterTechnik,Wissenschaft,KulturundPhilosophie.Berlin,NewYork:DeGruyter,pp.150-185.Puppe,Frank(1988):EinführunginExpertensysteme.Berlin:Springer.

⑨Weizenbaum,Joseph(1965):ELIZA-Acomputerprogramforthestudyofnaturallanguagecommunicationbetweenmanandmachine.In:CommunicationsoftheAssociationforComputingMachinery9:36-45.

⑩Mainzer,Klaus(2016a):KünstlicheIntelligenz.WannübernehmendieMaschinenBerlin:Springer,pp.55-58.

(11)Wahlster,Wolfgang(Hrsg.)(2000):Verbmobil.FoundationsofSpeech-to-SpeechTranslation.Berlin:Springer.

(12)Hausser,Roland(2014):FoundationsofComputationalLinguistics.Human-ComputerCommunicationinNaturalLanguage.Berlin:Springer3.Aufl.

(13)Chomsky,Noam(1969):AspektederSyntax-Theorie.Frankfurt:Suhrkamp.

(14)Ferrucci,David;Levas,Anthony;Bagchi,Sugato;Gondek,David;Mueller,ErikT.(2013):Watson:BeyondJeopardy!In:ArtificialIntelligence199.S.93-105.

(15)Picard,Rosalind(1997):AffectiveComputing.Cambridge(Mass.):MITPress.Minsky,Marvin(2006):TheEmotionMachine.CommonSenseThinking,ArtificialIntelligence,andtheFutureoftheHumanMind.NewYork:Simon&Schuster.

(16)Mainzer,Klaus(1997):Gehirn,Computer,Komplexitt.Berlin:Springer.

(17)Mainzer,Klaus(2010):LebenalsMaschineVonderSystembiologiezurRobotikundkünstlichenIntelligenz.Paderborn:Mentis,pp.45-88.

(18)Ritter,Helge;Martinetz,Thomas;Schulten,Klaus(1991):NeuronaleNetze.Bonn:Addison-Wesley.

(19)Kleene,StephenCole(1956):Representationofeventsinnervenetsandfiniteautomata.In:Shannon,Claude;McCarthy,John(Hrsg.):AutomataStudies.Princeton:PricetonUniversityPress,NJ.S.3-41.

(20)Hopcroft,JohnE.;Motwani,Rajeev;Ullman,JeffreyD.(2001):IntroductiontoAutomataTheory,Languages,andComputation.Readings:AddisonWesley.

(21)Siegelmann,HavaT.;Sontag,EduardoD.(1995):Oncomputationalpowerofneuralnetworks.In:JournalofComputerandSystemSciences50(1):132-150.

(22)Siegelmann,HavaT.;Sontag,EduardoD.(1994):Analogcomputationvianeuralnetworks.In:TheoreticalComputerScience131:331-360.

(23)Ebbinghaus,H.-D.;Hermes,H.;Hirzebruch,F.;Koecher,M.;Mainzer,K.;Neukirch,J.;Prestel,A.;Remmert,R.(1991):Numbers.Springer:Berlin3rdedition.

(24)Mainzer,Klaus(2016a):KünstlicheIntelligenz,PP.195-201.

(25)Hotz,Günter;Walter,Hermann(1968-1969):AutomatentheorieundformaleSprachenI-II.Mannheim:B.I.Wissenschaftsverlag.

(26)Blum,Leonore;Shub,Mike;Smale,Steve(1989):Onatheoryofcomputationandcomplexityovertherealnumbers:NP-completeness,recursivefunctionsanduniversalmachines.In:Bull.Amer.Math.Society(N.S.)21(1).S.1-46.

(27)Mainzer,Klaus;Chua,Leon(2011):TheUniverseasAutomaton.FromSimplicityandSymmetrytoComplexity.Berlin:Springer.

(28)Bishop,Christopher(2006):PatternRecognitionandMachineLearning,NewYork:Springer.Sutton,RichardS.;Barto,AndrewG.(1998):Reinforcement-Learning:AnIntroduction.MITPress:Cambridge(Mass.).

(29)Silver,David;Huang,Ajau.a.(2016):MasteringthegameofGowithdeepneuralnetworksandtreesearch.In:Nature529:484.

(30)Knight,W.(2017):TheDarkSecretattheHeartofAI.In:MITTechnologyReview.April11:1-22.

(31)Simon,Herbert.1957.AdministrativeBehavior:AStudyofDecision-makingProcessesinAdministrativeOrganizations.NewYork:MacMillian.

(32)Bowling,M.;Burch,N.Johanson,M.;Tammelin,O.(2015):Heads-upholdempokerissolved.In:Science347(6218):145-149.

(33)Brown,N.;Sandholm,T.(2017):ReducedSpaceandFasterConvergenceinImperfect-InformationGamesviaPruning.In:InternationalConferenceonMachineLearning(ICML).

(34)Mainzer,Klaus;Chua,Leon(2013):LocalActivityPrinciple.London:ImperialCollegePress.

(35)EconomistStaff(2015):Blockchains:Thegreatchainofbeingsureaboutthings.In:TheEconomist31.October.

(36)Narayanan,A.;Bonneau,J.;Felten,E.;Miller,A.;Goldfeder,S.(2016):BitcoinandCryptocurrencyTechnologies.AComprehensiveIntroduction.PrincetonUniversityPress:Princeton.

(39)Good,IrvingJohn(1965):Speculationsconcerningthefirstultraintelligentmachine.In:AdvancesinComputers6.:31-88.Bostrom,Nick(2014):Superintelligenz.SzenarieneinerkommendenRevolution.Berlin:Suhrkamp.

(40)Mainzer,Klaus(2014):DieBerechnungderWelt.VonderWeltformelzuBigData.München:C.H.Beck.

THE END

克劳斯?迈因策尔人工智能与机器学习：算法基础和哲学观点

成为一名顶尖程序员，你需要多少数学知识？极客时间微软编程算法

学习算法导论需要什么数学基础或者其他的基础–PingCode

艺术生集训时间是在什么时候大概需要多少钱

克劳斯?迈因策尔人工智能与机器学习：算法基础和哲学观点

Spark入门：SparkMLlib介绍

商务数据分析（第4次开课）大学慕课

算法与数据结构

学习算法，你需要掌握这些编程基础（包含JAVA和C++）短短的路走走停停