论新一代人工智能与逻辑学的交叉研究

摘要:新一代人工智能以大数据和机器学习技术为核心,实行的是联结主义的路径。该路径在场景相对封闭的数据密集型应用中取得了巨大成功,但面临可解释性差、伦理对齐困难、认知推理能力弱等瓶颈问题。为了在一定程度上解决这些问题,不可避免地涉及对开放、动态、真实环境中信息的刻画,以及对人类推理和解释机制的建模。形式论辩可以提供不一致情境下知识表示与推理的通用机制,与偏好、权重、概率等决策因素的灵活结合机制,局部化和模块化的语义高效计算机制,以及基于论证和对话的可解释机制等。有机结合形式论辩与现有大数据和机器学习技术,有望在一定程度上突破现有技术瓶颈,促进新一代人工智能的健康发展。

关键词:新一代人工智能;认知推理;伦理对齐;可解释性;形式论辩

作者廖备水,浙江大学哲学学院教授(杭州310058)。

一、新一代人工智能的瓶颈问题及其所涉及知识的特点

(一)可解释性问题及其所涉及知识的特点

(二)伦理对齐问题及其所涉及知识的特点

第一,不同的规范之间可能存在冲突。这些冲突可能发生于同一伦理体系内不同伦理原则之间,或者不同伦理体系的不同伦理规范之间。在多智能体场合,冲突可能存在于个体智能体内部,或者不同智能体之间。由于冲突的存在,智能体需要依据特定的评价标准(如道德上的、利益上的、审美上的)做出选择。

(三)认知推理问题及其所涉及知识的特点

新一代人工智能以大数据和机器学习为核心,但当前作为机器学习典型方法的深度学习只能做到“感觉”(sensation),达不到“感知”(perception),更缺少认知推理的能力。为了完成复杂的任务,人工智能系统除了感知和行动之外,还需要理解、推理、自主决策等能力以解决复杂场景的困难问题。

因此,为了实现认知推理,智能系统需要具备获取知识、表达知识、更新知识和对知识进行推理的有效途径。知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。现有的机器学习方法从大数据中发现和构造知识图谱,积累了大量的知识。然而,在由机器自动建构的知识图谱中,往往存在不完备的、不确定的、甚至冲突的信息和关系。此外,知识图谱中的知识还具有动态性,即新知识可以随时加入或删除,且新知识可能与已有的知识发生矛盾。这些都是认知推理问题所涉及的知识的特点。

二、传统逻辑学理论面临的挑战

前述新一代人工智能发展所面临的三个瓶颈问题及其所涉及知识尽管在种类上有所区别,但都具有不完备性、不确定性、不一致性等特点。同时,这些知识都来自开放、动态、真实的环境。作为计算机科学的数学基础的经典逻辑(数理逻辑)无法表示和处理这类知识,而传统非单调逻辑虽然在理论上克服了该问题,但在普遍适用性、可计算性、动态性和易解释性方面存在重要挑战。

(一)知识的不完备性、不确定性和不一致性:对经典逻辑的挑战

此外,当人们运用不完备或冲突的信息进行推理时,一个结论可以依据局部信息推出,但从全局看,可能存在与其前提、结论或推理关系相矛盾的信息。这样,一个结论是否可以被推出,取决于是否存在与支持它的论证相矛盾的信息。当主体只能依据局部信息进行推理时,得到的结论可能是暂时的。当新的(矛盾)信息出现时,原有的结论可能被推翻。例如,当价值“保护病人健康”排在价值“保护病人自主权”之前时,依据Γ和由价值排序决定的规范之间的偏好关系会得到结论r。现在,假设存在另外一条规范“当病人正在处理紧急事件时,(为了保护病人的安全)不应该给他服药”和一个命题“病人正在处理紧急事件”。如果价值“保护病人安全”排序最高,则结论r将被推翻,而结论成立。这样的非单调性在经典逻辑的推出关系中不成立。反之,经典逻辑具有单调性,即如果由一组前提集合Γ可以推出结论φ,则对于任意包含Γ的前提集合Γ′,后者也能推出φ。

(二)普遍适用性、可计算性、动态性和易解释性:对传统非单调逻辑的挑战

上述非单调逻辑系统尽管满足了例外可表达和推理非单调这两个重要特性,但仍然存在不少问题,不能直接用于解决新一代人工智能的瓶颈问题。

第一,在冲突处理方面,传统非单调逻辑系统适合于表达由例外引起的冲突,但难以表达实践推理和多主体交互中的各种冲突,从而通用性较低。在实践推理中,规范之间的冲突可能来自主体的不相容的决策或行动选项,而不一定是例外,如上述规范r1—r3。在多主体交互的推理中,主体通过交换论证、比较论证和评估论证来实现说理的目的。这种基于论证的推理模式难以在传统非单调逻辑中得到直接表达。

第三,对于非单调的推理系统,新信息的加入可能引起已有推理结果的变化。在系统计算复杂性很高的情况下,如果在新信息加入后需要重新计算所有的推理结果,不仅低效,而且在许多情况下也是不可行的。为了解决该问题,一种自然的解决思路是对系统的动态性进行局部化处理。然而,在传统非单调逻辑系统中,难以区分局部推理和全局推理,给动态性的局部化处理带来了根本性的困难。例如,在缺省逻辑中,命题的一个证明是由若干缺省规则组成的有穷序列。缺省规则由三部分组成:先决条件、缺省条件和结论。对于序列中的每条推理规则,需要检查其先决条件是可证的,而缺省条件的反面是不可证的(即该规则的实施不会引起不一致性)。由于证明的过程伴随着一致性检查,每条规则的可应用性(局部推理)和整个证明是否成功(全局推理)是结合在一起的。因此,当信息发生变化时,通过重新检查所有证明或构造新证明来刻画系统的动态性,显然是低效而困难的。

三、基于形式论辩的研究路径

上一节的分析表明,在新一代人工智能背景下,为了实现对不完备、不一致信息的表示和推理,并解决可计算性、动态性和易解释性等方面的问题,不仅在逻辑基础理论方面要求有新的方法,而且在计算高效性和人机交互有效性方面也需要有新的机制。

在探究这些新方法和新机制的过程中,一种自然的思路是回归到人类的常用推理和说理模式。众所周知,人类的推理和说理经常以交换论证的形式进行。直觉上,一个内部自洽的论证是可接受的,当且仅当与之有冲突的其他论证均被拒绝。通过这种方法,一致性仅限于论证内部,而不同的论证之间可以有冲突。当新的论证出现时,与之存在冲突关系的其他论证的状态可能发生变化。换句话说,这种基于论证和论证之间交互的方法不仅可以表达不完备的、不一致的知识,而且可以实现非单调推理。沿着这个思路,自然产生如下问题:这种以交换论证的形式进行的推理是否具有严格的数学模型?如果存在这样的模型,它与传统非单调逻辑有何关系?

鉴于上述原因,基于形式论辩的方法在解决新一代人工智能瓶颈问题方面有望发挥重要作用。接下来从五个方面对基于形式论辩的研究路径作介绍和分析。

(一)形式论辩理论

论辩是人类智能的重要方面,人们经常通过论辩来进行日常推理、科学决策、澄清观点等。在许多情况下,一个观点是否可以被采纳,不是完全取决于该观点的真假,而是取决于与支持该观点的论证有反对关系的其他论证的状态。人类推理经常以交换论证的形式展开,且推理过程经常受语用因素的影响。为了刻画人类这种论辩机制的本质,使得该机制可以被应用于计算机科学领域,抽象论辩理论应运而生。该理论刻画了人类论辩的重要原则:“笑到最后的才是最好的”。基于该思路,潘明勇提出了抽象论辩框架的概念,并通过它来定义论证的可接受性。下面以一个例子来引入这一概念。

给定一个抽象论辩框架,可以通过建立具有一般意义的评价标准来定义论证集合的可接受性。通常把这样的评价标准称为论辩语义,而把每个可接受的论证集合称为该语义下的一个外延。与人类的推理直觉相对应,最基本的语义(称为可相容语义)必须满足无冲突性和可防御性。形式化地,我们说一个论证集合是无冲突的当且仅当E中的任何论证之间都不存在攻击关系,E可防御论证α∈A当且仅当对于每个攻击α的论证β,在E中都存在一个攻击β的论证。因此,无冲突性确保推理结果的协调性,而可防御性则反映了人类论辩机制的上述重要原则“笑到最后的才是最好的”。满足这两个条件的外延也称为可相容外延。在此基础上,通过添加其他条件,可得到其他语义下的外延。例如,若一个可相容外延包含它可防御的所有论证,那么它是一个完全外延;把一个极大的完全外延称为优先外延;把一个极小的完全外延称为基外延。上述例子所对应的抽象论辩框架(记作F1)如下图所示。它有两个优先外延E1={α,δ}和E2={β,δ},一个基外延E3={δ}。

(二)不一致情境下知识表示与推理的通用机制

以抽象论辩为基础的形式论辩理论刻画了人类推理的一般机制,使其具有良好的通用性。形式论辩不仅可以刻画传统非单调逻辑,而且可以用于建模其他各种不一致情境中的推理。

在不完备知识的表达方面,基于形式论辩的方法与传统非单调逻辑方法不同。基于形式论辩的方法既不是通过给经典一阶逻辑的模型集合或可能世界集合添加限制条件,也不是在推理规则中增加“失败即否定”条件,而是通过添加新论证以攻击已有论证来实现的。例如,对于上述论证δ“一般情况下,电池显示正常”。在不存在其他论证时,论证δ自然成立。当有新的信息出现时,不需改变原来的论证,而只需增加新论证和攻击关系。例如,当出现新论证η“观察信息o3显示,此次电池显示存在异常”。这样,η击败δ,并得到一个新的抽象论辩框架(记作)。由此可见,通过增加论证和攻击关系的形式来刻画例外,更加灵活。它避免了重新构建论证或证明的过程,只要通过有向图中节点的添加,就可实现例外的表达。由于在一个抽象论辩框架中,论证的状态取决于与其具有攻击关系的其他论证的状态,因此关于论证状态的推理是非单调的。在前面的例子中,当论证δ没有攻击者时,δ是可接受的;当增加了攻击δ的论证η后,论证δ是被拒绝的,因此其结论也被拒绝而撤回。

在上述例子中,除了认识推理,还有规范推理。规范之间的冲突也可以表示为相应论证之间的攻击关系。这样,因果推理、知识图谱推理、规范推理等在形式论辩中均可以得到统一表达。

此外,在形式论辩理论中,区分局部推理和全局推理。前者局限于个体论证内部,因此可以采用不同的推理形式,如演绎推理、基于可废止规则的推理、基于论证图式的推理等,也可以是不同的推理种类,如认识推理、规范推理、因果推理等。这样,不同种类的论证可以被放在一个抽象论辩框架中评估。这种推理模式充分反映了人类推理和说理中可以包含各种推理类型的特点。

(三)与偏好、概率等决策因素的灵活结合机制

值得注意的是,形式论辩理论提供了表示和处理偏好或权重的方便机制。对于偏好,其基本原理是通过把组成论证的各部分的优先级提升到论证之间的优先级,即把个体之间的优先级提升到由个体组成的集合之间的优先级。为了达到该目的,通常采用民主原则或精英原则。给定集合X和Y,依据民主原则,说X优先于Y,当且仅当对于Y中的任意个体y,在X中都存在一个x,使得x优先于y;依据精英原则,说X优先于Y,当且仅当在Y中存在个体y,使得对于X中的任何个体x,都有x优先于y。尽管这两种原则不是普遍适用的,但在特定情况下有着较好的可应用性。

形式论辩理论还提供了表示和处理概率的机制。以上述例子为例,当运用观察信息进行推理时,由机器学习方法得到的信息存在不确定性。假定观察信息o2和o3的概率分别是p(o2)和p(o3)。于是,论证β有p(o2)的概率存在,论证η有p(o3的概率存在(即出现于论辩框架中)。当考虑论证的存在概率时,论证的可接受性也具有概率。这样,通过把概率理论和论辩理论结合起来,可以对既不一致又不确定信息进行表示和推理。值得注意的是,在许多情况下,信息的不一致性和不确定性无法单纯由概率理论或论辩理论来表达,而需要二者的结合。在图1的例子中,我们可以用论证之间的攻击关系来表示规范之间的冲突,而用论证的存在概率来表示观察信息的不确定性。

(四)基于局部化和模块化思想的高效语义计算机制

符号主义人工智能的瓶颈问题之一是计算复杂性问题。在引入非单调推理机制之后,相应算法的计算复杂性进一步提高了。因此,如何有效提高非单调推理系统的计算效率,降低计算复杂性,是逻辑学与人工智能交叉研究的重要问题。抽象论辩理论具有基于模块化和局部化思想的高效计算机制。

抽象论辩理论处理动态信息时同样具有高效的计算机制。论辩框架中动态性在多数情况下是局部的,不会波及整个论辩框架。于是,可以利用有向图中节点之间的可达关系,识别受影响的论证集合和不受影响的论证集合。这样,在多数语义下,只有受影响的论证集合需要被重新评估,因此可以达到局部处理系统动态性的目的。例如,添加论证θ“观察信息o2不可靠”。该论证攻击论证β。把θ加入后,得到。依据攻击关系,从θ出发,只有α和β是可达的。因此,可以把分解为受影响的部分和不受影响的部分。在多数论辩语义下,对于不受影响的部分,其外延保持不变;对于受影响的部分,其外延可以在一个受限的子框架中求解。

(五)基于论证的可解释机制

此外,从解释的机制看,可以采取不同的方式,如基于论证的对话机制、基于论证树的解释、基于子框架的解释等。

结论与展望

新一代人工智能的瓶颈问题给逻辑学的发展提出了新的挑战和机遇。该挑战的核心是要求基于逻辑的系统必须能够处理来自开放、动态、真实环境中的不完备、不确定和不一致的信息,同时在可计算性、动态性和可解释性方面具有良好性能。传统非单调逻辑克服了经典逻辑的缺陷,能够表示不完备信息并进行非单调推理,但在通用性、可计算性、动态性和易解释性等方面存在不足。形式论辩作为一种关于冲突的演算,通过分层抽象的方式来刻画人类推理与说理方式,不仅可以等价表达多种传统非单调逻辑,而且为建模各种不一致情境中的推理提供了更加通用的模型。同时,在抽象论辩层次上,通过利用图论中节点可达关系和强连通分量等概念,建立分而治之的方法,可以在很大程度上提高系统语义的计算效率和系统动态性的处理效率。此外,基于论证的解释机制为提高人工智能系统的易解释性提供了一个重要途径。

此外,由上述分析可知,逻辑学基础理论的革新有利于促进新一代人工智能所面临瓶颈问题的解决。然而,如同人类的认知必须和感知相结合才能实现智能那样,人工智能的发展也离不开感知方法和认知方法的结合。因此,如何把基于逻辑的方法与机器学习方法相结合是一个需要进一步解决的挑战性问题。一方面,机器学习方法一般由数据驱动,主要采用概率和统计方法,反映的是某些特性的量的规定性。相反,有关概念和特性的逻辑表征体现的是事物的性质或关系。从认知科学的角度看,机器学习方法重在感知方面,而符号方法重在认知方面。人工智能不同研究范式的融合根植于它们所模拟的认知类型的可融合性。因此,需要把二者紧密联系起来。从方法的层面看,二者的结合路径可以多样化。

第一,在认知推理方面,基于知识图谱的认知推理是一个可行性较高的路径。一方面,人类的各种知识可以在知识图谱中得到恰当表达。尽管知识图谱中的知识可能是不完备的或存在冲突,但基于传统非单调逻辑或形式论辩的方法可以有效处理这类知识。另一方面,知识图谱的生成和演化可以基于机器学习方法。通过分类和聚类,新的知识不断被加入知识图谱或对知识图谱进行更新。这样,对于需要认知推理的时候,就可以利用基于知识图谱的推理来弥补数据驱动的机器学习方法在推理决策方面的不足。此外,在处理计算复杂性和系统动态性方面,基于形式论辩的方法提供了模块化和局部化的计算支持,可以在一定程度上提高系统的计算效率。

第二,在伦理对齐方面,事件分类、事实认定、价值原则获取、因果关系识别等可以运用机器学习方法,但社会规范和文化规范的表达、不同主体的价值及其排序的表征以及基于这些形式化知识的推理等,则只能采取符号方法。目前,国内外学者已通过各种方法来把机器学习与基于规则的知识表示结合起来,以实现伦理对齐。例如,结合量化论辩树和机器学习的方法用论辩树来表达网络诈骗案件的规范知识,用数据驱动的机器学习方法来获取论辩树中节点的初始值以及边的权重,以此来优化决策,克服法律规范难以在机器学习中得到明确表达的缺点;利用归纳逻辑编程来实现基于案例的学习,把伦理原则与公众意见结合起来,以指导公共政策。

THE END
1.如何抓住重点,系统高效地学习数据结构与算法?你是否曾跟我一样,因为看不懂数据结构和算法,而一度怀疑是自己太笨?实际上,很多人在第一次接触这些知识时,都会有这种感觉,觉得数据结构和算法很抽象,晦涩难懂,宛如天书。正是这个原因,让很多初学者望而却步。 我个人觉得,其实真正的原因是你没有找到好的学习方法,没有抓住学习的重点。实际上,数据结构和算法的东https://www.imooc.com/article/332964
2.6万字解决算法面试中的深度学习基础问题(二)稀疏表示的样本可以使得其数据集线性可分,使用SVM方法时能够有很好的性能,并且稀疏矩阵的已经有高效的存储方式,并不会带来额外的负担。 Adagrad 适合处理稀疏数据的原因:Adagrad 中每个参数的学习率: 假设有10000个样本,其中有9900个样本的特征 x1 的值为0,这就是稀疏的数据。 https://developer.aliyun.com/article/898789
3.机器学习使用ChatGPT准备算法面试题【机器学习】使用ChatGPT准备算法面试题,大模型AI知识评测在这个信息爆炸的时代,如何高效地学习和评测知识一直是一个备受关注的话题。人工智能技术提供了全新的学习和评测https://blog.51cto.com/u_15671528/7605657
4.腾讯Offer已拿,这99道算法高频面试题别漏了,80%都败在算法上3. 如何对类别变量进行独热编码? 4. 如何把“年龄”字段按照我们的阈值分段? 5. 如何根据变量相关性画出热力图? 6. 如何把分布修正为类正态分布? 7. 怎么简单使用PCA来划分数据且可视化呢? 8. 怎么简单使用LDA来划分数据且可视化呢? 深度学习类: https://maimai.cn/article/detail?fid=1699482551&efid=WqEcULyCOsAoPWgBSGGaFg
5.2023年,工业3D视觉或SLAM,我到底该如何高效学习?3D视觉工坊内有高质量教程资料,及时答疑解惑,助力高效解决问题 老客户优惠!七五折基础上再享优惠 「3D视觉从入门到精通」知识星球,致力于打造国内超一流的3D视觉学习社区。 经过5年多时间的沉淀,感谢各位星球嘉宾与小伙伴们的倾力分享,星球内汇集了3D视觉各个细分领域的非常丰富的学习资料。 https://www.shangyexinzhi.com/article/8944002.html
6.深入理解XGBoost:高效机器学习算法与进阶(豆瓣)本书以机器学习基础知识做铺垫,深入剖析XGBoost的原理、分布式实现、模型优化、深度应用等。 第1~3章使读者对机器学习算法形成整体认知,了解如何优化模型以及评估预测结果,并熟悉常用机器学习算法的实现原理和应用,如线性回归、逻辑回归、决策树、神经网络、支持向量机等。 https://book.douban.com/subject/34917865/
7.极客大学·算法训练营算法训练营即将开班,VIP 学习资料限时免费领取! 基础篇:如何高效学习数据结构与算法 前Facebook 工程师的“三位一体”高效学习法视频课、三张数据结构与算法知识图谱 训练篇:数据结构与算法进阶题库 讲师亲自整理的推荐题目及解法、算法训练营学员每周必刷必练题库 面试篇:不再让算法成为你的面试障碍 30 道大厂https://time.geekbang.org/college/algorithm/1000332?utm_source=time_web
8.2021届计算机科学方向毕业设计(论文)阶段性汇报在这其中所遇到的挑战有如何支持多种的语义表征任务,如何对每个实体动态的弹出实体创建菜单,以及一些网页格式问题等。 万梓煜 多智能体强化学习的实现 本次阶段性汇报主要介绍多智能体强化学习框架MALib的设计与完成情况,以及针对目前的研究内容实现的功能。其次介绍在当前框架上部分强化学习算法的复现情况以及遇到的https://zhiyuan.sjtu.edu.cn/html/zhiyuan/announcement_view.php?id=3943
9.如何在SAM时代下打造高效的高性能计算大模型训练平台由于SAM 模型依赖于深度学习算法,需要进行大规模的矩阵运算和神经网络训练。因此通常需要大量的计算资源来进行高效的图像分割。所以配置 SAM 环境时,需要确保服务器具备足够的 CPU 和 GPU 资源来支持 SAM 模型的计算需求。特别是在处理大规模图像数据集时,服务器需要具备较高的并行计算能力,以确保模型的高效运行。 https://xie.infoq.cn/article/d087adf2c7fbc034ad772fa41
10.更高效的视觉语音和文本的自监督学习腾讯云开发者社区Meta AI 宣布推出 data2vec 2.0,这是一种由 Meta AI 为语音、视觉和文本构建的新型通用自监督算法,在达到相同精度的同时,训练模型的速度比最流行的现有图像算法快 16 倍。 迈向高效学习的机器。Meta AI 正在构建一个更通用和有效的自监督学习算法,使用一个单一的学习目标却能从不同的模态有效学习。更有效地学习https://cloud.tencent.com/developer/article/2193216
11.力扣(LeetCode)全球极客挚爱的技术成长平台海量技术面试题库,拥有算法、数据结构、系统设计等 1000+题目,帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer。https://leetcode-cn.com/
12.MindSpore官网在昇思MindSpore Reinforcement 0.2版本中提供了一套面向强化学习领域的Python编程API,例如Actor用于环境交互获得奖励,Learner学习并更新策略,以及Trainer用于控制算法逻辑等抽象,使整个算法结构更加清晰、简洁,有助于高效的算法开发和模块复用;另外在仓库中内置了一些经典的强化学习算法,如DQN、PPO等(后续版本中将会持续更新https://www.mindspore.cn/news/newschildren?id=967