南大周志华俞扬钱超最新力作:《演化学习:理论与算法进展》正式上线–江苏省人工智能学会

梯度下降或最速下降法,是机器学习最为重要的模块之一。尤其是在深度学习时代,梯度下降已成为不可或缺的组成部分。但同时,梯度下降也限制了机器学习推广到更广泛的一些任务中,例如不可微的目标函数。这一缺陷,却正好能被本书的主题「演化学习」解决。

最近,南京大学周志华教授、俞扬教授、钱超博士出版了一本名为「演化学习:理论与算法进展」的专著。在这本书中,总结了作者在这个主题上近二十年的研究成果,并从理论到算法概述了它对目前机器学习研究的意义。

目前,该书已在Springer官网正式上线,且开放了本书第一章的访问,为期一个月。

书籍简介

本世纪初,本书第一作者周志华与其合作者开展了「选择性集成」的研究,通过从一批训练好的神经网络中选择一个子集进行结合,泛化性能甚至优于结合所有神经网络。该工作中引入了一种名为遗传算法的演化算法(EvolutionaryAlgorithm,EA)。

周志华认为,演化算法作为一种强大的非经典优化方法,可能对许多机器学习任务都有用。但那时候,演化算法基本上都还是纯启发式的,理论氛围浓厚的机器学习社区并不青睐这一类方法。周志华相信演化算法在应用中神秘成功的背后必有理论解释,并决定开始研究。周志华的学生俞扬、钱超也相继投入该领域的研究,这一研究就是十几二十年。

经过周志华等研究者的共同努力,目前演化学习已经不再是完全缺乏理论支撑的「玄学」,其关键成分上已经有了理论结果,并且对算法设计能够给出一定的指导,使得演化学习成为一个有理论基础的研究领域。总而言之,这本书大部分内容都是三位作者在过去近二十年里取得的研究成果,值得一读。

内容概要

机器学习之所以称之为「学习」,很大程度在于模型会通过最优化方法逐渐「学习」一些新知识。但目前主流模型常常要求目标函数是连续、可微的,不然的话梯度下降方法难以有效。这是一个很强的要求,别说可微的目标函数,在一些机器学习任务中甚至都难以定义明确的目标函数。

这时就可以考虑使用无需明确给出目标函数形式的演化学习技术。而演化算法确实在很多应用中产生了令人惊艳的结果。不过由于演化算法的「启发式氛围」太过浓厚,很多结果都是经验性的,缺乏理论支持。最近很多研究者都在努力解决这个问题,而这本书则介绍了这方面的一系列探索与研究工作。

本书包含四部分内容:

作者们希望第二部分的通用理论工具可以帮助到有兴趣探索演化学习理论基础的读者;希望第三部分的理论结果可以加深读者对演化学习过程行为的理解,并且提供一些关于算法设计的见解;此外,作者们还希望第四部分的算法可以有效地用于机器学习实际应用中。

作者简介

本文作者主要有三位:

周志华,现任南京大学人工智能学院院长,南京大学计算机科学与技术系主任、南京大学计算机软件新技术国家重点实验室常务副主任、机器学习与数据挖掘研究所(LAMDA)所长,校学术委员会委员。周志华是ACM、AAAI、AAAS、IEEE和IAPRFellow,主要从事人工智能、机器学习、数据挖掘等领域的研究工作。

什么是演化学习

对于大部分读者而言,机器学习和梯度下降已经是老朋友了,但演化学习却相对陌生。我们可以将各种机器学习算法总结为三大主要模块,即如下所示的模型表征、模型优化和模型评估。

原书图1.1:典型机器学习过程的三大组成模块。

我们很容易理解,ML需要支持向量机、神经网络或决策树等算法构建模型空间,然后在训练数据上利用学习算法找更好的解决方案。当然,在找最优模型的过程中,模型评估会将模型的好坏直接反馈给学习算法,从而指导学习的持续进行。

那么EA在机器学习中处于什么位置呢?按照维基百科的描述:「演化算法启发自生物的演化机制,模拟繁殖、突变、遗传重组、自然选择等演化进程,从而对最优化问题的候选解做演化计算。」所以,演化算法对应于上图的学习算法,它是一种模拟自然演化的「学习过程」。

所以演化学习究竟是怎样进行的,它会不会也有这样一个整体框架?后面我们将介绍该书第一章描述的演化学习。

演化学习的主要流程

演化算法(EA)是一大类启发式的随机优化算法,它受到了自然演化的很多启发。一般EA会考虑两个关键因素来模拟自然过程,即变异繁殖(variationalreproduction)和择优挑选(superiorselection)。尽管演化算法有很多不同的实现,例如遗传算法(GA)、遗传规划(GP)和进化策略(ES),但典型的EA主要能抽象为以下四个步骤:

1.生成一组初始解(称为种群/Population);

2.基于现有的种群繁衍一些新的解(solution);

3.移除种群中相对差的解;

4.返回第二步并重复运行,直到遇到了终止标准。

这四步可以构成演化算法的主要流程:

原书图1.2:演化算法的一般结构。

演化算法实例

在使用EA解决最优化问题之前,我们需要决定如何表示解(solution)。例如,如果问题是从基准集中选择一个子集,那么一个解可以自然地表示为一个布尔值(0或1)向量。如下图1.3所示,{v1,v2,...,v8}的子集能自然地表示为长度为8的布尔值向量。其中第i个元素为1意味着选择了v_i,因此{v1,v3,v4,v5}能表示为(1,0,1,1,1,0,0,0)。

原书图1.3:表示解的一个案例。

基于解的表征方法,EA通过图1.2所示的循环就开始了演化。在循环演化过程中,EA会保留解的整个种群,并通过迭代繁衍新的后代解而不停地更新种群。突变与重组(或称为交叉)是繁衍的两种常见操作方法。突变(Mutation)会随机修改一个解以生成新的解。

如下,图1.4展示了布尔值向量所产生的单个元素突变,即随机选择一个元素,并将其修改为另一个布尔值。

原书图1.4:布尔值向量解上的单比特变异。算法首先会随机选择Parent解上的一个位置,然后改变该位置的布尔值,并生成后代解。

重组会混合2个或多个解以生成新的解。下图1.5展示了两个布尔值向量所完成的单点重组,即随机选择一个位置,然后交换该位置后面的值。

原书图1.5:两个布尔值向量上的单点重组。算法随机选择两个Parent解的某个相同位置,并交换该位置后面的值而生成两个后代解。

从整个迭代过程中可以看到,EA在求解最优化问题时,它只需要以某种方法表示解,并能够对解的好坏进行评估,从而可以搜索更好的解。因此,EA在没有梯度信息、甚至在没有明确目标函数时都能使用,它只需要存在某种方法能通过实验或模拟评估解的好坏就行。因此,EA被视为一种通用的最优化算法,我们甚至能以「黑盒」的方式解决某个最优化问题。

由于通用属性,很多研究者已经利用EA来解决机器学习中的复杂最优化问题。例如,EA可以用来最优化神经网络,包括连接权重、架构和学习规则。这种演化的人工神经网络模型能实现非常好的性能,甚至能媲美手动设计的模型。然而,尽管演化学习已经取得了很多成功,但它缺少坚实的理论基础,也很难受到机器学习社区的广泛认同,本书介绍了作者们为此作出的努力。

THE END
1.必知!人工智能10大热门算法!人工智能算法有哪些模型原理:逻辑回归是一种机器学习算法,专为解决二分类问题而设计。该算法能够将连续的输入变量映射到离散的输出结果,通常以二进制形式表示。通过应用逻辑函数,逻辑回归将线性回归的预测结果转换到(0,1)的范围内,从而生成分类的概率。 模型训练:逻辑回归模型的训练依赖于已知分类的样本数据。在训练过程中,通过优化模型的https://blog.csdn.net/m0_74914256/article/details/141901236
2.编程35种算法汇总编程35种算法是编程世界的核心,它们可以解决各种问题。从搜索和排序到图算法和动态规划,每种算法都有其独特的应用场景。通过掌握这些算法,您将能够更好地理解编程世界的奥秘,并且能够更高效地解决问题。无论您是新手还是有经验的程序员,学习和掌握这些算法都是必不可少的。希望本文对您有所帮助,并能够激发您在https://baijiahao.baidu.com/s?id=1781330184170815567&wfr=spider&for=pc
3.智能降管理——开启降领域新时代瞪羚云长城战略咨询目前美国有70%的人享有健康管理服务,而中国享有这项服务的人不足0.1%,随着中国经济不断提高,对健康管理需求将扩大。 ③国家政策支持及行业规划出台 表2-1国家部分相关政策、战略及行业报告列表 ④人工智能技术的大力提升 以深度卷积神经网络为核心的深度学习算法,加速了人工智能技术发展,带动了健康管理领域与其的跨界https://www.chinagazelle.cn/news/detail/45e80a28ed074d97b8a56b4ffba42e6d
4.性能提升成本降低,这是分布式强化学习算法最新研究进展分布式强化学习是一个综合的研究子领域,需要深度强化学习算法以及分布式系统设计的互相感知和协同。考虑到 DDRL 的巨大进步,我们梳理形成了 DDRL 技术的展历程、挑战和机遇的系列文章。我们在 part 1 部分回顾了经典的 DDRL 框架,在本部分,我们利用三篇论文,具体分析 DDRL 的今生 --- 最新研究进展。 https://www.thepaper.cn/newsDetail_forward_26353658
5.太全了!自学机器学习算法学习路线图,有配套视频+实战项目,完全自学机器学习需要学习以下几个主要方面的内容: 一、数学基础线性代数: 【1】理解向量、矩阵的基本运算,如加法、减法、乘法等。 【2】掌握矩阵的特征值与特征向量的概念及计算方法,这在主成分分析等算法中非常关键。 【3】熟悉线性方程组的求解,对于理解线性回归等算法的原理有重要作用。 https://www.bilibili.com/read/cv37461164
6.科学网—[转载]联邦学习算法综述摘要:近年来,联邦学习作为解决数据孤岛问题的技术被广泛关注,已经开始被应用于金融、医疗健康以及智慧城市等领域。从3个层面系统阐述联邦学习算法。首先通过联邦学习的定义、架构、分类以及与传统分布式学习的对比来阐述联邦学习的概念;然后基于机器学习和深度学习对目前各类联邦学习算法进行分类比较和深入分析;最后分别从通信https://blog.sciencenet.cn/blog-3472670-1280769.html
7.学习,是治愈焦虑的良药只有不断学习、奔跑、更新自己的知识体系,外界发生的变化才不足以影响我们。 相反,如果我们在焦虑的时期选择躺平、摆烂,却不去学习,还抱怨不休,那么我们就会陷入双重困境,无法自拔。 二、建立一套有意识的学习算法 1.人的学习风格天然存在差异 我曾采访过很多人,包括小朋友,发现每个人的学习方法都不一样。在课堂上https://36kr.com/p/2375197738412036
8.你应该知道的十种机器学习算法机器学习/人工智能领域在将来是越来越受欢迎。由于大数据是目前科技行业最热门的趋势,机器学习非常强大,可以根据大量数据做出预测或计算建议。使用大量数据训练的深度学习算法,构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT、文心一言等等,都是机器学习的伟大产物。 https://www.51cto.com/article/771973.html
9.强化学习(Qfuncation,DQN)基本介绍目前强化学习的算法 基本算法分类 强化学习的算法基本上都包含了价值函数。一种价值函数是关于状态的价值函数 ,用来评判agent所处状态的好坏;另一种价值函数是关于状态-动作的价值函数 ,用来评判当前状态s下所采取的行动a的好坏。 关于model-free 和 model-based的区别(个人觉得这位网友的评论比较容易理解): https://www.jianshu.com/p/230bae5ca3d1
10.目标跟踪入门——目标跟踪算法综述电子创新网Imgtec社区深度学习不需要自己设计特征,它可以自己在数据中学习到目标的特征,同时也有自己的分类器,也就是说将寻找特征和分类结合在一起。深度学习的效果也是非常的好,在最近的图像比赛中,冠军都是使用深度学习来实现的。目前的深度学习算法包括R-CNN,Fast R-CNN,Faster R-CNN等深度分类方法,也包括 YOLO(you only look oncehttps://imgtec.eetrend.com/blog/2019/100017436.html
11.深度学习高手笔记卷1:基础算法京东集团副总裁,京东零售技术委员会数据算法通道会长 前言 目前人工智能(artificial intelligence,AI)在计算机界非常火热,而其中深度学习(deep learning,DL)无疑是更为火热的一个领域,它在计算机视觉、自然语言处理、语音识别、跨模态分析、风控建模等领域均取得了突破性的进展。而且近年来该领域的优秀论文、落地项目也层https://www.epubit.com/bookDetails?id=UB7d8623610d375
12.强化学习系列案例强化学习实验环境Gym和TensorFlow强化学习系列案例 | 强化学习实验环境Gym和TensorFlow 查看本案例完整的数据、代码和报告请登录数据酷客(cookdata.cn)案例板块。 强化学习算法的实现需要合适的平台和工具。本案例将首先介绍目前常用的强化学习实现平台Gym的基本使用方法,再介绍实验工具TensorFlow的基本操作方法,为之后构建和评估强大的强化学习算法打下坚实https://cloud.tencent.com/developer/article/1619441
13.《集异璧之大成》阅读笔记及杂谈(附录一):人机博弈当然在游戏的算法当中使用的不仅仅是蒙特卡洛算法,其它还有很多——不同算法对应不同问题,构建一个足够复杂的,更高可玩性的,更贴近现实的游戏数据系统。蒙特卡洛算法也常用于机器学习,特别是强化学习的算法中。一般情况下,针对得到的样本数据集创建相对模糊的模型,通过蒙特卡洛方法对于模型中的参数进行选取,使之于原始数https://www.gameres.com/846786.html
14.算法数据结构体系学习班马士兵教育官网注意原“算法与数据结构基础班”已经过期。所有内容都被现在的“算法数据结构体系学习班”重新讲述,还增加了内容,增加了题目练习。原“算法与数据结构基础班”的所有内容,对应现在的“算法数据结构体系学习班”的1-23节。 注意原“算法与数据结构进阶班”已经过期。所有内容已经被现在的“算法数据结构体系学习班”和“https://www.mashibing.com/course/339
15.统计学习方法(豆瓣)—— 引自章节:第一篇 监督学习 算法2.2 (感知机学习算法的对偶形式) (3) 如果 y_i(\sum_{j=1}^N \alpha_j y_j x_j \dot x_i+b) \le 0, \alpha_i \leftarrow \alpha_i+\eta b \leftarrow b + \eta y_i (查看原文) https://book.douban.com/subject/10590856/
16.年,寻找反向传播的生物机制神经元生物大脑传播算法Richards 团队的最新研究表明,「我们目前已经达到这样的水平: 通过相当真实的神经元模拟,我们可以训练锥体神经元网络来完成各种任务,」Richards表示。「然后使用这些模型的稍微抽象的版本,我们可以利用锥体神经元网络,来学习人们在机器学习中所做的那种困难的任务。」 https://www.cn-healthcare.com/articlewm/20210225/content-1192821.html