上海交大ACM班出品,动手学机器学习!算法编程人工智能

最近,彪悍的上海交大ACM班俞勇教授团队推出了一本重量级新书——《动手学机器学习》。这对于技术人来说是难得的福音,因为它一次性讲明白了机器学习这回事。

点击封面,即可5折购书,限50人

上海交大ACM班到底有多彪悍?看看它的杰出校友们吧。

科研领域有在斯坦福任教的杨笛一,有在卡耐基梅隆大学任教的陈天奇,他也是XGBoost作者、TVM发起人。企业界则有依图科技联合创始人林晨曦,第四范式创始人戴文渊。MXNet的作者大神李沐,其所著的《动手学深度学习》更是诸多技术人的必读经典。

因此ACM班在业界享有中国AI人才的“黄埔军校”之称。了不起的成就背后是伟大的愿景,ACM班的创立者俞勇教授一直在为培养中国的图灵奖得主而努力。颁发图灵奖的机构就是ACM(美国计算机协会),可见俞勇教授给ACM班取名时就寄予了多么深切的期望。

ACM班总教头:俞勇教授

《动手学机器学习》的内容来自于ACM班的一线教学实践。本书作者之一张伟楠根据自己讲授机器学习课程的体会与学生反馈,将理论知识与练习代码进行体系化整理形成初稿。

02

弄懂机器学习要学会什么

《动手学机器学习》的定位是在引领初学者入门,在内容设置上是从讲解基础理论算法开始,逐渐进入有监督学习模型与无监督学习模型的论述,力求让学习者系统化掌握机器学习的主干知识。

本书的主创团队有三位作者,除了总教头俞勇教授,还有将教学成果整理成书的张伟楠副教授,他在强化学习、数据挖掘、知识图谱等领域颇有建树。作者赵寒烨也在强化学习、机器学习方面有着深入的研究。

实力如此强劲的技术天团,为本书在业界树立了权威的标杆。

下面对书中四个主要部分的内容进行说明。

机器学习基础

在基础部分,主要是帮助学习者抓住最核心的概念和原理,讲解了最基础的两个算法:KNN(K近邻算法)和线性回归。基于这两个算法讨论了机器学习的基本思想与实验原则。

扎实掌握好这部分内容,就具备了在大部分机器学习场景中上手实践解决问题的能力。

参数化模型

本部分主要是讨论监督学习任务的参数化模型,包括逻辑斯谛回归、双线性模型、神经网络与多层感知机、卷积神经网络、循环神经网络等内容。

这些方法的共通特征,主要是基于数据的损失函数对模型参数求梯度,进而更新模型。

非参数化模型

这部分聚焦在监督学习的非参数化模型上,包括支持向量机、决策树、集成学习与梯度提升决策树等内容。

之所以将非参数模型单独作为一个部分,是为了让学习者从原理和代码方面更好地体会与参数化模型的区别、优劣。

无监督模型

本部分讨论了对于没有标注的数据进行处理的无监督学习方法,包括K均值聚类、主成分分析、概率图模型、EM算法、自动编码器等内容。

对无监督学习进行了不同任务、不同技术角度的讨论,让学习者可以充分体会与监督学习的区别。

现在知道了要学什么,接下来再说怎么学。

03

动脑也要动手

《动手学机器学习》的最大亮点就是为动手实践提供了傻瓜式的体验环境,主创团队将ACM班的实践成果精炼出来,理论与代码相结合,让学习者可以平滑上手。

书中包括机器学习的概念定义、理论分析和算法过程和可运行代码。学习者可根据自己的学习状况,灵活选择想要阅读的内容。

不过,毕竟不是零基础入门,在动手之前学习者要具备两项基础能力,一是数学概念和数理统计知识,包括矩阵运算、概率分布和数值分析方法等;二是基本的Python的编程能力,能看懂代码并调试运行。

本书丰富的技术案例涵盖了基础算法、监督学习的参数化模型与非参数化模型,以及非监督模型。对于书中提到的知识点,学习者都可以亲手实践。主创团队对代码示例进行了精心选择,力求功能简洁且易修改。

书中提供的代码都是基于Python3与PyTorch框架实现,可用任意支持ipynb格式的在线或本地工具运行。

示例中用到的Python工具库都有简要说明,每一份示例代码中都包含可以由学习者自行设置的变量,学习者可以实时修改并运行观察结果。

以下是在VisualStudioCode环境中运行KNN算法的实例。

代码区

运行输出结果

是不是意犹未尽?还有更多惊喜的富媒体学习资料,让我们来看一下。

在线教学视频:主创团队贴心地录制了视频课程。观看方式:看到书中出现“扫码观看视频课程”的图示,就立即拿起手机扫码吧。

配套PPT课件:方便学习者温习主干知识,也有利于教师备课。

课后习题:看看自己学得牢不牢,千万不要当半桶水先生,题目都要会做。

学习社群:三人行,必有我师。书中为大家提供了入群学习的方式,可随时随地与同行们交流。

《动手学机器学习》的内容在成书之前就经过了ACM班的教学检验,书中的原理讲解、算法说明、代码案例都在教与学的互动中去芜存菁,可以说这本书就是思考与实践的淬炼结晶。

当先进的教学成果走出校园,在业界传播普及机器学习知识,推动了产业的发展时,也引得大佬们交口称赞。

本书从机器学习的基本概念入手,结合sklearn机器学习算法库,以大量示例和代码带领读者走进机器学习的世界。

——周志华南京大学计算机科学与技术系主任

兼人工智能学院院长

本书源自上海交通大学ACM班机器学习课程讲义,着力帮助读者融会贯通,深入理解机器学习原理并提高动手实战能力,是培养新一代人工智能实战型人才不可多得的好书。

——朱军清华大学计算机科学与技术系博世人工智能冠名教授、IEEE会士

本书是全面、系统的机器学习教材,主要介绍机器学习的核心概念及代表性方法。本书不仅涵盖神经网络、集成学习等经典的机器学习理论,还配备可在线运行的代码,帮助读者通过动手实战来加强对机器学习技术的理解。无论是初学者还是行业人士,都能从本书中得到有价值的帮助和指导。

——李文新北京大学计算机学院教授、北京市教学名师、北京大学计算机实验教学中心主任

本书形态新颖、丰富。纸质图书对机器学习的知识体系进行系统介绍,理论解读视频课程对疑难知识点进行更透彻的讲解,代码支持在线运行、修改,习题帮助读者检验、巩固学习效果,教学课件帮助高校教师备课。本书既能为行业人士自学机器学习提供体系化的学习资源,又能通过动手学的方式帮助高校教师和学生完成机器学习的教学与学习。

——黄萱菁复旦大学计算机科学技术学院、现代语言学研究院教授

智能化升级已成为当代企业在数字化转型后攀登的新阶梯。为此,需要大量具备专业知识的人工智能人才,他们不仅要深入理解人工智能的理论和算法,更应具备实战能力,以应对实际应用场景中的挑战。本书正是为培养这种实战型人工智能人才而编写的,内容详实、示例丰富、代码清晰,强烈推荐给所有希望深入了解人工智能并进行动手实战的读者。

——刘铁岩微软杰出首席科学家、微软研究院科学智能中心亚洲区负责人、微软亚洲研究院副院长

上海交通大学ACM班注重培养学生扎实的专业基础和动手实战能力。俞勇老师团队编写的这本书体现了上海交通大学ACM班在人工智能基础模块人才培养方面的特色理念,在此推荐给各位读者。

——陈天奇卡内基梅隆大学机器学习系、计算机科学系助理教授

04

玩转机器学习要用好非显式编程

从根本上说,机器学习是一门研究算法的学科,而这些算法的作用,就在于能够通过非显式编程(non-explicitprogramming)的形式,利用经验数据提升某个任务的性能指标。

所以这里的难度在于,即使我们理解了算法,也无法从结果倒推回去,这是难以还原的。显式编程则直观得多,直接针对问题给出解答,例如要对一组数据排序,就实现一个快速排序算法。

对于学习者来说,要将机器学习在自己的业务领域内应用好,就要转变思维,“往后站一步”,从显式编程转为编写机器学习算法程序。这就是非显式编程的含义,在不同任务中,基于任务自身的数据,训练出一个解决问题的模型。

1-1传统的显式编程与机器学习的非显式编程

《动手学机器学习》就是要帮助学习者系统化地理解机器学习,弄明白算法原理,学会用非显式编程解决自己的问题。书中对每种算法都给出了开箱即用的示例代码,学习者轻松扩展一下就可以用在实际工作中。

▲点击封面,即可5折购书

现在,分析一下手头上的任务和数据,赶紧把机器学习方法用起来,成为智能时代的超级个体吧!

THE END
1.23个机器学习最佳入门项目(附源代码)机器学习项目项目构想:在该项目中,我们可以构建一个界面来预测红酒的质量。它将使用葡萄酒的化学信息,并基于机器学习模型,它将为我们提供葡萄酒质量的结果。 数据集:葡萄酒质量数据集 https://archive.ics.uci.edu/ml/datasets/wine+quality 9.假新闻检测项目 项目构想:虚假新闻像野火一样传播,这在这个时代是一个大问题。我们https://blog.csdn.net/2401_84132685/article/details/138934521
2.机器学习入门与实践:从原理到代码腾讯云开发者社区机器学习入门与实践:从原理到代码 在本文中,我们将深入探讨机器学习的基本原理和常见算法,并提供实际的代码示例。通过本文,读者将了解机器学习的核心概念,如监督学习、无监督学习和强化学习,以及如何在Python中使用Scikit-Learn库构建和训练机器学习模型。 介绍https://cloud.tencent.com/developer/article/2331257
3.机器学习及其Python实践中国农业大学本课程面向本科生专业研究开发与创新能力培养,重点讲解机器学习的基本原理和前沿思想,并使用Python语言同步开展机器学习编程实践。课程适用于大学本科二年级以上同学。 播放00:00:00/00:00:0000:00:00全屏80%1.00X网络异常标清设置 开课时间: 2022-07-25 https://www.xuetangx.com/course/cau0809zw/12423305
4.新手如何使用Jupyter在线编程工具简介:Jupyter是一款流行的在线编程工具,广泛应用于数据科学、机器学习等领域。本文将介绍如何使用Jupyter,以及如何解决pip后出现打不开网页的问题。 即刻调用文心一言能力 开通百度智能云千帆大模型平台服务自动获取1000000+免费tokens 立即体验 一、安装Jupyter首先,你需要安装Jupyter。如果你使用的是Python,你可以使用pip命令https://developer.baidu.com/article/details/2798324
5.Python人工智能编程在线课程01Python人工智能编程班学习内容 Level 1 Level2 Level3 Level4 Level5 Level6 Level7 Python趣味游戏编程 Python智能场景编程 WEB网页编程 WEB服务器编程 人工智能算法编程 A手机基础编程 Al手机编程 Python语言基础 Python语言人工智能初步 JavaScriptHTMLcss Python WEBMysQL数据库 语音识别图像识别机器学习深度学习 https://www.houxue.com/cs/kecheng-891850.html
6.机器学习开发者指南本书的目标读者是那些期望掌握机器学习的相关内容、理解主要的基本概念、使用算法思想并能掌握正式数学定义的开发人员。本书使用Python实现了代码概念,Python语言接口的简洁性,以及其提供的方便且丰富的工具,将有助于我们处理这些代码,而有其他编程语言经验的程序员也能理解书中的代码。 https://labs.epubit.com/bookDetails?id=UBb658f203c0c4
7.机器学习算法原理与编程实践(郑捷)完整pdf扫描版[126MB]电子书下机器学习算法原理与编程实践是机器学习原理和算法编码实现的基础性读物,内容分为两大主线:单个算法的原理讲解和机器学习理论的发展变迁。算法除包含传统的分类、聚类、预测等常用算法之外,还新增了深度学习、贝叶斯网、隐马尔科夫模型等内容。对于每个算法,均包括提出问题、解决策略、数学推导、编码实现、结果评估几部分。https://www.jb51.net/books/527823.html
8.计算机python编程试题,机器学习,深度学习试题及答案.docx计算机python编程试题,机器学习,深度学习试题及答案.docx 4页VIP内容提供方:cheng 大小:24.81 KB 字数:约2.81千字 发布时间:2022-07-07发布于四川 浏览人气:85 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)https://max.book118.com/html/2022/0707/8076106015004116.shtm
9.汇智网汇智网是一个学习前沿编程技术的平台,提供了mongodb,node.js,javascript,jquery等相关的课程。汇智网互动式的学习和实时在线的练习,能让你迅速进入状态,快速完成课程学习。http://www.hubwiz.com/
10.《机器学习入门到实战——MATLAB实践应用》(冷雨泉张会文张伟当当网图书频道在线销售正版《机器学习入门到实战——MATLAB 实践应用》,作者:冷雨泉 张会文 张伟,出版社:清华大学出版社。最新《机器学习入门到实战——MATLAB 实践应用》简介、书评、试读、价格、图片等相关信息,尽在DangDang.com,网购《机器学习入门到实战——MATLhttp://product.dangdang.com/26916103.html
11.(全)2020吴恩达机器学习MachineLearning第三周编程作业ex2压缩包内含吴恩达老师《Machine Learning》课程第三周的编程作业ex2所需完成的五个m文件。压缩包中所有编程作业均为本人独立完成,并尽量使用向量化计算,全部满分通过。 吴恩达 Machine Learning 机器学习 matlab 2020-05-04 上传 大小:2KB 所需: 44积分/C币 立即下载 吴恩达https://www.iteye.com/resource/qq_40329272-12387383
12.Sklearn应用案例菜鸟教程鸢尾花数据集(Iris Dataset)是机器学习中最经典的入门数据集之一。 鸢尾花数据集包含了三种鸢尾花(Setosa、Versicolor、Virginica)每种花的 4 个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。 接下来我们的任务是基于这些特征来预测鸢尾花的种类。 本章节案例将涵盖数据加载、可视化、特征选择、数据预处理、建立分类模https://www.runoob.com/search/Java/1.htm%3F%26page%3D42?page=4
13.「限时」机器学习的10个免费在线项目,等你来试试「限时」机器学习的10个免费在线项目,等你来试试,对代码、编程感兴趣的可以关注老K玩代码和我交流!“最近又有小伙伴问我一些关于机器学习的问题,看来短期内“机器学习”的热度不减啊!因应K友们的关注,我这里给大家整理了10个机器学习相关的小项目。项目基本涵盖了各个https://blog.51cto.com/u_15069443/2576135
14.GitHub上高质量有趣实用的开源技术教程开发者工具编程Algorithms-Cheatsheet-Resources 印度一位小哥整理的计算机编程资源,主要包含多种编程语言的常用速查表、算法实现库、扩展学习资源等内容。覆盖机器学习、Python、Go、VSCode、JavaScript、Git 等技术领域。 The Algorithms GitHub 上最大的算法开源库,网站收录了 Python、Java、C++、JavaScript、Go 等多种主流编程语言的算https://github.com/551685830/GitHubDaily
15.GoogleColab官网,轻松拥有云端AI绘画,谷歌Colab,云端免费GPU+大Google Colaboratory(Colab)是一款基于云端的免费开源Jupyter环境,提供了丰富的机器学习和编程工具。通过Colab,用户可以利用强大的云端硬件资源进行计算密集型任务,无需担心本地资源限制。 借助Colaboratory(简称 Colab),您可在浏览器中编写和执行 Python 代码,并且: 无需任何配置 免费使用 GPU 轻松共享 无论您是一名学生https://biemoyu.com/sites/google-colab.html?menu-id=230&mininav-id=3292
16.编程一小时–不限年龄,只需1小时,了解最基础的编程知识编程一小时(Hour of Code Activities)是一个只需要 1 小时来学习编程的免费平台,属于 Code.org 的活动。它不限制年龄,只需要一台电脑、平板、手机,就可以免费学习的平台。里面有 Python、JavaScript、Lua、AI 和机器学习、CoffeeScript、方块编程、LEGO WeDo、Swift、我的世界教育版等课程内容,无需基础就能学习。@https://www.appinn.com/hour-of-code-activities/