GitHub2K+星B站播放量超30万,大模型入门看这本书就够了!算法b站编程视频生成模型

喜欢AI,对ChatGPT超级好奇,但被市面上爆增的大模型书籍和教学视频弄得眼花缭乱?没事!Datawhale团队最新推出的“蝴蝶书”——《ChatGPT原理与应用开发》来啦!

这本书源自Datawhale开源项目HuggingLLM,GitHub2K+星、B站播放量超30万,是Datawhale在打造了“南瓜书”“蘑菇书”“熊猫书”后,推出的第4本王牌之作。

扫码5折购书,限100人

为什么创作这本书?

翻阅参与者在Github上提交的成功案例,我们看到:

有人机协同,创造未来的虚拟女友;

有应用非凡,前景无限的AI辅助自动标注;

有启迪人生,提高问商的助思者;

有模拟人生,脑洞不停的AINPC;

正如项目名字所寓意的那样,上万名参与者通过这个开源项目拥抱了AI时代的变化,无障碍地使用LLM创造了新的价值。

这个开源项目的组织者还在B站上同步更新视频教程,播放量高达31.1W,获得网友一片好评。

纸书做了哪些更新?

《ChatGPT原理与应用开发》是基于大语言模型进行商业应用开发的最佳实践书,更是值得你“好好上课”!

初心不改

本书内容也正如HuggingLLM最初的立项理由所述,主要是讲基于ChatGPT的算法应用和服务,聚焦于自然语言处理的常见任务和应用。它向我们介绍了如何使用类似ChatGPT这样的大语言模型来完成之前只有算法工程师才能处理的工作。

内容优化

本书以实践为主,重点是任务的讲解和设计,但也会科普一些自然语言处理算法的基本原理和基础知识,适合所有对大语言模型感兴趣的开发者阅读。本书一共有8章内容,分别如下。

第3章句词分类—句子Token都是类别,主要介绍了NLP领域最常见的任务——分类。

第5章复杂推理—更加像人一样思考,主要介绍了如何使用大语言模型做复杂的逻辑推理任务。

第6章工程实践—真实场景大不同,主要介绍了如何在真实业务中使用大语言模型。

第7章局限与不足—工具不是万能的,主要介绍了ChatGPT(或其他类似的大语言模型)的缺陷或不擅长的地方,包括事实性错误、实时更新、性能瓶颈等方面。

第8章商业应用—LLM是星辰大海,可以把该章当作一篇调研报告来阅读,主要针对工具应用和行业应用两大方面展开,期望能够给读者更多启迪,帮助大家构思更好的应用或服务。

这本书由郝少春、黄玉琳、易华挥三位作者在HuggingLLM教程内容之上优化而成。

大咖推荐,口碑保证!

这本书一经推出,就受到了吴飞、周明、朱信忠、金耀辉、张俊林5位人工智能领域专家的亲笔推荐!

“这本书是由Datawhale所推出的力作,秉承了Datawhale‘为了学习者’的一贯理念,基于志愿者团队精彩的开源学习内容精心编纂而成,深入浅出地介绍大语言模型的原理和工程实践,对于初学者了解ChatGPT非常有帮助!”

——吴飞,浙江大学人工智能研究所所长

“书中内容围绕自然语言处理任务展开,很多设计思路和细节其实可以应用到多个领域。期望读者多学多练,能够在实践中提升自我。”

——周明,澜舟科技创始人兼CEO,创新工场首席科学家

“这本书虽然以ChatGPT作为示例,但绝大部分内容都可以无缝切换为其他大语言模型。这得益于本书基于以‘自然语言处理算法任务’为核心的设计理念,因而这本书具有更长的生命周期。”

——朱信忠,浙江师范大学人工智能研究院副院长,浙江省特级专家,Datawhale首席科学家

“这本书以明晰而简洁的文字,阐述了大语言模型的工作原理,堪称杰作。更为可贵的是,书中还详细介绍了ChatGPT的工程实施策略。”

——金耀辉,上海交通大学人工智能研究院总工程师、教授

“这是一本有关大语言模型应用和服务的实践指导书,详细介绍了如何开发基于大语言模型算法的应用和服务。这本书注重实际任务的设计及实现的思路讲解,并提供了对自然语言处理基础知识和算法原理的科普性介绍。”

——张俊林,新浪微博新技术研发负责人

▲滑动查看更多

通过上面的介绍以及各位专家的推荐,相信读者应该对这本书有了初步了解。下面小异再具体说说如何更好地使用本书。

如何阅读本书?

第一,读者可以先行了解第1章进行一个科普入门。

书籍后面的内容根据内容规模和难度,讲解顺序重新排列为:相似匹配、句词分类、文本生成、复杂推理......读者可以按部就班地学习,也可以根据自己的兴趣选择任意章节进行学习。因为各章节相对独立,彼此没有直接明显的前后依赖关系,在学习时可以灵活调整。

第二,以“任务”为核心。

第三,利用好本书内容、提供的思维导图、GitHub开源项目HuggingLLM、B站视频课程等各种资源,来全方位地助力自己的学习与实践。

·GitHub开源项目HuggingLLM链接是datawhalechina/hugging-llm:HuggingLLM,HuggingFuture.(github.com)

·B站视频课程链接是学会如何使用大模型,让创意有能力落地成应用:HuggingLLM,Hugging未来_哔哩哔哩_bilibili

第四,一定要亲自动手完成一个应用或服务的Demo!

你可以在书中找到详细的示例代码,稍做修改后就可以在实际环境中使用。光看不做在编程领域是绝对行不通的,只是想想或者口头上说与亲自动手完全是两回事。万事开头难,但一旦完成了第一个项目,后面再做类似的就会相对容易一些。所以大胆地实操吧!

另外要说明的是,这本书不是特别为算法或者自然语言处理工程师等行业人员设计的。当然,如果你是NLP工程师,也可以通过这本书受益。

这本书更适合以下人员:

·对ChatGPT感兴趣的人;

·希望实际运用这项技术来创造新的服务或者解决现有问题的人;

·有一定编程基础的人。

结语

本书的封面上有一幅幅蝴蝶图案,这是因为作者们相信人工智能将会涌现出更多美丽的形态,恰如蝴蝶从蛹中蜕变一样,这也寓意希望读者阅读本书后将有崭新的领悟。赶紧拿起这本“蝴蝶书”,开启你的全新认知之旅吧!

DataWhale好书推荐

01

机器学习公式详解第2版

▼点击下方即可购书,限时特惠5折

02

pandas数据处理与分析

本书基于pandas官方推荐的中文教程“JoyfulPandas”编写,是以实战为中心的pandas教程。

本书基于作者自身学习pandas的切身经验,在对pandas庞杂内容的主线认真梳理之后,他整理出一条由浅入深、适合初学者的学习路线。本书能让初学者摆脱常规学习pandas的痛苦,从核心概念开始学习,理解函数之间的逻辑关系,建立起数据处理的宏观体系,真正快乐地学会pandas。

THE END
1.CICC科普栏目人工智能十大基础算法图示这篇文章将对常用算法做常识性的介绍,没有代码,也没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的。 决策树 根据一些 feature(特征) 进行分类,每个节点提一个问题,通过判断,将数据分为两类,再继续提问。这些问题是根据已有数据学习出来的https://mp.weixin.qq.com/s?__biz=MzA4ODcwOTExMQ==&mid=2655797149&idx=6&sn=733bdd52fc91a4ef317b4de15b26094d&chksm=8a3ae82e85c8422d452d7c7f2596f17c8230de97324fd7cbf423e4bc2e9a93b9b9c1b8fc7ebd&scene=27
2.如何学算法~吴师兄算法如何学算法~ 给大家推荐一个Github排名前50的大佬公众号:五分钟学算法 这个大佬在 Github 上有 50000star,专注于图解算法,已经帮助了数万名初学者入门学习算法。 关注他的公众号在后台回复 1024 送你 50 本算法编程书籍。https://blog.csdn.net/kexuanxiu1163/article/details/102365276
3.全网最全程序员学习网站汇总,还不赶快收藏地址: 五分钟学算法 简介:有少量非常不错的数据结构、算法相关的内容。 推荐指数:? 13、犬小哈教程网 地址: 犬小哈教程网 简介:少量哈士奇的技术问答漫画很有意思。 推荐指数:? 15、原创技术大联盟 地址: 原创技术大联盟 简介:优秀的技术博主实在太多了,列不完,也看不完,这里有一个导航页https://www.songma.com/news/txtlist_i66992v.html
4.有哪些高质量的自学网站?25、五分钟学算法(http://cxyxiaowu.com/) 一个完全免费的算法学习网站。 有很多的算法题和概念解释,甚至面试的攻略,适合新手的学习和进阶。 漫画式的教学,将复杂的内容深入浅出,效果很棒! 26、菜鸟教程(http://runoob.com/) 正如其名,非常适合新手的编程技术网站。 https://www.douban.com/note/767851363/
5.五分钟学后端技术:一篇文章教你读懂大数据技术栈!还涉及到一些机器学习语言,比如,Mahout主要目标是创建一些可伸缩的机器学习算法,供开发人员在Apache的许可下免费使用;深度学习框架Caffe以及使用数据流图进行数值https://github.com/h2pl/Java-Tutorial 整合全网优质Java学习内容,帮助你从基础到进阶系统化复习Java 面试指南 全网最热的Java面试指南,共200多页,非常实用https://cloud.tencent.com/developer/article/1608371
6.五分钟学算法链接直达手机查看 GitHub 42000 Star,全球排名 79 。小吴讲算法,图解面试算法,来和程序员小吴一起学算法吧,学习如何刷力扣(LeetCode),掌握如何学习数据结构。五分钟学算法官网,一个算法学习的网站,图解力扣算法,看动画,刷力扣,备面试,跳槽涨薪美滋滋。https://www.toolmao.com/sites/1338.html
7.推荐一个GitHub上3.2万Star的算法可视化项目推荐一个 GitHub 上 3.2 万 Star 的算法可视化项目 算法的重要性不言而喻啦,每次求职之前刷 LeetCode 刷的头昏脑胀,大厂笔试时看到 Hard 级的算法题瞬间头皮发麻。 算法是很重要,问题是如何更好的学习好算法才是关键 。一提到算法,大部分人应该都像我一样吧,立马跑到 Leetcode 网站上刷题, LeetCode 收录了https://blog.51cto.com/13929722/3438439
8.R机器学习预测时间序列模型结合Tidymodels以期加入机器学习算法。如XGBoost,GLMnet,Stan,Random Forest等 改进传统时间序列模型。如arima_boost(),prophet_boost() install.packages("modeltime")devtools::install_github("business-science/timetk")library(tidyverse)library(tidymodels)library(modeltime)library(timetk)libraryhttps://www.jianshu.com/p/3086bd29d26c
9.GitHub文章最新首发于微信公众号 吴师兄学算法,您可以关注获取最新的文章。 为了帮助大家更好的入门学习算法,经过半年的积累,我给大家整理了《剑指 Offer》系列的四十道题目,都是算法面试的高频题目,每一道题目我都提供详细的分析、精美的配图、易于理解的动画视频,适合那些第一次刷题的同学,当然,也适合重复刷题的老手再次https://github.com/MisterBooo/LeetCodeAnimation
10.谷歌大脑提出AutoML接着谷歌又推出了AlphaGo Zero,只让AI知道围棋规则,从零开始学下棋,结果再次登上棋艺顶峰。 AI既然能从零学习围棋,是否可以从零开始摸索机器学习算法?当然可以,谷歌大脑团队最新的研究成果已经做到了。 谷歌将这种技术称之为AutoML-Zero,意为“从零开始的自动机器学习”,已经在GitHub开源,并在Arxiv上提交了论文。 https://m.thepaper.cn/wap/resource/v3/jsp/newsDetail_forward_6453837
11.刷题29天贪心算法情况一:账单是5,直接收下。 情况二:账单是10,消耗一个5,增加一个10 情况三:账单是20,优先消耗一个10和一个5,如果不够,再消耗三个5 c++ classSolution{public:boollemonadeChange(vector<int>&bills){intfive=0,ten=0,twenty=0;for(intbill:bills){//1.bill is 5if(bill==5){five++;}//2 bill https://zhuanlan.zhihu.com/p/11941030486
12.如何跑通github上的强化学习算法?(一)环境or框架?芋圆院长项目链接:https://github.com/rail-berkeley/d4rl_evaluations 选择BEAR算法的readme.md进行实验 不管怎么样,这前边说的两个链接我先fork一下。fork之后,克隆到本地仓库都是常规操作哈【这都是我从github学习笔记里学来的,有朋友感兴趣可以去看廖雪峰老师的网站教程 非常详细。当然我的博客里也有相关的笔记】 https://www.cnblogs.com/yuyuanliu/p/16584053.html
13.深度学习Yoshua Bengio,蒙特利尔大学计算机科学与运筹学系(DIRO)的教授,蒙特利尔学习算法研究所(MILA)的负责人,CIFAR项目的共同负责人,加拿大统计学习算法研究主席。Yoshua Bengio的主要研究目标是了解产生智力的学习原则。他还教授“机器学习”研究生课程(IFT6266),并培养了一大批研究生和博士后。 https://www.epubit.com/bookDetails?id=N8263