AGI|以ChatGPT为例,浅析AI究竟能干什么?

AGI|以ChatGPT为例,浅析AI究竟能干什么?

当一个新事物的出现,最好的办法就是了解它出现的背景,发展的历史。

于是一夜之间AI的浪潮袭来,时至今日各个厂商相继公开自己的大模型并不断迭代:GPT-4-Turbo,Qwen-Max,智谱清言GLM-4等。AI能力也从最初的对话型衍生出多种:图片生成,语音识别,文档解析,代码补全,视频生成,AI搜索……

当技术发生了翻天覆地的变化和革新,不管是否愿意,时代的浪潮会推着我们前进。同时技术变化也不是徐徐图之,而是剧烈革新代替。我们回头看,云计算技术的推进是如此,移动互联网时代也是如此。所以我们应该积极了解AI到底是什么,从而明白AI能做哪些,不能做哪些?它又能给我们带来哪些技术上的革命。

事实上,Transformer是一种神经网络架构,它在神经网络架构中引入了“注意力”这一概念。

在现实生活中一些场景上下文是有关联的,比如一段视频是由多张图片连续组成,对话也有上下文作为关联。将这些存在一定关联的数据做特殊处理后,它们被称为“时序数据”或序列(sequence)。

Transformer在实际任务中就是将一个序列转换为另一个序列。将一段中文转换为一段英文,将一个问题转换成一个回答……这就是Transformer名称的由来。

Pre-trained,预训练代表着模型的训练方式,在神经网络训练中采用更大、更多的参数先对模型进行训练,然后再进行微调。通俗一点讲就是九年义务教育,让模型拥有一些基础的通用能力,微调则代表着某一方面的偏重技能,就像选专业一样。

ChatGPT采用基于人类反馈的强化学习(ReinforcementLearningfromHumanFeedback,RLHF)来进行预训练微调。整个过程分为三步:

预训练一个语言模型:从优质的数据集中拿出一部分的数据,然后监督模型的训练。

收集对比数据并训练奖励模型:输入数据和模型输出被采样,通过输出结果人工反馈输出的质量,给予模型回应或评分。

从第二步的数据采样中得到新的数据,使用强化学习的方式微调语言模型。

质量问题本质是数量问题,当数量级成倍增大,那么大模型的能力也由量变转为了质变。

在简单理解了Transformer和Pre-trained之后,应该怎么理解Generative呢?

生成式代表着AI可以创造新内容和想法,在学习基础语言后它能创造新地根据某一要求进行创作,例如可以让AI学习中文,根据词来写一首诗。经过预训练后ChatGPT会学习字、词、语法规则、上下文信息来预测下一个单词或短句,这个行为会涉及到数据分析和统计学。

在GPT底层下,深度学习模型不断重新创造它们从大量训练数据中学会的模式,然后在设定的范围参数中工作,根据学到的知识在创造新的内容。

深度学习模型通常不会存储训练数据的副本,而是会将数据进行编码,使类似的数据点被安排在彼此附近。之后,再对这种表示进行解码,以构建具有类似特征的新原始数据。

如果仅仅只是从ChatGPT这个名字上推断它代表的意义和底层技术并不精确,AI包含了计算机科学、数据分析和统计、语言学、神经学等多个学科。Transformer和Pre-trained无法解释ChatGPT多轮对话时展现出的短期记忆能力,但在实际体验中多轮对话效果相当不错。

ChatGPT使用PromptEngineering提示工程技术来提高多轮对话的效果,对于大语言模型来说,因为计算效率和内存限制,一般会设计固定的上下文窗口,限制输入token的数量。文本首先会被分词器(tokenizer)分词,并通过查表编号,然后embedding到矩阵中变成高维空间向量,这是文本向量化的过程。

下图仅仅只是一个流程化展示,并不严谨:

由于token的限制,需要在有限的输入窗口将信息描述得更加全面,以提高大模型的准确度,这就需要使用PromptEngineering工程来优化。提示工程在与语言模型交互、对接、理解大语言模型能力等方面都起着比较重要的作用。零样本提示与少样本提示在复杂任务上截然不同,如果把大模型比做一个懵懂的孩童,提示词工程便是循循善诱的教案。

计算机科学家模拟生物神经元的特性,抽象出一个简易的模型:

在现实世界中判断一件事是否可行,往往是由多个因素决定,不同因素的权重也不相同。例如打算明天出门骑行,这时会考虑多个因素:

1-自行车是否正常10

2-明天天气如何8

3-骑行路线是否通畅2

4-是否存在同伴陪同3

不同因素的重要性也不同,自行车坏了基本上宣告计划破产,而天气也会变成决定性因素,但骑行路线和同伴是否陪伴相比之下只是算次要因素。将这些权重全部加起来再和阈值作为比较,阈值的高低代表了意愿的强烈,阈值越低代表这件事越容易通过。

单个的感知器构成一个简单的决策模型,但是在现实世界中是不够用的。神经网络分为浅层神经网络和深度神经网络,当然这都是相对而言。上图左边的浅层神经网络一般只会有一个中间层,加上输入/输出层,也仅仅只有三层。深度神经网络的中间层不止一层,ChatGPT就是由一种或多种深度神经网络构建而成的。可以将深度神经网络看作多层多个神经元的组合。

构建一个深度神经网络需要大量的参数,修改一个参数将会影响其他参数行为,深度学习训练中使用损失函数(lossfunction)来衡量这些指标,通过损失值来衡量神经网络模型在训练样本效果的好坏。

最开始科学家对神经网络的参数随机赋值,输入一批训练数据,得到预测输出后计算损失函数。然后再用输出的数据反向计算,根据这个过程来矫正参数让损失值变小。经过反复训练,让模型不断学习进步,最终得到我们所看到的大模型。实际上的深度学习要比作者描述的要复杂得多。

在深度神经网络中,这些数值可以分为两类,一类是层数、激活函数、优化器等,称为超参数(hyperparameter),它由工程师设定;另一类是权重和偏置,称为参数(parameter),它是在深度神经网络训练过程中自动得到的,寻找到合适的参数就是深度学习的目的。

从现阶段市场上的大模型我们也能看出,模型的性能与模型大小、数量以及计算资源相呼应。模型越大,数据量越大,分配的计算资源最大,模型的性能越好。深度学习人工智能技术正在以爆发式发展,预训练+微调的方式促进了神经网络训练资源的共享,从上文来看深度学习所需要的算力才是关键,谁掌握更多的算力谁训练出来的模型也就相对优质,这既是门槛也是瓶颈。

以ChatGPT为例窥探AI的冰山一角,现在回到最初的问题,AI能帮助我们做什么?

令人惊喜的是,个人学习Rust时,AI提示生成的代码质量相当高(比初学者高),这可能因为语言门槛较高,而AI补充能很好降低编写门槛。

在了解了AI技术对于工程师带来的一些变化后,我们来谈一下AI不能做什么。

作者本人近两年一直在做云原生的基础设施建设,AI技术的发展增加了算力的需求,增加了大规模应用的场景,虽然云原生技术为AI应用提供了一定的基础,但是将AI的工作负载与云原生平台整合时,依然存在一些挑战。

AI技术的创新对于基础设施,例如网络、存储、监控等工具提出了更高的要求。在未来可能更多的推出基于AI与云计算结合的一系列应用或工具,让AI开发者轻松复用最新的人工智能成果,从而推动AGI的发展。

THE END
1.人工智能那么火,AI的应用嘲都有哪些?记得之前有个考上清华的学姐回校分享,她就在华尔街做计算机量化交易,在很早以前已经是几万月薪了。随着人工智能技术的快速发展,AI在量化交易领域的应用也愈加广泛。通过大量的股票交易数据,结合AI模型的算力,可以有效地挖掘出稳定的高胜率交易模型。 国外文艺复兴、Citadel等机构,以及国内九坤和幻方等机构,都在量化交易领https://aiqicha.baidu.com/qifuknowledge/detail?id=10180822893
2.人工智能跨领域应用探索:机遇与挑战并存机器人自然语言处理人工智在教育领域,AI的应用同样具有深远的影响。AI可以通过个性化学习方案,提高学生的学习效果。通过分析学生的学习数据,AI能够识别学习中的薄弱环节,并提供针对性的学习资源。例如,AI可以为每个学生制定个性化的学习计划,帮助他们在自己的节奏下学习。,www.quweizhibo.net, https://www.163.com/dy/article/JJAQ3NKH055670JB.html
3.数据挖掘在人工智能行业的应用:实现更强大的AI系统人工智能(Artificial Intelligence, AI)是一门研究如何让机器具有智能行为的科学。人工智能系统可以被设计成能够理解人类语言、识别图像、自主决策、学习等。数据挖掘(Data Mining)是一种应用于大数据环境中的计算机科学技术,它旨在从大量数据中发现有用的模式、规律和知识。数据挖掘在人工智能领域具有重要意义,因为它可以帮https://blog.csdn.net/universsky2015/article/details/135790867
4.AI技术在审计领域的应用导读:一、AI技术介绍:智能与分析的完美结合在当今数字化时代,AI技术正以惊人的速度深入各个领域,并为企业带来了前所未有的机遇。AI,即人工智能,是模拟人类智能的一种技术,能够模拟人类 本文目录一览 1、PYTHON在审计领域的应用 2、AI技术领域的应用有哪些 http://chatgpt.kuyin.cn/article/3703571.html
5.人工智能有哪些领域随着科技的进步,人工智能越来越受到人们的关注和重视,已经在许多领域中得到了应用。这篇文章将介绍人工智能的一些主要应用领域。 1.机器学习 机器学习是人工智能的一个重要分支,它涵盖了许多算法和方法,旨在让计算机系统能够从数据中学习,并从中提取有用的信息。这种技术在许多领域都有应用,包括数据挖掘、自然语言处理https://m.elecfans.com/article/2211333.html
6.AI应用有哪些?盘点10个常见的AI应用领域计算机视觉(Computer Vision):使计算机能够“看”和解释图像和视频数据的技术。 强化学习(Reinforcement Learning):一种让机器通过与环境的互动来学习最佳行为模式的方法。 2.AI应用领域有哪些? 人工智能AI应用领域非常广泛,涵盖了多个行业和日常生活的方方面面。根据提供的搜索结果,以下是一些主要的AI应用领域: https://boardmix.cn/article/what-are-the-application-fields-of-ai/
7.人工智能心得体会9篇目前,许多制约人工智能发展的因素仍有待于解决,技术上的突破,还有赖于逻辑学研究上的突破。在对人工智能的研究中,我们只有重视逻辑学,努力学习与运用并不断深入挖掘其基本内容,拓宽其研究领域,才能更好地促进人工智能学科的发展。 人工智能心得体会 2 李开复号称最会说话的计算机男神,曾经是微软谷歌的副掌门,现在是https://www.unjs.com/fanwenwang/xdth/20221130181133_6041555.html
8.AI在汽车领域的应用前景怎么样,未来的走向会趋向于哪些方面?人工智能发展六十年,几起几落,如今迎来又一次热潮,深度学习、计算机视觉和自然语言理解等各方面的突破,使得许多曾是天方夜谭的应用成为可能,无人驾驶汽车就是其中之一。作为人工智能等技术在汽车行业、交通领域的延伸与应用,无人驾驶近几年在世界范围内受到了产学界甚至国家层面的密切关注。目前,人工智能在汽车自动驾驶https://www.yoojia.com/ask/17-12345366147925513845.html
9.人工智能目前的应用,人工智能目前的应用领域人工智能人工智能技术的应用领域将会继续扩大,并且涉及到更多领域的应用和创新。 例如,在教育、文化娱乐、航天、能源等领域也可以对人工智能技术进行应用。 ai人工智能应用有哪些? 01 自然语言生成(Natural Language Generation) 自然语言生成是人工智能的分支,研究如何将数据转化为文本,用于客户服务、报告生成以及市场概述。 http://www.zytxia.com/rgzn/4c1e9641333502c6.html
10.人工智能的应用领域八个方面人工智能(Artificial Intelligence, AI)的应用领域极为广泛,以下是八个主要的应用方面: 1. 机器学习(Machine Learning) 定义:机器学习是人工智能的核心技术之一,通过让计算机从数据中学习和识别模式,以便做出决策和预测。 应用领域:包括图像识别、语音识别、自然语言处理等。机器学习算法能够自动优化和改进,无需明确编程http://www.dns110.com/docs/?p=24771
11.大数据与人工智能(精选十篇)大数据发展的萌芽期, 是20世纪90年代至21世纪初, 此时处于数据挖掘技术阶段。这一时期, 随着数据挖掘理论和技术的一步步成熟, 已开始有一些与商业相关的智能工具开始被人们所应用, 如专家系统、数据仓库和知识管理系统等。 大数据发展的突破期, 是2003—2006年, 此时处于自由探索非结构化数据阶段。这一时期, 非结构https://www.360wenmi.com/f/cnkey1c0jp9s.html
12.AI大模型正改变着推荐系统的未来Alibaba - 在电商平台上为用户推荐商品 Tencent - 在微信、QQ等应用中使用推荐算法 Twitter - 推荐相关主题、用户和趋势 上面是 AI 帮我们回答的 具体来说推荐系统的应用领域主要有如下几类: 电商网站:购物,购书等,如淘宝,京东,亚马逊等 视频内容:Netflix,优酷,抖音,快手,爱奇艺等 https://36kr.com/p/2805108795192961
13.开启新纪元:隐私计算在金融领域应用发展报告(2021)√ 目前,隐私计算领域的商业模式主要有三种:硬件销售、软件销售、平台分润。其中平台分润模式有三种:数据源侧分润、数据应用场景分润、类数据代理模式。但是,在未来,随着隐私计算技术与区块链技术进一步结合、以及开源的发展,可能出现更多的商业模式。 √ 在隐私计算领域发展初期,各厂商商业模式比较相似,并无明显差异。但https://www.01caijing.com/article/286018.htm
14.AI在B端企业中,有哪些方向的应用AI在B端企业中,有哪些方向的应用 人工智能(AI)在B端企业中有着广泛的应用,涵盖了多个方向,以下是一些主要应用领域: 智能制造:AI技术可以帮助企业实现生产过程的自动化,提高生产效率和产品质量。例如,通过机器视觉检测产品质量,利用机器学习优化生产流程。 智能服务:在客户服务、售后服务等领域,AI可以通过智能客服、虚拟https://www.sgpjbg.com/task/2824718.html
15.阿里通义AI大模型有哪些优势和能力?能够赋能企业哪些嘲通义Ai大模型在工业制造领域的具体应用案例是什么? 通义Ai大模型在工业制造领域的具体应用案例可以从多个角度进行探讨。首先,人工智能技术在机械设计制造行业中的应用已经非常广泛,它不仅提高了生产效率,还改善了产品质量和设计精度。例如,在电子制造领域,通过使用历史数据和循环神经网络来管理物流预测和库存准备,显著提高https://www.shopex.cn/news/archives/18211.html
16.AI数字人:数字化时代的新趋势和应用云典AI智库AI数字人一种新兴的技术,正在数字化时代中展现出巨大的应用潜力。它不仅可以提升客户体验,还可以提高工作效率,成为企业数字化转型的必不可少的一部分。https://cosoh.com/aishuzirenshuzihuash/
17.AI在出行嘲的应用实践:路线规划ETA动态事件挖掘…所以,我们把规划的量,通过一个流量往时间域的转换,引入到路况预测模型,效果取得明显提升,尤其是在突发拥堵的时候,高德的这个研究成果被KDD2020收录,并且已经在业务场景中得到了应用,有兴趣的同学可以详细查看我们的论文。 行中-用文本数据挖掘动态交通事件 https://www.cnblogs.com/amap_tech/p/14486325.html
18.人工智能学习心得(通用28篇)因为人工智能的研究领域十分广阔,它总的来说是面向应用的,也就说什么地方有人在工作,它就可以用在什么地方,因为人工智能的最根本目的还是要模拟人类的思维。参照人在各种活动中的功能,我们可以得到人工智能的领域也不过就是代替人的活动而已。哪个领域有人进行的智力活动,哪个领域就是人工智能研究的领域。人工智能就https://www.yjbys.com/xindetihui/fanwen/3342600.html
19.HCIAAIV3.5模拟考试题库华为模拟考试题库下面有关AI应用领域的描述正确的有哪些选项? ( )多选 A.智能家居,运用了物联网、语音识别等技术 B.智慧医疗,运用了计算机视觉、数据挖掘等AI技术 C.智慧城市,是一门综合学科,几乎涵盖AI常用三大方向,语音、NLP和计算机视觉 D.智慧教育,基本特征是开放、共享、交互、协作、泛在。以教育信息化促进教育现代化,用信https://www.59xuexi.com/?p=11498
20.数据分析的ai工具有哪些帆软数字化转型知识库数据分析的ai工具有哪些 数据分析的AI工具有很多,其中主要包括:FineReport、FineVis、Tableau、Power BI、QlikView、RapidMiner、KNIME、SAS、IBM Watson Analytics、Google Data Studio、Alteryx、Domo、TIBCO Spotfire、Looker、Microsoft Azure Machine Learning。其中,FineReport和FineVis是帆软旗下的产品,专注于数据报表和https://www.fanruan.com/blog/article/109388/
21.斯坦福大学教授:基础模型在全科医学人工智能中的应用潜力将基础模型应用于医学领域的全科医学人工智能(GMAI),拥有跨模态输入输出、动态任务规范、根据结构化领域知识进行推理的强大能力,有望解决当前医疗 AI 的种种局限,为改善医疗健康和增进我们对生命的理解做出革命性贡献。 8月26日,在集智俱乐部与腾讯研究院共同举办的“AIS2系列学术报告和研讨活动”中,我们邀请到https://www.thepaper.cn/newsDetail_forward_24539646
22.纠音级语音评测NLP助力打造的知识图谱,详解作业帮AI如何落地记者:首先请宋老师介绍一下自己,目前在做哪些方面的工作,关注的领域有哪些? 宋旸:我最早从事算法研发工作是从搜索开始的,从Spider到互联网的数据挖掘,到站点的价值分析,再到推荐算法,这部分经历主要是在百度期间进行的。到作业帮之后,主要开展的业务首先是题库建设相关。 https://www.donews.com/news/detail/4/3233321.html