ChatGPT来了AI企业如何应对|大数据、大算力、强算法_在线学习

学习或挑战ChatGPT的“正确姿势”，或许还是在更基础、更底层的原始创新中寻找力量。一些中国企业在芯片、操作系统、AI大模型等方面持续投入，并且有所产出，ChatGPT的出现，也是中国AI企业加速奔跑，迎来新一轮发展的契机。

最近，AI（人工智能）圈一股以“ChatGPT”为核心的热潮从美国“硅谷”涌入中国。

2022年11月底，初创公司OpenAI发布了名为ChatGPT的对话式聊天机器人模型，一经推出，便在网络上迅速走红。美国科技公司微软的联合创始人比尔·盖茨高度评价这项技术，认为它的出现不亚于互联网和个人电脑（PC）的诞生。

进入2023年，微软推新，谷歌入局，“ChatGPT”热潮迅速升温，国内的科技巨头也陆续涌入潮中。ChatGPT发布后，包括百度、科大讯飞、京东等在内的多家企业纷纷公布自己在AI领域的布局。

近日，360创始人周鸿祎在一场直播中表示，如果企业搭不上ChatGPT这班车，很可能会被淘汰。确实，作为一个现象级的应用（模型），ChatGPT的出现为AI领域的技术发展和产业布局带来新的变化。

回溯ChatGPT的诞生过程，可以发现这是一个创业团队先“活下来”，再实现“服务所有人”目标的故事，这也是一个从某个企业闭环研发到整个行业开源共创的AI大模型，更是一个利用超大数据、超强算力、超强算法“喂养”出来的跨越式AI产品，是量变引起质变的产物。

梳理人工智能产业的历史和现实，可以看到数据背后是广泛的应用场景，算力背后靠的是完善的信息基础设施，算法背后需要深厚的人才储备。这些方面中国已经有所准备，甚至可以说已经积累了庞大的数据、算力和人才优势。而在ChatGPT浪潮汹涌而至时，盲目跟风、“CopyToChina”早已落伍，甚至只是在应用层面“搭车”也显得不合时宜。

ChatGPT潮涌

“今天我们推出了ChatGPT，尝试在这里与它交谈”。

2022年11月30日，热潮来袭。OpenAI首席执行官山姆·阿尔特曼当天发布了一则推特，推特中除了上述文字，还包括一个链接，任何人都可以点击链接、注册账户，免费与ChatGPT交谈。

与Siri、小爱同学等语音助手类似，ChatGPT也是人机交互应用的一种。但在与ChatGPT“对话”的过程中，人们发现它的“智慧程度”远超其他的人工智能机器人。除了聊天，ChatGPT被网友们用来写文案、翻译文本、为代码纠错，甚至用来编写代码。

据OpenAI官网介绍，ChatGPT能够连续回答问题、承认错误、质疑不正确的前提和拒绝不适当的请求。“第一次，它（指ChatGPT）答错了，我告诉它正确信息后，再问同样的问题，它的答案就被改正了过来了。”一位曾尝试与ChatGPT对话的程序员对记者说，“它甚至为此对我说‘抱歉’”。

从科技巨头，到行业龙头，中国企业竞逐AI赛道，AIGC（利用人工智能技术来生成内容）等人工智能概念在股市一路狂飙，虽然在监管出手后很快平息躁动，但涨势依然存在。中信证券研究报告认为，ChatGPT在全球的流行正在推动AIGC产业化全面提速，将引领创成式AI新变革。

“ChatGPT”热潮涌动，正处于冷静期的人工智能投资和产业布局迎来小阳春。

用大数据、大算力、强算法“喂养”

AI大模型是人工智能迈向通用智能的里程碑技术，模型可以自动从数据中学习知识，提升性能。GPT是OpenAI推出的AI大模型系列。从2018年到2022年，OpenAI先后迭代并推出了GPT-1、GPT-2、GPT-3和InstructGPT，此次发布的ChatGPT就是在GPT-3的基础上通过指令微调后得到的。

2022年初，OpenAI团队开始用GPT-3构建ChatGPT。据《财富》杂志报道，通过GPT-3训练ChatGPT的过程并不顺利，对话的效果并不理想，因此OpenAI决定将ChatGPT放到“野外”供大众使用。

“ChatGPT通过一种非常简单的对话方式，构造了非常好的应用场景。”360创始人周鸿祎认为，ChatGPT提供的这些应用场景非常贴近大多数人日常的刚需和痛点，所以它才会火起来，能出圈。

出圈是偶然的，但ChatGPT的成功却并非偶然，“OpenAI在GPT系列模型的基础上，对算法、算力、数据等人工智能关键要素都进行了一定的升级和优化。”中国信通院云计算与大数据研究所人工智能部副主任董晓飞说。

在算法层面，ChatGPT的基础是世界上最强大的LLM（大语言模型）之一——GPT-3，同时引入了基于人类反馈的强化学习方法，提高了对话的质量。“从GhatGPT的表现上来看，它的精确性和整个性能效果确实提高了。”董晓飞说。

同时，AI的训练和使用也需要强大的算力支持。ChatGPT的训练是在微软云上进行的，在全球云计算市场，微软云的市场份额排名第二。高水平、高市场份额，再加上芯片技术的高速发展，这都为ChatGPT的横空出世奠定了坚实的算力基础。

除了算法和算力，AI大模型的进步迭代，需要大量的数据进行训练。2020年发布的GPT-3，其训练参数量已经达到了惊人的1750亿个，“大量的数据被反复‘喂’给ChatGPT。”一位目前在北京大学从事人工智能研究的博士生对记者说。

而且，ChatGPT的训练成本支出巨大。据LambdaLabs首席科学官Chuanli介绍，拥有1750亿个参数的GPT-3单次训练成本达到460万美元。在知乎上，网友在讨论ChatGPT时，也都认为它很“烧钱”。因此，可以说ChatGPT是一个靠大算力、高成本，用大规模的数据“喂”出来的AI模型。

董晓飞指出，虽然国内外企业在算法研发上基本保持同等水平，但国内更注重大模型技术与行业场景的融合，对于数据标注和模型训练等高成本的人力投入更为谨慎。

“我们真正缺乏的是技术积累，包括数据怎么清洗、标注以及模型的结构设计，怎么训练、推理，这个地方很多都需要经验和积累。”网上一篇爆火的《ChatGPT专家深度解读》这样解释。

搜狐创始人张朝阳在一场直播中说：“ChatGPT的产生是量变到质变的过程，积累了很多年，涉及到算力要有多少服务器，知识库、标注等很多问题，若没有这些能力的公司跟风入局，会消耗掉许多资源。”

把握优势，竞逐“生成式AI”浪潮

热潮已经袭来，有技术基础的企业在强势突围，没有技术基础的企业准备发力，尚待进场。而等热潮退去，能否留在场上，还需看清自己的优势和短板。

ChatGPT是AIGC的一种实现。董晓飞认为，在AIGC的大模型建设和应用层面，国内企业在技术基础和创新环境上都存在着相对优势。

首先，国内持续投入大模型研发、技术基础扎实。目前，阿里达摩院的多模态大模型M6参数量已达10万亿，是全球最大的AI预训练模型；华为盘古、百度文心等大模型的参数量都超过了千亿，其中百度文心模型参数量已经达到2600亿，不逊于GPT-3。“国内有关企业、研究机构近几年在大模型方面已经有了技术积淀。”董晓飞说。

其次，国内加快“产业数字化转型”、实现人工智能与实体经济融合等政策为人工智能提供了创新发展环境。近日，国务院国资委印发《关于做好2023年中央企业投资管理进一步扩大有效投资有关事项的通知》，指出要加大对5G、人工智能、数据中心等新基建投入。近年来，我国发布了一系列政策文件，为人工智能核心技术攻关、产品落地应用以及探索发展新模式新路径提供支持。

但董晓飞也指出，基于大模型的聊天机器人成本投入巨大，“企业前期投入需保持一定的谨慎，且需要看清方向。”

中国新一代人工智能发展战略研究院发布的《中国新一代人工智能科技产业发展报告(2022)》数据显示，中国人工智能企业布局侧重在应用层和技术层。其中，应用层人工智能企业数占比最高，达85.18%；技术层和基础层企业数分别占比12.41%和2.41%。由此可以看出，我国人工智能发展在应用层面有较大优势。

在董晓飞看来，ChatGPT的成功出圈模式为企业提供了大模型、生成式AI、智能对话等技术的商业化应用路径，尤其将助力“生成式AI”通过更多形式实现在更多行业的探索和应用。

“目前来看，国内大模型开发厂商一是布局以大模型为基础的通用对话、生成等能力；二是将其能力整合到搜索引擎、智能客服、智能音箱等产品线中；三是通过能力调用为中小企业满足具体场景落地需求。”董晓飞说。

THE END

ChatGPT来了AI企业如何应对

算力市场规模的现状与未来发展趋势分析云计算物联网

人民数据人民日报图文数据库（1946

ChatGPT来了AI企业如何应对

科普篇——算力（一） #人工智能# #算力概念# #华为# 第四次科技革命与AGI双浪叠加的时代背景下，新一轮科技创新周期将肇始于底层算力创新...

深度学习模型部署与优化：策略与实践；L40S与A100H100的对比分析

思必驰联合创始人兼首席科学家俞凯：ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

大数据大算法大模型与产业发展 CCDE2023专题论坛

支振锋：生成式人工智能大模型的信息内容治理

数字化转型的五大基石：构建独立生态强化连接能力算力算法并重数据确权保障独立分账系统引领未来

ChatGPT全球火爆中国AI如何出头？先冷静冷静快科技

论浙大网新的估值~唯一兼具“学院派”与“大厂派”背景AI大模型和算力标的！财富号评论(cfhpl)股吧

“百模大战”：盘点国内外横空出世的AI大模型