ChatGPT来了AI企业如何应对

学习或挑战ChatGPT的“正确姿势”,或许还是在更基础、更底层的原始创新中寻找力量。一些中国企业在芯片、操作系统、AI大模型等方面持续投入,并且有所产出,ChatGPT的出现,也是中国AI企业加速奔跑,迎来新一轮发展的契机。

最近,AI(人工智能)圈一股以“ChatGPT”为核心的热潮从美国“硅谷”涌入中国。

2022年11月底,初创公司OpenAI发布了名为ChatGPT的对话式聊天机器人模型,一经推出,便在网络上迅速走红。美国科技公司微软的联合创始人比尔·盖茨高度评价这项技术,认为它的出现不亚于互联网和个人电脑(PC)的诞生。

进入2023年,微软推新,谷歌入局,“ChatGPT”热潮迅速升温,国内的科技巨头也陆续涌入潮中。ChatGPT发布后,包括百度、科大讯飞、京东等在内的多家企业纷纷公布自己在AI领域的布局。

近日,360创始人周鸿祎在一场直播中表示,如果企业搭不上ChatGPT这班车,很可能会被淘汰。确实,作为一个现象级的应用(模型),ChatGPT的出现为AI领域的技术发展和产业布局带来新的变化。

回溯ChatGPT的诞生过程,可以发现这是一个创业团队先“活下来”,再实现“服务所有人”目标的故事,这也是一个从某个企业闭环研发到整个行业开源共创的AI大模型,更是一个利用超大数据、超强算力、超强算法“喂养”出来的跨越式AI产品,是量变引起质变的产物。

梳理人工智能产业的历史和现实,可以看到数据背后是广泛的应用场景,算力背后靠的是完善的信息基础设施,算法背后需要深厚的人才储备。这些方面中国已经有所准备,甚至可以说已经积累了庞大的数据、算力和人才优势。而在ChatGPT浪潮汹涌而至时,盲目跟风、“CopyToChina”早已落伍,甚至只是在应用层面“搭车”也显得不合时宜。

ChatGPT潮涌

“今天我们推出了ChatGPT,尝试在这里与它交谈”。

2022年11月30日,热潮来袭。OpenAI首席执行官山姆·阿尔特曼当天发布了一则推特,推特中除了上述文字,还包括一个链接,任何人都可以点击链接、注册账户,免费与ChatGPT交谈。

与Siri、小爱同学等语音助手类似,ChatGPT也是人机交互应用的一种。但在与ChatGPT“对话”的过程中,人们发现它的“智慧程度”远超其他的人工智能机器人。除了聊天,ChatGPT被网友们用来写文案、翻译文本、为代码纠错,甚至用来编写代码。

据OpenAI官网介绍,ChatGPT能够连续回答问题、承认错误、质疑不正确的前提和拒绝不适当的请求。“第一次,它(指ChatGPT)答错了,我告诉它正确信息后,再问同样的问题,它的答案就被改正了过来了。”一位曾尝试与ChatGPT对话的程序员对记者说,“它甚至为此对我说‘抱歉’”。

从科技巨头,到行业龙头,中国企业竞逐AI赛道,AIGC(利用人工智能技术来生成内容)等人工智能概念在股市一路狂飙,虽然在监管出手后很快平息躁动,但涨势依然存在。中信证券研究报告认为,ChatGPT在全球的流行正在推动AIGC产业化全面提速,将引领创成式AI新变革。

“ChatGPT”热潮涌动,正处于冷静期的人工智能投资和产业布局迎来小阳春。

用大数据、大算力、强算法“喂养”

AI大模型是人工智能迈向通用智能的里程碑技术,模型可以自动从数据中学习知识,提升性能。GPT是OpenAI推出的AI大模型系列。从2018年到2022年,OpenAI先后迭代并推出了GPT-1、GPT-2、GPT-3和InstructGPT,此次发布的ChatGPT就是在GPT-3的基础上通过指令微调后得到的。

2022年初,OpenAI团队开始用GPT-3构建ChatGPT。据《财富》杂志报道,通过GPT-3训练ChatGPT的过程并不顺利,对话的效果并不理想,因此OpenAI决定将ChatGPT放到“野外”供大众使用。

“ChatGPT通过一种非常简单的对话方式,构造了非常好的应用场景。”360创始人周鸿祎认为,ChatGPT提供的这些应用场景非常贴近大多数人日常的刚需和痛点,所以它才会火起来,能出圈。

出圈是偶然的,但ChatGPT的成功却并非偶然,“OpenAI在GPT系列模型的基础上,对算法、算力、数据等人工智能关键要素都进行了一定的升级和优化。”中国信通院云计算与大数据研究所人工智能部副主任董晓飞说。

在算法层面,ChatGPT的基础是世界上最强大的LLM(大语言模型)之一——GPT-3,同时引入了基于人类反馈的强化学习方法,提高了对话的质量。“从GhatGPT的表现上来看,它的精确性和整个性能效果确实提高了。”董晓飞说。

同时,AI的训练和使用也需要强大的算力支持。ChatGPT的训练是在微软云上进行的,在全球云计算市场,微软云的市场份额排名第二。高水平、高市场份额,再加上芯片技术的高速发展,这都为ChatGPT的横空出世奠定了坚实的算力基础。

除了算法和算力,AI大模型的进步迭代,需要大量的数据进行训练。2020年发布的GPT-3,其训练参数量已经达到了惊人的1750亿个,“大量的数据被反复‘喂’给ChatGPT。”一位目前在北京大学从事人工智能研究的博士生对记者说。

而且,ChatGPT的训练成本支出巨大。据LambdaLabs首席科学官Chuanli介绍,拥有1750亿个参数的GPT-3单次训练成本达到460万美元。在知乎上,网友在讨论ChatGPT时,也都认为它很“烧钱”。因此,可以说ChatGPT是一个靠大算力、高成本,用大规模的数据“喂”出来的AI模型。

董晓飞指出,虽然国内外企业在算法研发上基本保持同等水平,但国内更注重大模型技术与行业场景的融合,对于数据标注和模型训练等高成本的人力投入更为谨慎。

“我们真正缺乏的是技术积累,包括数据怎么清洗、标注以及模型的结构设计,怎么训练、推理,这个地方很多都需要经验和积累。”网上一篇爆火的《ChatGPT专家深度解读》这样解释。

搜狐创始人张朝阳在一场直播中说:“ChatGPT的产生是量变到质变的过程,积累了很多年,涉及到算力要有多少服务器,知识库、标注等很多问题,若没有这些能力的公司跟风入局,会消耗掉许多资源。”

把握优势,竞逐“生成式AI”浪潮

热潮已经袭来,有技术基础的企业在强势突围,没有技术基础的企业准备发力,尚待进场。而等热潮退去,能否留在场上,还需看清自己的优势和短板。

ChatGPT是AIGC的一种实现。董晓飞认为,在AIGC的大模型建设和应用层面,国内企业在技术基础和创新环境上都存在着相对优势。

首先,国内持续投入大模型研发、技术基础扎实。目前,阿里达摩院的多模态大模型M6参数量已达10万亿,是全球最大的AI预训练模型;华为盘古、百度文心等大模型的参数量都超过了千亿,其中百度文心模型参数量已经达到2600亿,不逊于GPT-3。“国内有关企业、研究机构近几年在大模型方面已经有了技术积淀。”董晓飞说。

其次,国内加快“产业数字化转型”、实现人工智能与实体经济融合等政策为人工智能提供了创新发展环境。近日,国务院国资委印发《关于做好2023年中央企业投资管理进一步扩大有效投资有关事项的通知》,指出要加大对5G、人工智能、数据中心等新基建投入。近年来,我国发布了一系列政策文件,为人工智能核心技术攻关、产品落地应用以及探索发展新模式新路径提供支持。

但董晓飞也指出,基于大模型的聊天机器人成本投入巨大,“企业前期投入需保持一定的谨慎,且需要看清方向。”

中国新一代人工智能发展战略研究院发布的《中国新一代人工智能科技产业发展报告(2022)》数据显示,中国人工智能企业布局侧重在应用层和技术层。其中,应用层人工智能企业数占比最高,达85.18%;技术层和基础层企业数分别占比12.41%和2.41%。由此可以看出,我国人工智能发展在应用层面有较大优势。

在董晓飞看来,ChatGPT的成功出圈模式为企业提供了大模型、生成式AI、智能对话等技术的商业化应用路径,尤其将助力“生成式AI”通过更多形式实现在更多行业的探索和应用。

“目前来看,国内大模型开发厂商一是布局以大模型为基础的通用对话、生成等能力;二是将其能力整合到搜索引擎、智能客服、智能音箱等产品线中;三是通过能力调用为中小企业满足具体场景落地需求。”董晓飞说。

THE END
1.我姓算,能力强,数字浪潮连接世界精准高效任翱翔家人们,谁懂啊!近期,“算力”一词频繁出现在各类科技新闻、产业发展报告甚至日常对话中——以数据、算法等为新生产要素的算力正以前所未有的广度和深度向社会各领域渗透融合,成为激活新质生产力的关键引擎。算力,顾名思义,就是计算机设备或数据中心处理信息的能力,是计算机硬件和软件配合共同执行某种计算需求的https://baijiahao.baidu.com/s?id=1818949109203476983&wfr=spider&for=pc
2.原创如何释放大模型对金融行业的价值?新闻频道大模型=大算力+大数据+强算法 今年以来ChatGPT风头强劲,带火了大模型技术。大模型即网络参数规模达到亿级以上的“预训练深度学习算法”,在文本图像理解、内容生成等任务表现出显著优势和巨大潜力。 “大模型必须基于‘大算力+大数据+大算法参数网络结构’进行训练。”吕仲涛介绍,大模型技术是一个复杂的体系性工程,涵盖https://news.hexun.com/2023-06-14/208961897.html
3.山东省大数据局省级层面上海市通信管理局等11个部门联合印发以构建支撑本市公共服务、商业服务的智能算力供给体系为指引,形成上海算力交易平台、上海市人工智能公共算力服务平台两大算力资源调度核心,以及面向智算应用的算力中心多极分布的“1+1+X”智能算力建设和服务体系,不断完善和深化探索算力、运力、存力协同布局的智能算力基础设施建设,聚焦智能芯片、算法模型、训练框架、计http://bdb.shandong.gov.cn/art/2024/4/1/art_329234_10326855.html
4.以算力算法强大大数据应用以创新生态壮大大数据产业6月10日,省委书记楼阳生在山西同方知网公司调研,了解大数据平台建设和应用情况。山西日报记者李联军摄 山西晚报讯(山西日报记者 陈俊琦)6月10日,省委书记楼阳生在太原市调研大数据产业发展并主持召开座谈会。他强调,要认真学习贯彻习近平总书记视察山西重要讲话重要指示精神和关于实施国家大数据战略的重要论述,以算力算法强大http://epaper.sxrb.com/wap/sxwb/20200611/506453.shtml
5.贵州省大数据局印发《面向全国的算力保障基地建设规划》贵州有着建设面向全国的算力保障基地多维度优势,政策方面,印发《国家大数据(贵州)综合试验区“十四五”建设规划》,提出要持续推进国家大数据综合试验区高质量建设,建成全国一体化大数据中心国家(贵州)枢纽节点。制定《贵州省新型数字设施中长期建设纲要》,提出着力做强数字新基建,将加快建设算力基础设施作为一项重大工作予以https://www.cbdio.com/BigData/2023-04/17/content_6172657.htm
6.全面落地金融业需要大数据大算力大合作大创新吕仲涛表示,大模型技术目前尚未完全成熟,而金融行业是一个强监管的行业。因此,大模型技术应用于金融场景下,仍然存在着安全隐私、科技伦理、可信可解释等方面的风险。同时,大模型技术应用全面落地的过程中,还面临着数据、算力、算法、应用等诸多挑战。 当前阶段不成熟,短期内不建议直接对客使用 https://static.nfapp.southcn.com/content/202309/11/c8090398.html
7.揭秘大模型背后的神秘力量:算力数据与算法的“黄金三角在人工智能的浩瀚星空中,大模型犹如一颗璀璨的新星,引领着技术的前沿。但你是否好奇,是什么让这颗新星如此耀眼?今天,就让我们一起揭开大模型背后的神秘面纱,探索那支撑其辉煌成就的“黄金三角”——算力、数据与高性能算法。 一、算力:大模型的超级引擎 https://cloud.tencent.com/developer/article/2453952
8.周志华:“数据算法算力”人工智能三要素,在未来要加上“知识”今天的人工智能热潮主要就是由于机器学习,特别是其中的深度学习技术取得巨大进展,而且是在大数据、大算力的支持下发挥出巨大的威力。 谈到深度学习,就要谈到深度神经网络。深度神经网络是非常庞大的系统,要训练出来需要很多数据、很强算力的支撑。人工智能算法模型对于算力的巨大需求,也推动了今天芯片业的发展。例如现在训练http://www.360doc.com/content/20/0811/08/54396214_929604489.shtml
9.AI大模型:大数据+大算力+强算法大模型算力算法数据AI大模型:大数据+大算力+强算法 前言:好久不见,甚是想念,我是辣条,我又回来啦,兄弟们,一别两年,还有多少老哥们在呢? 目录 一年半没更文我干啥去了? AI大模型火了 人工智能 大模型的理解 为什么学习大模型 大模型Function Calling功能增强 大模型接入公司的数据:embeddings&RAGhttps://blog.csdn.net/m0_65555479/article/details/139085917
10.地平线L4级AI芯片单挑英伟达,3岁壁仞创全球算力纪录,国产芯开挂了何为大模型?通俗讲,就是“大数据+大算力+强算法”的结合产物,是实现人工智能应用的载体。 如鹏城—百度·文心大模型,是去年底百度发布的全球最大的中文单体模型,并已大规模应用于百度搜索、信息流、智能音箱等产品。在金融领域,该模型能完成一份合同内近40个类目条款的智能分类,将处理单份合同文本的时长缩短至1https://www.jfdaily.com/wx/detail.do?id=523435
11.数据算法和算力:人工智能时代的三要素工业互联网观察当前的时代,无时无刻不在产生大数据。人手一部的手机、无处不在的摄像头和传感器等设备都在产生和积累着数据,这些数据形式多样化,大部分都是非结构化数据。 这些大数据需要进行大量的预处理过程(特征化、标量化、向量化),处理后的数据才能为人工智能算法所用。 https://www.shangyexinzhi.com/article/10565456.html
12.“移”起AI+丨“人工智能+”行动,中国移动怎么干?大平台派上“大用场” 模型不是直接“跑”在算力上,还需要平台来连接算力和应用,需要通过各种各样的平台工具,实现基础模型、行业模型到应用的跨越。中国移动自主研发的“九天”人工智能平台,就是面向个人及行业客户提供从算力、数据、算法框架到研发工具的全栈AI服务,并面向通用智能及大小模型训推场景,实现全面升级。https://www1.10086.cn/aboutus/news/groupnews/index_detail_49938.html
13.多城共同点亮人工智能算力网络,赋能人工智能产业发展深圳、武汉、西安、成都、北京、上海等21个城市共同点亮“人工智能算力网络”,通过“一网络”实现“算力、数据、生态”三汇聚,以“大算力+大数据”使能大模型,会上也发布了全球首个三模态大模型紫东.太初和生物信息研究平台鹏程.神农,通过大模型孵化新应用,推动AI产业发展。https://www.huawei.com/cn/news/2021/9/huawei-connect-2021-ai-matrix
14.美国最新芯片管制对国内供应链的影响华强资讯AI的发展离不开大算力、强算法、大数据三大要素。其中,大算力相当于人工智能的土壤,没有大算力的支持,就不会有AI的成功。 美国的“如意算盘”:卡住AI芯片的“脖子” 为了限制中国人工智能等高科技产业的发展,早在2022年10月7日,美国政府就规定算力上限为4800(INT8 超过 600TOPS 或 FP16 超过 300TFLOPS)以及带https://news.hqew.com/info-371137