沸腾251天,访谈近百位从业者,关于大模型世界的5个现状新浪财经

这个时候,谷歌仍是AI领域的先行者。但项目背后的两位关键工程师,DeFreitas和Shazeer却感到沮丧。

他们希望能够对外展示LaMDA进入Google助手的案例,但多年来,聊天机器人项目经过多次审查,由于种种原因被禁止发布更广泛的版本。

而此前一年,OpenAI已经公布了1750亿参数的GPT3,并开放了API测试。谷歌却因为各种‘技术政治正确性’的风险,迟迟不愿将对话模型的产品对外公开。

DeFreitas、Shazeer因此萌生去意,尽管CEOPichai亲自进行挽留,但最终,两人还是在2021年底离开谷歌,创办了CharacterAI——目前AI大模型领域的独角兽之一。

谷歌就这样与引领变革的先发优势失之交臂。

后来的故事更加广为流传。2022年底,ChatGPT横空出世,这不仅使OpenAI名声大噪,更令其投资方微软大杀四方,在GPT-4的加持下,微软推出搜索产品NewBing,剑指谷歌。不仅谷歌,整个硅谷乃至世界也都为之震动。

转眼8个月过去,大洋彼岸,OpenAI带来的惊异已过,硅谷巨头们已度过恐慌期,也在全新战局中找到身位,创业公司前赴后继,在中国,百模大战则又是另外一番景象。

技术商业快速变化的半年来,业界关于大模型的认知与共识也不断更新,极客公园在与硅谷和中国近百位创业者、投资人、从业者交流后,总结出关于大模型创业的5个现状,尝试以此呈现一篇尚待验证的‘大模型商业世界观’。

谷歌的机遇错失与OpenAI的惊艳亮相实则提醒着我们——落后,先机,时有交替。当下的技术与商业演进远未到终局,真正的变革甚至还未正式开始。人们只需记住,创新可能随时、随地发生。

01

薛定谔的OpenAI:

所有人的英雄,

也可能是所有人的敌人

当中国创业圈还在将OpenAI视为硅谷新神时,硅谷已经悄悄开始了对OpenAI的祛魅。

尽管OpenAI实现了技术的突破、并且仍然是AI人才们趋之若鹜的地方——很多企业号称要向OpenAI狙击人才——而事实是,时至今日,OpenAI的顶级技术人才依旧在‘净流入’。其对AGI的信念和过去8年由愿景驱动带来的技术突破,使这家公司成为很多人眼里的英雄。

但英雄也要过日子。技术突破的下一步,是创造价值来创造商业循环。硅谷的争议在于,OpenAI真的能持续领先吗?

多位硅谷创业者、从业者、投资人不约而同地向极客公园表达了消极的判断。人们质疑的是,就目前看来,OpenAI所呈现的商业模式存在隐忧——在‘前ChatGPT’的非共识阶段,OpenAI尚可以凭借少数人的信念赢得资源,而今AGI已成共识,竞争者众,想要维持领先,挑战与难度将直线上升。

如果把商业盈利模式统分为toB和toC,前者OpenAI没有toB基因,且劲敌当前——在企服方面,OpenAI的资方微软是这个领域的王者,微软系的企业聊天应用市占率超65%,旗下的Teams近年逐渐蚕食了明星公司Slack的市场。在toB领域,成立48年、跨越数次技术周期的微软毫无疑问比初创公司OpenAI积累更深。

而要想做toB生意,OpenAI还面临着中心化风险的质疑。目前,OpenAI面向企业所开放的API模式,已经吸引了一批客户使用它——尤其是中小开发者,它们无力独立训练一个大模型,接入GPT系列的API成为极佳的选择。刚刚跻身独角兽的Jasper.AI就是其中最好的例子,通过接入GPT3,Jsaper.AI仅成立18个月就估值15亿美金。

‘但大家因此都不看好Jasper.AI。’一位硅谷主流基金的投资人告诉极客公园。私有数据是企业最重要的资产,在目前,将私有数据接入中心化大模型首先面临着合规与安全性的问题——尽管SamAltman在5月曾经承诺,OpenAI不会利用客户使用API的数据进行训练——但这既无法打消企业的疑虑,也无法获得其信任。

‘美国一些企业客户普遍对用OpenAI比较担忧。’这位投资人告诉我们,在企业眼中,OpenAI最接近云时代的AWS,但是大家又不会用面对AWS的逻辑面对它。‘客户普遍不太愿意把数据和关键竞争力交给OpenAI,觉得会有风险’。即便GPT系列能够以中心化的能力帮助垂类领域训出大模型,对客户来说,凭此构建的竞争力也很危险——这将是一种‘吸星大法’:如果自己的数据和经验最终也能为别人所调用,这将使行业领先者的竞争壁垒下降。

而做toC呢?

看起来,OpenAI在C端拥有用户优势。自其超级产品ChatGPT发布以来,其月活一路攀升至15亿,相比之下,Instagram的月活也不过20亿。不过,巨大的月活却未必能为OpenAI带来数据飞轮效应——‘(通过)用户持续问问题来做(大模型的)training,数据价值不大。’一位创业者指出。

值得注意的是,自6月开始,ChatGPT的月活首次出现下滑。人们对此的推测包括:

更重要的是,包括Google、Meta、苹果等在内的巨头也将围绕toC产品进行发力。比如Google已经重新整合了Brain和Deepmind两个内部团队以求在技术上压制OpenAI的优势。‘以前者的超大用户规模,一旦巨头推出免费产品,则可能冲击OpenAI现有的订阅收入。’OpenAI需始终维持住其技术壁垒,一旦技术壁垒被打破,则可能轻易被巨头以价格优势发起攻击。

今天的OpenAI,就像薛定谔的猫,难以断言它的前路是否明朗,可以确定的是,它将会在所有巨头密切监视的范围之内。

02

最顶级的公司各选山头,

但目标上殊途同归

那么,硅谷的巨头们在做什么?

极客公园与大量硅谷从业者交流后发现,与ChatGPT初亮相时相比,硅谷巨头公司的恐慌期已经基本结束。这些商场老将们迅速确立了自己的山头,并加速技术的推演,以防守好自己擅长的象限,确保自己不会被颠覆。

他们一致的做法是,沿着自身已有的优势进行扩展布局,寻找大模型能为之助力、甚至可能发生颠覆式创新的方向,一方面加固自己的业务优势,防范对手的突然袭击;另一方面也为可能出现的新战场埋下先手。

从一个公司的价值评估角度来看,如果以服务方式带来的边际成本高低为横轴(X轴),以服务对象多少为纵轴(Y轴)、并以平均客户价值(客单价、ARPU值等的高低)为空间轴(Z轴)来建立一个价值坐标系,则会发现,硅谷巨头们各有各的山头要守卫,但又有统一的发展趋势逐渐确立。

边际成本低,服务对象多、而平均客户价值高,这三个核心能力占据两点以上,往往才能自占据商业世界的最高价值。

目前,传统巨头在大模型领域的技术投入普遍都是在积极防御,只有微软和英伟达在非常积极地推动向应用中的落地。

而目前硅谷影响力最大的新生代企业,如OpenAI、Midjounery、Character.AI等公司,则是明显利用了大模型技术能力,迅速打破‘低边际成本、大用户量、高度个性化服务价值’的不可能三角——显然,这也是AGI技术变革的意义:用更低的边际成本服务更多客户,并交付更个性化的价值,进而获得更高的平均用户价值。

‘目前,所有的巨头都会努力跟上这波变革,也努力守住自己在价值地图中的位置。而新兴的企业努力的目标,则是无论你从哪个象限的位置出发,都尽可能地去追求用AGI技术向你所在的象限,甚至是突破原有象限的向右上移动,并尽力追求更高的平均客户价值。’张鹏在演讲中说。

在这样的大趋势下,我们不妨看看硅谷巨头们目前的状态和决策:

苹果:不靠谱就不冒险,

坚持toC固基业

作为曾被寄望能实现电影《Her》中场景的苹果,尽管今天仍未能实现如此深刻的人机交互,但这家向来秉承长期主义的公司不会放弃——相比于通用大模型,苹果的策略选择基于自身的基业,坚定在toC&标准化的方向。

苹果希望AI模型最终能在终端硬件上运行——这需要让模型能够在算力较弱的环境下运行,目前还无法达到。它对AI的运用也更为务实:今年轰动一时的VisionPro中,苹果利用AI技术,使佩戴者在FaceTime视频时能够有全方位的虚拟化身。在WWDC上,苹果还展示出了autocorrect功能,通过让一个Transformer架构下的大语言模型在手机上运行,以修改用户的错字、并更好地预测用户的语言习惯。

如果说VisionPro是苹果押注的下一代数字终端,新终端带来新的数字内容需求,在终端上运行大模型则是实现终端内容的技术前提。

在用大模型研发toC产品上,苹果尚未制定明确的战略。这也显示了苹果在终端产品上的谨慎。

已经有消息表示,苹果在开发新一代人工智能技术:苹果去年搭建了机器学习开发的Ajax框架,并基于其构建了类聊天机器人AppleGPT。但是这一技术目前只被要求服务于内部员工,比如给AppleCare工作人员提供支持,以更好地帮助客户处理问题。

Meta:以Llama打造

下一代‘安卓’,损人且利己

社交网络出身的Meta仍然在朝着它打出的概念——元宇宙进发。

如果将大模型视作为下一代计算平台,Meta正以开源的方式挑战OpenAI,目的是要成为应用生长的土壤。开放Llama2商业许可,并与微软Azure合作对外提供服务、与高通合作推进在终端运行Llama2,这一系列动作让Meta的战略布局更加明显。通过云服务,模型服务能够向B端方案渗透,通过与高通合作,又能够促进基于终端的应用开发。

看起来,Meta走在提供标准化模型能力的路径上,试图在toB和toC领域两头开花。从其目前困境来看,不难理解背后原因——Meta已有的超级应用Facebook并不能构成真正的护城河,从元宇宙开始,Meta已经在思考布局下一代计算平台VR头显,但是创造一代全新计算平台及生态的挑战巨大,并且进度上低于预期。

大模型给了Meta新的希望。比如在技术上TexttoImage(文转图)发展很快,来自硅谷的大厂技术专家们普遍认为Textto3D(文转3D)的能力会很快速地增长——这有助于Meta的元宇宙生态。

因此,Meta通过Llama来提供开源的能力,既可以击碎其他巨头的技术独占价值,也能促进大模型技术更快地被运用到自己的现有业务和元宇宙生态,是一石三鸟的好机会。

亚马逊:持续领跑云服务,

CEO亲自挂帅‘最具野心的AI项目’

亚马逊是另一个一度被外界质疑落后于AI变革的巨头,但最新消息显示,它正在奋起直追。

2月,亚马逊推出了自家的开源大模型mm-cot,尽管在模型架构上,创新地提出了包含视觉特征的思维链,但在层出不穷的开源模型社区,并没有引起太大水花。而截至发稿前,据外媒Insider最新报道称,亚马逊CEOAndyJassy目前正亲自带队,该团队负责开发该公司最具野心的AI项目。

作为云服务的领跑者,占有48.9%市场份额的亚马逊在B端有着绝对的客户优势。因此,围绕B端,自4月以来,亚马逊推出了大模型服务AmazonBedrock,其中既包括自研的大模型,也与AI21Labs、Anthropic、StabilityAI等基础模型提供商广泛合作,助力企业轻松灵活构建生成式AI应用,降低所有开发者的使用门槛。

此外,为了抑制和解决AI‘一本正经地胡说八道’,亚马逊还打造了AmazonTitan基础大模型,它可以识别和删除客户提交给定制模型的数据中的有害内容,过滤模型中不当内容的输出结果。

同时,亚马逊业务的根本——提供算力,仍然是大模型时代的‘刚需’。

4月,亚马逊网络服务(AWS)宣布与StabilityAI和HuggingFace等人工智能公司建立合作伙伴关系,这将允许其他公司使用亚马逊的基础设施来构建人工智能产品。此外,AWS还投资1亿美元建立AWS生成式AI创新中心(AWSGenerativeAIInnovationCenter),该中心将把客户与公司的人工智能和机器学习专家联系起来。他们将帮助医疗保健、金融服务和制造业的一系列客户使用新技术构建定制应用程序。

而在AI领域深耕20年的亚马逊,目前看来其野心并不甘落于微软和谷歌之后,也不甘心只坐守B端优势与成果。在B端之外,亚马逊似乎也在发力C端;同时,除了去中心化地提供模型能力赋能,亚马逊也在打造中心化的大模型——这也是AndyJassy亲自挂帅的目的。

微软:手握王牌,

B可攻、C可守

作为OpenAI的投资方,借前者的技术能力与影响力,微软在B端和C端都极早开始布局——在B端,微软获得了布局云平台新技术栈的先机,同时将来自OpenAI、Meta的模型接入云服务,以期切走云市场更大的蛋糕。而在C端,微软则开始打造前端产品、用大模型做Copilot:如在自身的强势产品Office365中上线AI的新功能、将OpenAI的大模型接入Bing搜索中,发布NewBing产品,成为第一批大模型成熟产品的典型。

B端与C端的双线推进,不仅巩固了微软原有的toB优势,同时也加固自己的壁垒以防他人颠覆。

此外,在更底层的硬件层面,微软也对AWS等云服务厂商发起了攻击。在更底层的硬件层面,微软也从2019年在内部开始研发代号为‘雅典娜’的AI芯片,这些芯片正式为训练大语言模型等软件而设计,同时可支持推理,为基于大模型的软件提供算力。初代产品基于5纳米工艺,微软也已规划了未来几代芯片产品。

据了解,微软依旧在扩大数据中心、采买芯片,能够看出,为了延伸目前自身的优势,微软做了充分的技术布局,但挑战在于,接下来能否在市场化上得到验证。

最新截止6月30日的第四季度财报显示,截至6月底,AzureOpenAI拥有1.1万用户,和5月末的0.45万相比出现大幅增长。智能云业务营收尽管在上涨,但较上一季度增速在放缓。此外,微软在7月中旬,将Microsoft365Copilot的价格设定为每月每户30美元,这被视为增加收入的方式。

谷歌:不能被低估的巨头,

奋起直追防闪击

ChatGPT横空出世后,微软立即与ChatGPT联手推出NewBing——因为担心GPT4加持的NewBing将动摇谷歌搜索引擎的根基,Google选择在2月份仓促应战——发布Bard,给外界留下了大乱阵脚的印象,也影响到了人才的流出和资本市场的信心。

然而最新的二季度财报显示的超预期增长,加之此前I/O大会上所展示的全面技术布局,又成功让外界对其重拾信心。

这似乎也印证了,在已存在的市场,想利用范式革命颠覆当下的巨头,没那么容易。

当然,谷歌在C端拥有的强势基因,这项优势也被认为可能掣肘其在B端的探索——事实上,谷歌也将在B端发力:除了谷歌TPU外,新增基于英伟达H100的A3AI超算,以及面向企业的AI平台vertexAI。

对谷歌而言,当下的局势无疑是危险的。在大模型时代,搜索这个领域必将被许多对手涉足,身为搜索巨头,谷歌随时可能被狙击,做好防守是它的死门。

极客公园了解到,经过年初的慌乱,巨头已经平静下来,开始了自己的动作。4月,谷歌将DeepMind与GoogleBrain合并重组为GoogleDeepMind,由坚信AGI的DeepMind联合创始人DemisHassabis担任部门领导,原GoogleBrain负责人JeffDean出任谷歌首席科学家——这样的架构调整不仅可以进一步聚集资源,更可以窥见谷歌追赶的决心。

合并后的GoogleDeepMind以及GoogleResearch,目标是攻克多个人工智能关键项目,其中第一个即为多模态模型。有消息传出,谷歌正在用Youtube的视频数据训练Gemini。鉴于大模型的下一个关键技术将是多模态,这增加了谷歌是否会领先的猜测。

毕竟,谷歌拥有30亿级用户,在一年几百亿美金收入的前提下,也拥有强大的技术能力——这使得它即便反应不足够快,但只要在技术上不落后,也能利用规模优势守住自己的安全城池。

纵观巨头的商业布局,极客公园经广泛交流后总结出几个结论:

03

中间层的繁荣,才能

把应用‘抬进’大模型时代

对于创业公司而言,一名硅谷创业者告诉我们,‘美国现在是中间层在繁荣,已经几乎没有新的创业者要做下一个OpenAI了。’

所谓中间层,是指要将大模型融合到应用,中间所需的一系列工程能力、AI能力,由此需求出发,涌现出的一批‘工具栈’——如开发工具链(如Langchain)、模型工具链(做数据标注、向量数据库、分布式训练等)。

‘这类公司通常干的是苦活累活’,与此同时,由于业务壁垒浅(不是完成技术的从0到1,而是完成1到100),‘中间层’最易受到上下游(大模型和应用)的挤压——比如诞生于2022年10月的LangChain,你可以将其理解为程序员的工具库,因其能够帮助普通人(企业)构建大模型应用,为他们提供过程中所需的工具组件和任务集(LangChain封装了大量LLM应用开发逻辑和工具),因而迅速崛起。但最近半年来,眼看着大模型的能力一再进化,并开放了插件,LangChain的价值也受到冲击。

但极客公园在走访美国硅谷调研后发现,与年初投资人们的消极判断不同,鉴于巨头们都在入场中心化大模型,这为中间层提供了巨大的机遇,在海外,中间层正在蓬勃发展。

正如云计算时代,Snowflake(基于底层云计算构建了它的数据库PaaS平台)和AWS相互成就一样。大模型时代,中间层和底层算力平台(及基础大模型)也正在相互成就。这是因为算力平台的最终消费者是应用程序公司,而中间层的公司正在帮助做应用的公司快速部署大模型,这进一步增加了底层云计算资源的消耗。

换句话说,中间层的繁荣,直接决定了底层云计算的‘管道’能开多大,同时也是上层应用生态得以百花齐放的条件。在硅谷,中间层的一批公司正站在各自不同生态位上,把应用层‘抬’进大模型时代,在这过程中,中间层自身也捕获了更大的价值。

他们是怎么做的?

Databricks的信仰之跃:

13亿美元收购Mosaic,

数据平台摇身变为AI平台

原本,数据领域的格局一经确立、就难以松动:尤其是来自集中度高的行业客户,极其注重其数据的安全性与私密性,以维持自身的竞争壁垒。在海外,除了三大云厂商,Snowflake和Databricks在数据领域做得最好。这样的格局恒久稳定,除非一次革命性的技术跃迁,否则,数据领域的客户很难迁移——大模型时代带来了这次机会。

Databricks抓住了这次机会。

13美金的收购象征了Databricks的决心。这家公司比对手们更早意识到,在集中度强的行业,企业一定倾向于部署一个私有的大模型。

现在的Databricks不仅仅是一个数据仓库,一个数据湖,还提供AI训练、模型管理等一整套服务。日前,他们发布了自然语言驱动的数据访问工具——LakehouseIQ,宣布提供开源LLM库——DatabricksMarketplace,以及AutoML(一种自动化机器学习技术)能力——LakehouseAI。

这些工具与服务意味着,企业或个人能够更轻松地接入公司数据,用自然语言就能进行数据分析。

过去一个月,不少行业人士认为,接下来,数据或许是软件公司利用大模型做出差异化最重要的因素——前提是算力成本的降低、开源模型的进步,以及模型部署服务的渗透。也因此,数据领域上下游的中间层公司,如Databricks,将占据更重要的位置。

近日,Databricks公布了一个数字:过去30天,在其平台上训练Transformer模型的客户超过1500家。这验证了在当下,中间层公司所面对的蓬勃需求。

据极客公园了解,Databricks的毛利率高达百分之六七十——一位大模型创业者指出,Databricks通过购买多家云厂商(微软、AWS等)的算力,并叠加自身的AI训练、模型管理、数据管理等服务,以更高的价格打包出售,是其高利润的原因,‘本质上是赚算力的钱。’

而Databricks联合创始人辛湜告诉极客公园,帮助客户部署AI或者大模型的有很多,但数据平台有天然的优势——‘数据在这里’,AI平台首先要是一个数据平台,才可以长久。

ScaleAI:

千金难买精标数据,效率为王

简单来说,收集、策划和清洗数据集是模型生产中最大的挑战。

据AIInfrastructureAlliance在2022年的年度调查显示,收集、策划和清洗数据集是模型生产中最大的挑战。

如今数据领域风头最盛的ScaleAI创立于2016年,最初主要为无人车提供数据标注服务,后来逐渐积累了包括电商、短视频甚至政府机构的客户。过程中,它积累了1000人的科技管理团队,几十万来自全球的长期外包人员和严格的验收体系。这些积累使得它在大模型时代快速转身,为企业提供RLHF的微调业务。目前,硅谷顶尖的AI公司,包括OpenAI,Cohere,InflectionAI都是它的客户。

2016年,19岁的华裔创始人AlexandrWang已经有了两年工程师经验。在硅谷的当红公司、美国知乎Quora,他看到了硅谷科技大公司在和远程的外包人员合作上的效率痛点,于是,大一的他从MIT辍学创立了ScaleAI。

传统大厂做数据标注时,欠缺的并不是技术,而更多的是对外包人员的即时反馈和管理。在数据量庞大的情况下,外包人员的数量会非常庞大,许多大厂会再找埃森哲这样的公司去替它们管理外包人员。这在无形之中使得外包人员、提供数据标注软件的工程师、以及真正需要数据训练模型的算法工程师——三者之间的沟通不畅。企业支付的价格很高,但数据标注质量却并不高。

ScaleAI的专长是利用超规格的工程团队和高素质的外包管理人员,解决数据标注的效率和成本问题。他们在全球招募外包人员进行数据标注,同时将总部设在硅谷,雇佣高质量的硅谷工程师根据企业任务快速构建新的数据标注平台,再根据外包人员的反馈及时对平台的功能做出调整。并通过全球化的招募系统,将价格降到最低——相比于美国大厂为了保证反馈需要在国内招人标注,ScaleAI可以根据任务难度,将简单的任务分发给发展中国家的数据标注员,同时只需支付当地的最低工资。

这又是一家快速转身抓住机会的公司。据极客公园了解,ScaleAI最初在RLHF方面并没有太深的积累,但是通过过去数据标注方面的积累和极强的工程能力,公司迅速开发出了适合RLHF标注的软件。

借大模型的东风,ScaleAI预计今年业务将增长一倍,据悉毛利在60%左右。今年初,首席执行官AlexandrWang在推特上表示,他预测AI实验室很快就会在人类标注数据上花费与底层算力同等量级的数十亿美元。

承接硅谷模型水平最高的客户和拥有最高数据标注吞吐量,利用这些优势,ScaleAI进一步提供了Evaluation和api服务。前者可以为训练模型的企业提供人工测试、给出客观的建议;后者则可以让企业自行接入模型,对模型进行特定业务能力的测试。

自成立以来,这家提供数据标注服务的公司已经经历了两次大方向的调整,但只要数据时代不断发展,永远会有新的长尾数据需要数据标注。这决定了这样的公司将被持续需要。

HuggingFace崛起:开源、GPT4

的对手和百花齐放的企业模型

无论是期待拉平OpenAI的大模型能力,还是企业想拥有基于自己的数据精调大模型,开源,都被寄予厚望——这导致了HuggingFace的崛起。

HuggingFace是一个专门针对机器学习的开源平台和社区,在当下则被视为大模型领域的Github。截止极客公园发稿前,HuggingFace上拥有超过27万的模型,超过四万八千个数据集。而仅仅一个多月前,这个数据还是21万多个训练模型和三万八千个数据集。增长速度十分惊人,其流行程度可见一斑。

HuggingFace的中国区负责人王铁震告诉极客公园,在技术上,HuggingFace针对AI的特点做了许多优化,比GitHub更适合AI。例如:

文化上,HuggingFace也做了许多细致的、ROI并不高的工作,来培养开源社区的氛围。比如对第一次来贡献代码的开发者进行非常细致的辅导。

从早期主要思考如何帮助研究者快速部署模型,HuggingFace逐步向工业界发展,开始尝试提供更多的工具,让企业能够更快速地用上一个学术界发布的新模型。

现在,通过HuggingFace,企业不但可以直接通过API接入大模型的能力,也可以通过上传自己的数据,由HuggingFace在多种不同的模型和训练方法上,找到最适合企业的那一个,直接训练一个属于企业自己的大模型。

HuggingFace没有特别披露过它的营收状态,但据福布斯披露,在2022年,HuggingFace已接近盈亏平衡,拥有了英特尔、eBay、辉瑞、彭博社等超过一千家客户,2023年乘上大模型浪潮,客户只会更多。最新报道称,HuggingFace的估值可达40亿美金。

除了为大公司提供高附加值的定制服务,如果开源大模型继续发展,成为行业的主流,那么拥有几十万个开源大模型的HuggingFace,也完全有能力为中小开发者提供标准化的产品。

Moveworks:用Copilot再造

‘受大模型冲击最大的’RPA赛道

RPA(Roboticprocessautomation),即机器人流程化自动化,意为借由机器人和AI,无需使用人员具备任何代码知识,通过拖拉拽,即可快速构建一个‘可自动化执行的流程’。

事实上,RPA是无代码的一种,顾名思义,这意味不需要写代码就可以运行程序,约等于用自然语言进行软件交互,这正是大语言模型最擅长的事情。因此,RPA也被视为最容易被大模型颠覆的赛道。

过去,Moveworks这一公司深耕于RPA赛道。2016年,Moveworks创始人意识到,AI聊天机器人的潜力,可以在没有人工参与的情况下,解决很大一部分员工的支持问题。聊天机器人背后的模型可以为员工提供自助服务,以解决常见请求。

最初,Moveworks解决了员工的IT支持问题。2021年3月后,Moveworks扩展了其员工服务平台,以解决涉及其他业务线的问题,包括人力资源、财务和其他设施。Moveworks还发布了一个内部通信解决方案,允许公司领导向员工发送交互式信息。

员工与Moveworks聊天机器人交谈,提交他们的请求,Moveworks对其进行分析,然后通过与其他软件应用程序的集成来解决这些请求,包括:打通企业级系统的API和本地服务部署的系统(agent),和打通知识库系统。

在大模型到来后,这家公司也完成了快速升级,从企业内的聊天机器人发展为帮助企业客户做copilot,通过对话来连接人和软件系统。‘在未来,公司的人力资源部可能变成模型资源部。’一位接近Moveworks的人士表示。这也为大模型时代的公司管理及雇佣、协作方式提出了新的想象。

Sambanova的狂想:

软硬件全栈体系,挑战英伟达!

硅谷的投资人觉得它的产品不错,而创业者们觉得它是疯子——成立于2021年的Sambanova充满争议。

原因在于,一家500人的公司既在做芯片、也在做模型,同时还要将模型部署到企业。号称要提供全栈服务的Sambanova目前已经募集了6轮共计11亿美元融资,估值51亿。最近一轮6融资为6.76亿美元,于2021年4月由软银愿景基金2领投,淡马锡和新加坡政府投资公司跟投。投资方还有英特尔资本、GV(前谷歌风投)、贝莱德基金等。

这家公司认为,伴随着人工智能崛起,需要与之匹配的新型计算系统。CPU和GPU这样传统的冯·诺伊曼架构处理器倾向于指令流(flowofinstructions),而非数据流(flowofdata)。在这样的架构中,人们难以控制缓存数据的位置,也就几乎难以控制数据如何在系统中移动。

为此,Sambanova以软件的视角重新定义硬件。‘像GPT-3这样的大模型,需要串联上千块GPU进行训练、运行。’CEORodrigoLiang说过,这带来了企业使用大模型的门槛。这家公司的愿景是消除这种门槛——通过提供包括硬件设计、软件构建、模型预训练和部署在内的服务,减少企业使用AI模型的复杂度和人力投入。

公司的三位联合创始人皆拥有出色的学术背景:其中两位为斯坦福大学教授——KunleOlukotun是多核处理器设计的先驱,另一位为机器学习教授ChristopherRé。CEORodrigoLiang此前为甲骨文公司的工程主管——这为其大胆愿景提供了几分说服力,毕竟,Sambanova号称将英伟达视为对手。

Sambanova称,在其全栈系统设备SambaNovaSuite上部署企业模型的成本,与Nividia+Azure云服务的方案相比,仅是其30分之一。公司的目标客户是希望结合内部数据,定制千亿级别规模参数以上的中大型企业和政府组织。目前,咨询公司埃森哲已宣布成为其客户,而更早之前,美国能源部的阿贡国家实验室(ArgonneNationalLabs)也是其早期客户,购买了其DataScale系统。

04

应用层的窘境:热度最高,

但还未真正‘起跑’

一场技术变革能够真正抵达大众,最终靠的是百花齐放的应用。

在当下,大模型应用被寄予厚望。无论在海外还是国内,相较于基础设施层、大模型层与中间层,应用层的创业热度是更高的——因为后者的技术门槛没有那么高,又直接面向用户、容易拿到结果,对于创业者来说更容易上手。

但,大模型应用层的创业真的迎来了iPhone时刻吗?(注:2007年,iPhone发布揭开了智能手机的时代,2010年,iPhone4的发布和普及掀起了移动互联网应用的浪潮。)

实际上,当下大模型应用的创新正面临窘境。

应用层的崛起需要倚赖稳定的底座,以及丰富的中间层工具。但绿洲资本创始合伙人张津剑指出,相较于海外的很多AI应用发展更早(如AI视频独角兽Runway成立于2018年、文案生成独角兽Jasper创立于2021年),中国大模型和应用层的发展几乎是同步展开的——从今年年初开始,这意味着,应用层发展所倚赖的条件仍不成熟。

按照跟大模型接入的深度,应用层创业可以分为两类:直接调用已有大模型(闭源模型API接口、开源模型)的应用、以及自建模型的应用。

如果在可商用的开源模型(如Llama)上改,亦或是接入已有大模型,效率和效果也都未必令人满意。且鉴于国内大模型的能力较海外尚有差距,‘大部分应用层创业使用的是海外模型,产品直接落地在海外市场。’应用层创业者王安屹告诉我们。

技术如果天天跳跃,只做一层‘薄’的应用是很容易被颠覆的——多名投资人表达了这样的看法。大模型的迭代速度极快,底层的技术飞跃将很大程度限制应用的发展。一个典型的例子是,在GPT-4发布后,辅助写作的独角兽Grammarly和Jasper的价值迅速被摊薄了。金沙江创投主管合伙人朱啸虎曾认为,‘这两家公司或将很快归零,根本守不住。’

实际上,今天在中国要做一个基于大模型的超级应用,甚至能产生商业正循环的应用,对创业者的能力挑战非常大。类似百川智能创始人王小川、出门问问李志飞等极少数人,目前能同时具备‘自有模型技术建立——行业调优——应用生产’的全栈能力,有机会脱离国内基础大模型的发展进度,开始构建直通应用的完整竞争力。而大部分在场景、交互、产品定义能力上有特点和优势的创业者,因为国内大模型本身的技术不成熟、产业链不健全,基本很难进行‘端到端’的探索实践。

‘恐惧和忧虑肯定是有的。’360集团副总裁梁志辉告诉极客公园,一旦大模型的能力迭代至另一境界,的确可能颠覆团队半年来的所有努力,‘但真正的玩家必须在这时下场,不管能不能赢,否则你连上牌桌的机会都没有。’梁志辉说。

尽管当下应用层创业受到诸多限制,但客观上仍存在机会:比如,虽然模型本身已经具备了很多能力,但在一些需要更专业的数据体系支撑、对服务要求更高的场景中,模型的服务能力依然有限。

创业者王安屹指出,在2G(政府)、2B(企业)等场景,这些领域的数据获取难度高,更容易形成壁垒。在国外,有专门做法律场景的Harvey.ai等公司。国内,也有创业公司主攻零售、医疗、营销等垂直场景——需要注意的是,在国内,数据化是当下的首要挑战,‘企业普遍存在数据散落在各地、且难以被提取等问题,因此(产品)建立数据飞轮,可能要从帮助企业能更容易地收集数据开始。’

对于创业者而言,找到场景、拿到需求至关重要——‘悲观者往往正确,而乐观者往往成功’,张津剑说,‘最终能胜出的应用层项目,一定是抓住一个确定的用户需求,通过不断的用户反馈和数据积累,进一步迭代产品,从而形成壁垒、避开模型的能力边界。’

05

中国大模型生态推演:

巨头是重要玩家,

但不止是巨头的游戏

在ChatGPT爆火后,国内玩家们历经半年的狂热,已逐步冷静下来。据极客公园观察,与年初相比,国内的创业者、巨头公司,其中不少人已放弃大模型军备竞赛之路,而转向更务实的思考——大模型最终如何落地?有怎样的应用价值?如何探索商业化?

经过7月初在上海的WAIC(世界人工智能大会),三十多家大模型‘百模齐放’,拥有大模型本身已经不再令人惊奇。从功能上而言,拥有文生文、文生图、代码Copilot能力的模型也不在少数。

但整体看来,中美大模型的商业生态呈现出不同的气候。

基于这些不同情况,现阶段中国创业者在大模型领域,所要解决的主要任务亦不同。

在中国,任何涉及toC的大模型服务,合规先行是必然趋势,合规模型将会率先在市场上提供服务,并在大规模toC的应用场景上获得先机;模型质量上,媲美GPT3.5的优质基础模型依旧是训练目标。而在训练过程中,由于算力整体有限,高效集中资源并使用,将更加重要。除了需要考虑算力的集中和分配,减少不必要算力消耗的训练技巧也将是重要的经验。

极客公园了解到,有消息表示,随着监管明确,第一批合规模型放出是值得期待的。同时目前在toB领域的应用上,实际上已没有官方的合规要求,这将助推大模型落地企业,也将推动工具层和应用层发展。

目前,模型公司纷纷宣布开源模型可商用,极客公园了解到,在参数规模上,国内的开源可商用模型将稳定在13B(130亿)左右的规模。趋势上,国内少数有能力的创业公司将继续训练更大规模的模型,并选择闭源;而也会有很大一部分企业,则会根据需求训练模型,不以规模为绝对的追求,而是满足业务探索需求。比如腾讯内部自研了一批从十亿到千亿规模的模型,金山为了更好地响应办公文档‘WPSAI’的用户需求,内部也训练了小模型,作为接入的基础模型能力补充。

中心化模式即企业调用通用大模型、或第三方行业垂直模型的API去构建业务功能;非中心化模式则是指,企业根据使用场景和功能,用专有数据微调(Finetune)拥有一个甚至多个模型。这样的专用模型甚至不必追求规模,可以相互协作解决问题。业界普遍认为,只需要在百亿参数规模上进行特定领域的知识增强,便能够在特定功能上达到比通用模型更加有效的效果。

极客公园在调研后认为,在中国(美国也类似),第二种非中心化模式的市场占比将会更高。按照百川智能的创始人王小川的观点,‘80%的价值可能是蕴含在非中心化的模型和服务里的’。实际上,像电商、社交、游戏等存在巨头、集中化程度高的垂直领域,巨头绝不会使用他人的模型来构建业务。

背后的逻辑在于,在这些领域内,数据是关键性资产,通用模型不具备服务某一领域的能力,接入数据后才具有专业能力,但所谓的行业模型一旦模型能力全行业共享后,意味着一定程度上竞争壁垒的消弭,因此必然会形成各家在数据墙内训练专用模型的形态。未来,随着模型支持业务的场景和功能变得丰富,模型群落将逐渐形成。

而在集中度不高的商业领域,或者非完全市场化的一些关键行业,或许会出现一个领域模型以API服务多家的形式。华为发布盘古大模型时,同时发布在政务,金融,制造,矿山,气象等垂直领域发布模型,便是这种布局思路。

此外,在中国未来的大模型体系里,巨头仍然会是大模型商业世界的核心玩家。

中国尚没有出现DataBricks、HuggingFace这样的模型工具平台,取而代之的是各大云厂商推出的服务与平台。虽然对外宣传的侧重各有不同,但形式基本一致,以云平台搭载多个模型提供服务,其中包括第三方模型+自研模型。腾讯甚至在发布模型平台之外,发布了作为中间层工具的向量数据库产品。

最鲜明的是火山引擎,以Maas的形式在云上集结了多家大模型对外输出服务。同时火山引擎提出,未来企业使用大模型会呈现‘1+N’的模式。而火山引擎推出的‘模型商店’,目的就是方便企业挑选合适的模型进行组合。百度最早发布文心一言大模型,现在也已在百度上线第三方模型。火山引擎、腾讯虽然没有官宣,但趋势已经形成:自研模型将会和第三方模型一起在云平台上提供服务。

在今天,巨头比任何公司都更警惕范式革命的降临。因为理论上,巨头随时可能被对手发起闪击战——一旦大模型能力注入产品提供颠覆性的价值,对于原有业务可能是巨大的冲击。而经历移动互联网时代多年的积累,上一代互联网平台已经呈现出生态位的复杂性。以阿里、腾讯、字节、百度为代表,它们既拥有现成的toC场景以及规模优势,提供云平台服务的同时也自研模型。当自研模型能力注入原有场景后,toC领域的边界会重新模糊。由此也不难理解,为何巨头无法承受错过大模型的代价。

复杂性亦体现在巨头和生态的复杂竞合关系中。

在国内,巨头们纷纷聚焦云业务与‘模型商店’的模式:既以云业务‘服务’其他第三方模型创业公司,同时也有自研模型、有可能会与创业公司的模型竞争——这将带来的复杂问题是,无论是从技术上还是业务上,彼此的边界如何明确。

以字节旗下的火山引擎为例,大模型领域的创业者如果用火山训练和部署了精调模型,归属权是否必须属于火山云?而未来的创业公司,如果在火山云上为客户提供MaaS服务,由此所带来的用户数据,与这家创业公司是否必须隔离开(即创业公司无法接触到所服务的客户的数据)?这些都是火山引擎曾经与创业者们的分歧所在。

精调模型的归属问题背后,也指向云平台的担心:创业者使用了云平台的算力之后,直接打包走模型能力和所服务的客户,于是云平台仅仅扮演了‘一次性服务’的角色,并未成为真正的Maas平台。

而数据隔离背后的逻辑更为复杂。首先,确实有安全性问题,模型公司进入,破坏了云平台原有数据安全体系,需要有所隔离。其次,模型公司如果不断接触用户数据,极可能以客户数据不断增强自己的模型能力,这将形成模型公司与MaaS平台关系的不平衡,会让平台角色退向算力供应商,而非在生态中更上的站位。这种非本地部署的MaaS方式,也会带来行业核心客户的竞争力流失,进而破坏云平台的存在根基。

尽管被动,但目前,创业者又很难离开火山这样的云平台。不仅因为通过火山能够找到模型的潜在客户,更因为火山拥有算力,且提供的服务‘很便宜’,‘只有这里能训’。

另外在MaaS模式下,巨头麾下的云平台本身与其他提供模型的第三方企业是合作与上下游关系,但巨头自研的模型,与第三方模型同样作为选项进入自家的‘模型商店’,又会带来一定的竞争关系。长远看来,这样的竞合也会成为影响生态的关键因素。

好在可以确定的是,丰富的生态中,绝不只有大模型这一个竞争点。在国内,巨头一定是最重要的玩家,但大模型绝不止是巨头的游戏。

不少人认为,巨头无法对抗组织重力,‘可能还不如小创业公司聚焦。’且在当下宏观环境中,国内巨头并不推崇无限扩张,这为生态上下游的创业公司都留足了机会与空间。在此背景下,业内人士认为,‘大厂的战略投资部将重新变得重要,因为来自技术的狙击将随时发生,战投的使命是为公司探索未来。’

长期而言,围绕模型形成的生态和商业模式将成为竞争壁垒。据极客公园观察,国内的大模型创业公司已经在围绕模型培育生态,方式包括完善面向开发者的工具和技术模块,开源版本及社区运营等。

一个企业用户,是直接寻求模型企业的服务,还是选择云平台方案,会受诸多因素影响,比如成本、方案便捷性、行业竞合关系、对模型自主的需求、自身技术实力等。而互联网巨头目前的业务格局,既会带来快速渗透场景的优势,又可能会因本身业务多重性带来的竞合关系,存在一定牵制。

‘百模大战’在中国很可能不会持续太久,有关大模型本身的竞赛也将很快不再是产业的焦点,谁能率先提升中国大模型的能力到GPT-3.5甚至4.0的水平、谁能在未来非中心化模型崛起的时代,‘多快好省’地帮企业落地大模型构建现实竞争力、谁能率先把大模型能力落到细分场景和产业形成颠覆性创新,将是下一个阶段的核心看点。

THE END
1.每日一字936:攻行书横画抗肩写法字形右边“攵”字撇画起笔高扬,角度稍立;横画起笔位置靠下,与左边竖画的起笔平齐,大抗肩,不宜过长;下面小撇起笔靠左,与横画虚接,撇身弯而有力,注意轻重变化;捺笔舒展,露锋轻入,顺势向右下行,捺脚稍重,并且低于左撇撇尖,出锋势平。 “攻”字的行书写法:https://www.163.com/dy/article/J2JALAEA055344J1.html
2.新凡人修仙传游戏攻略Q6: 如何快速获取提升伙伴修为的丹药材料? Q7: 九天玉简、秘境寻宝、空间裂缝玩法中的几个小技巧。 4、快速提升战力的几个小妙招 5、新手必读、快速上手--让你秒变“高玩大神” 第一篇: 详解修为经验的多个获取途径,让道友快速飞升不是梦! 修为如何快速获取、境界如何迅速提升等!想必是众道友在修仙途中最为关https://www.124sy.com/m/article/118882.html
3.你已经猜到结局了吗攻略大全2、阿梅是一个什么人? 答:文盲 3、阿梅为什么要翻到第30页? 答:上面有特殊图案 2-2:热茶 1、张三端上来的实际是什么? 答:空茶杯 2、张三和老王的真实关系是? 答:互不相识 3、老王如何察觉到张三不对劲呢? 答:靠耳听察觉 2-3:大雨 1、为什么大家都不避雨? https://app.ali213.net/mip/gl/1396493.html
4.三个女人三个阶段对比漫画分析大伴的接受与拒绝攻受变化(穷途这里有一个非常有争议的点:为什么大半拒绝了今之濑?我来分析一下:1. 尽管这里拒绝了今之濑,但是下一个场景立刻就是大半送走未婚妻,邀约今之濑上楼,两人疯狂合体,并且是大半做攻。2. 漫画版虽然剧情不太一样,blabla两人说了一堆颠三倒四的话,大半也是先拒绝了今之濑,虐他虐到极限,直到今之濑get到“你https://movie.douban.com/review/13631442/
5.乡村教师个人先进事迹材料(精选26篇)时光飞逝,来到湾里实验学校已经迈入第三个年头了,作为一名新手老师,在工作与教学中得到学校领导与各位老师的帮助、关怀与支持,她事事严格要求自己,身体力行地诠释着我们的校训“学优秀的别人,做最好的自己”。 一、有理想信念 作为一名教育岗位上的新兵,她深知学生思想动向的重要性。在工作的同时,她始终坚持中国共产https://www.ruiwen.com/word/xiangcunjiaoshigerenxianjinshijicl.html
6.美了乡村——从“宋家沟村坊城新村”变化看如何做好巩固拓展脱贫一个村一个村推,一个项目一个项目抓,一个季度一个季度攻,一年接着一年滚动扶持,不搞锦上添花也不建空中楼阁,有步骤分阶段扎实推进,这些高标准示范区将引领全省学有榜样、干有目标。 3、“七个一”努力让脱贫基础更加巩固、成效更可持续 巩固拓展脱贫攻坚成果、有效衔接乡村振兴是一项复杂的系统工程。山西聚焦突https://www.cbg.cn/show/5849-1842302.html
7.如何做一个同城跑腿送货app?超全攻略来袭!现在同城配送行业发展得很好,按照如今人们的消费习惯和消费心理来看,同城配送是个不错的创业方向。因此许多小伙伴前来咨询如何做一个同城跑腿送货app,小编**带着超全攻略来帮助大家解决问题啦! 一、有哪些同城跑腿送货app? 1、UU跑腿 UU跑腿是全*专业的移动互联网跑腿服务平台,以共享劳动力与时间为众包理念,人人都可https://www.keloop.cn/information/art49861.html
8.如何做好网络咨询:让在线的每一个患者都进院?医院服务很多时候咨询并没有在这个过程中仔细思考顾客真正的抗拒点是什么,因此也没有办法很好地改变顾客的抗拒心理,顾客的问题都没有很好地做出解答,面对顾客的质疑一直一味迎合丧失真诚,顾客自然不会愿意上门。 3、在沟通过程中打击其他机构 实际的沟通过程中,有的顾客会透露出自己曾在其他家机构了解或者做个项目,有的网电http://zl.hxyjw.com/arc_47350
9.职场沟通技巧2、克服把批评当“包袱”的思想。有的人受到批评后,认为领导对自己有想法,整天顾虑重重,感觉到在这里做没什么发展。其实领导的批评并不是对谁有什么成见,批评是对事不对人,当领导的不会因为一个人犯了错误而把他看“死”了,犯了错误并不可怕,改了就是好同志,完全不必要因此造成沉重的思想负担。 https://m.jy135.com/zhichang/851091.html
10.恋爱中接吻技巧不可少让你成为接吻高手六招方法三、女孩必学的10个接吻技巧 1.别让唇膏做"*" 32岁的业务主管阿林和女友感情一路飙升,两个月功夫已到了谈婚论嫁的地步,但偶尔阿林也会叹叹苦经。他抱怨说女友的唇膏使人看上去挺性感,可对亲吻却具有百分之百的杀伤力哪个男人会喜欢嘴巴上粘腻腻的接吻呢?阿林说,这让人很不舒服,还有隔靴搔痒的感觉。所https://yangsheng.120ask.com/article/150079.html
11.如何成为一个更好的沟通者?澎湃号·湃客澎湃新闻当然,不是说每句话都必须复述对方,没有这么机械 —— 你可以把它用在一个段落的承上启下之处。比如开启一个新的话题时,或是对方阐述自己的重点时,又或是对方讲了一大通话之后。 这个做法其实相当于一个约定,也就是对前面的内容做一个总结,把总结的结果作为下一阶段对话的重点。这可以非常有效地把话题引导向https://www.thepaper.cn/newsDetail_forward_26066525
12.综合小冒险一:高考前7个月,弃理攻文 其实,少年到青年之际,金灿荣有着不少叛逆壮举。在小学三年级时,金灿荣看了阿尔巴尼亚电影《地下游击队》,旋即招呼同学在家成立了有模有样的“游击队”,结果被老师狠批一通,还撤了班长一职;1984年至1987年在中国社科院美国所读研究生时,他带头推翻了不得人心的研究生会,还和同https://www.whb.cn/zhuzhan/jtxw/20190624/272298.html
13.初中生必读小说B虎妞是一个温柔漂亮的女人 C小福子的命运很悲惨 D曹先生对祥子很关心,但终也没能够拯救祥子 24《骆驼祥子》中的人物评价正确的是哪几项?(AB) A高妈在曹先生家做仆人,对祥子很关心. B曹太太是一位很温和的太太 C夏太太很端庄 D夏先生是一个很正直善良的人 25《骆驼祥子》中的人物评价不正确的是哪几项https://www.51test.net/show/2636278.html
14.NO9,关十天,每天两个任务一个是物理伤害攻,一个是对受做涩涩的事情伤害攻吧,毕竟可以制造肢体。不过受应该会因为良心上的不安而选择做 №15☆☆☆= =|6c270576于2020-07-20 16:12:26留言☆☆☆ 投诉 加书签 引用 不再看TA 〖priest《残次品》成功签约出版俄罗斯图书〗 我觉得大概是一开始选择受方的任务,直到要doi实在心理的坎过不去选择放血,放完一看下一个任务就是https://bbs.jjwxc.net/showmsg.php?board=3&boardpagemsg=1&id=2314776