大模型产品化需要更多「二次开发」,创造出AI应用的「UGC」。
大模型AI行业正在寻找2.0时代的入口。
因为Web2.0的降临,就是上一轮互联网革命,最重要的爆发节点。行业在经历了千禧年的泡沫破裂后,很多人一度认为计算机对大多普通人「没有实用价值」。但随着Web2.0革命,UGC、社交媒体开始出现,把所有人代入了「裂变传播」的时代,之后的智能手机、移动互联网革命,就建立在此之上。
很大程度上,今天的大模型AI,需要一场类似Web2.0的革命。通过降低技术门槛,拓宽开发生态,激发出有效的用户需求和产品供给。
11月28日,扣子平台推出了今年最重要的更新,ProjectIDE。通过UIBuilder、应用模版,将AI应用的开发门槛进一步降低,且丰富了AI应用的交互范式,他们正在尝试将大模型AI应用开发代入「2.0时代」。
01
为什么AI需要一次「2.0」更新?
要理解AI应用开发的2.0时代,我们需要先回到20年前。
这时的网页就像一张报纸,只不过设立一个页面的成本比发行报纸要低得多。所以很多人都可以建立自己的主页,整个互联网上网站的数量很多。
定义Web1.0时代的应用是搜索引擎,因为整个互联网上有大量的网站,大家很难找到自己需要的信息,Google通过关键词搜索和网页排序算法,建立了搜索引擎,人们就更容易找到自己想要的信息。
而今天的AI聊天机器人,它和搜索引擎在逻辑上有着很大的相似之处。它们的交互界面都是一个输入框,让用户输入关键词、提示词,AI大模型生成内容的过程其实也就像一种「权重排序算法」,通过语言模型,把「权重最高」的词语提取出来,生成连贯的语句。
这里最大的问题在于,大部分用户,并没有自我挖掘需求的能力。在Web1.0时代,他们可能并不知道自己想搜的是什么,在AI大模型的时代,他们又难以编写出完整严密的提示词。
所以2000年以后,第一轮互联网泡沫破裂,当时大部分互联网公司的用户和收入增长都不足预期,股价暴跌,包括雅虎在内的一大批互联网巨头都被时代重刷下去。
直到2003年后,MySpace、Facebook、Twitter相继上线,Web2.0的时代到来了。
Web2.0让用户不再只是内容的消费者,而是成为了创造者,「社交媒体」的概念诞生,平台的内容量得到极大充实。与此同时,围绕各个社交媒体平台的「二次开发」也出现了,Web2.0时代的社交媒体,往往会开放很多产品接口,让开发者可以基于这些产品,二次开发出更多功能,满足用户不同的需求。
其中最典型的案例之一就是Twitter。早期的Twitter只是一个短内容发布平台,但因为有着开放的第三方开发生态,Twitter迅速成为了「独立开发者的游乐场」,各种第三方客户端、自动化app都被开发出来,使Twitter在早期竞争中,战胜了一大批对手。
回到今天,大模型AI面临的状况其实与Web2.0的前夜非常类似。当下大模型已经有了强大的生成能力,但大部分用户利用它的效率依然不高,很多基于大模型能力的产品应用已展现出强大的能力,比如针对视频的多模态实时字幕生成、并可以翻译,但这显然只是AI能做到事情的冰山一角。
特别是随着大模型训练效率的提升,同性能模型的运算成本已经在飞速下降,AI产品化的展开面正在被拓宽。
02
为AI应用开发「搭一座桥」
今天,AI产品开发的主力军是技术人员,其中有独立开发者。
造成这种情况的主要原因是,AI产品的代码往往并不复杂,开发工作量不大,很多功能都是通过大模型的接口实现。但这个代码门槛依然存在,过去「产品经理+程序员」的开发模式反而不适用了。第一批AI创业者里,有很多都是自学代码,以实现从0到1的产品开发。
这种现状意味着,AI开发社群里还有很多潜在力量,没有被调动起来。他们可能是产品经理、设计师,更懂产品需求、设计交互,但不一定有代码经验。如果能在大模型平台和他们之间搭一座桥,进一步降低AI产品的代码门槛,就能给AI产品开发带来更大势能。
这就是扣子过去一年花精力最多,致力于实现的事:帮助创业者以最快的速度实现从0到1的应用搭建和迭代。
扣子实现的最大改变,就是对「交互」的颠覆,通过UIBuilder,AI产品的交互不再局限于对话,而是可以加入更多按钮、菜单、选项,来规范用户输入。
当然,对话式交互是大模型AI应用最重要的特点和优势,因为自然语言是人类最天然的表达方式。但在很多高频、标注化的场景里,对话不应是唯一的交互方式。
提示词的输入效率和质量,正是目前AI产品面临的最大难题之一,大部分用户都很难编写出详尽完整的提示词。扣子通过在开发端加入UIBuilder,基于工作流的开发思路,将很多提示词的编写都拆分成产品功能,为AI产品铺好了台阶。
除此之外,扣子还在尝试解决AI产品的另一个难题,记忆。
目前大部分AI产品的用户数据库,往往都比较简陋,且有明显的「稀释」问题。用户在一个对话的前半段输入的信息,随着对话的不断进行,会迅速被稀释,AI大模型会忘掉这些关键信息,最终偏离用户最初的意愿。
比如之前一度很火的App「胃之书」,用户可以通过拍照,让AI来记录每天的食谱,分析营养摄入。在加入了数据读写能力后,App就可以将每天的食谱信息、营养,以数据的形式储存,之后进行多次调用。比如用户就可以知道自己每周、每个月的饮食健康程度,回顾自己「这个月吃了几次薯条」,「有多少天热量超标」。
大模型AI的一个特征,也是弱点,就在于它输出的内容的保质期太短了,需要转化为「数据」,才能为用户提供更长期的效用和价值。通过扣子的UIBuilder和数据库能力,独立开发者可以将AI大模型与更多场景结合,比如「运动书」、「旅行书」、「星座命理书」,通过完整长效的前后端,形成长期的交互循环。
而这些,还只是当下扣子平台新功能的几个应用范例。这些新的开发功能,将为大模型AI应用开发「搭一座桥」,弥合模型和用户之间的距离,解锁更多AI应用的可能性。
03
AI应用的未来需要「UGC」
ProjectIDE的推出,不仅意味着扣子搭建起了一个更完整的AI应用开发平台,还降低了AI开发的门槛。
通过「AI应用模版」和「工作流」,扣子已经能够实现近似「零代码」的AI应用开发。即便是没有代码能力的爱好者,也能够通过扣子可视化的工作流界面,将不同的AI功能组合在一起,还可以对功能模版进行修改。
扣子工作流的界面,有点像当年iOS的Workflow应用,或IFTTT,它们分别是针对iPhone和线上互联网服务的自动化工具,通过图形化的界面,将不同的软件功能整合到一起,形成一个新的「程序」。
而现在,扣子通过对AI应用模版的可视化,也打造了一个「人人可参与」的AI应用生态。比如用户可以下载一个练习英语写作的AI应用模版,通过修改其中的提示词,将它进行更细化的调整。比如要求它着重优化语法错误,或者是着重将过于简单的用词换成更专业的词汇……当然也可以把练习英语换成其他语言。
目前扣子平台上已经有上百个模版,可供用户调用、编辑。因为这些模版的核心往往都是一系列流程加上一个或数个「提示词文档」,所以它们的可编辑空间很大,理解门槛也并不高,即便是普通用户也能上手。
而且,「应用模版」本身也是扣子开发生态的一部分,开发者可以将自己编写的应用模版上架商店,进行变现。这种模式已相当成熟,此前notion在上线了AI功能之后,也迅速涌现了上百个工作模板,其中一半以上均为付费模版,形成了健康的商业生态。
正因为AI大模型能力是一种抽象的智能,并不针对任何具体的需求、功能,所以在将AI产品化的过程中,很需要这样的「二次开发」,将抽象的大模型能力,捏合成具体的形状,最终满足特定的需求。
如果说当下的AI需要一次Web2.0式的革命,它的实现方式或许就是鼓动用户来创造AI应用的「UGC」。