零一万物从2023年起就进行了多个产品的尝试,其中一款主打海外市场生产力场景的产品,预计今年营收1亿人民币,用户已达到1000万。
发布会上,李开复提出了TC-PMF的方法论。相对移动互联网时期的黄金标准PMF,李开复认为现阶段AI产品的创业还需要考虑Technology(技术)和Cost(成本)。
蓝雨川:零一万物API平台负责人
01
零一万物是怎么做产品的?
我们的差异化是第一天就面向生产力真正的痛点,在白领和知识工作者平时在工作当中遇到的真实的最痛点里找读、写的核心场景,并不只是给chatbot加上AI的能力,因为后者没有办法解决用户真正工作中的问题,所以它的留存和增长也不会好。
基于这个理念我们打造了AI-First的Office的产品形态。为什么我们觉得它有机会呢?
首先我们有一个理念,大模型会把所有之前的积累很多年的生产力(产品)的工作流重构一遍。
Office已经推出四十年了,之前所有的用户在工作当中要去写一个文档,方式都是打开一个空白页面去想到底应该写什么,这个过程对每一个工作的白领来说最困难。但大模型带来的交互变革,就是人机对话式的自然语言方式,可以输入一个问题或一个需求就可以开启你的工作。
我们在万知里,包括我们海外的生产力产品,所有工作流开始都是从一个对话开始。我们做一个PPT只需要输入一个标题就可以了,不像原来先是找到一个模板,这是一个巨大的变化。
从这个角度,我们找到最痛点的白领的工作场景,同时用AI-First的交互方式把它做到成功,得到的结果:
我们海外的产品去年9月推出时也有ChatwithDoc的功能,我们会发现用户的需求和使用非常井喷式,很快达到了PMF的状态。我们通过产品迭代和用户增长的优化,很快把我们的ROI打到1以上,因为海外是付费订阅制,很快在收入上也会获得非常好的成绩。我们今年按现在来看预期差不多会是一亿人民币的收入规模,我们ROI还是在1左右。这样的结果至少从国内大模型公司来看是非常有优势的。
现在大模型应用本身今年肯定在国内是应用落地的一年,这一块国内国外都遇到很大的挑战。最开始我们先推出海外产品,ROI非常健康,我们收入获得非常高速的增长,国内万知基于本地特有场景做专属优化,随着我们模型能力一直往前突破,在产品上找到真正高价值,未来甚至有付费能力意愿的场景做匹配。
我们现在打造AI-First的时候,主要思路是TC-PMF。这里有两个东西,第一个是技术,第二个是成本。
技术方面,最核心的是模型能力各种指标。现在被大家比较公认的指标,首先是模型benchmark,这一点我们的指标达到全球业界领先水平。但是做应用的时候光有这一点远远不够,还要求我们有从用户视角,模型的结果能够满足用户需求的指标。
李开复:我们最早上线的生产力产品的ROI已经可以做到1了,也就是我们从用户手中收到的订阅费,已经低于我们获取用户的成本加GPU的成本。今年应该会有一个亿的收入,有近千万用户。
但这还不是达到了TC-PMF的普惠点,因为规模还不够大。普惠点是真的有上亿用户,每天或者每周去使用,而且账要能算清楚。
我们探索的一些其它应用,娱乐、陪伴类的都有,但ROI都没做到过1,30日留存也不够好,我们就没有去推。
李开复:生产力应用的付费点最明确,虽然技术上有幻觉问题,但最终是人来把关内容,因此也OK。
而其他领域,包括那么多人学的Character.ai,都有TC-PMF的问题,主要是降低推理成本和提高体验上的冲突现在还比较难解决。
你要降低推理成本,只有缩小模型,这就导致体验不够好,用户不会来。你用了大模型,体验好了,但推理又贵了。所以Character.ai就没有特别好的体验,因为它用不起GPT-4,它自己做的小模型又不够好,进入了两难。
一个诱惑是,我们也可以花钱烧出用户,号称做到了几千万用户、几百万DAU。但是留存不好、ROI不好,这么做下去最终还是得破产。
我们会把(ROI)0.6当作一个基准线,烧1块钱可以回6毛钱时,就可以往前推进。
你一旦推到了1,就表示增长还可以更激进,我们还没有到一定要追求回本的阶段,我们就会多做一些推广;太低了我们就扎实地提升产品。所以ROI会自然地游走在0.85到1.05之间。
曹大鹏:办公领域是一个大的市场,或者说一个赛道。有一次Google前CEO艾瑞克·史密斯看到我们的产品能生成PPT,他评价说「信息包装是500亿美金的市场」。从市场角度来说,PPT只是这里面特别小的分类,但信息包装是非常重要的。我们任何工作里面的文档都来自于信息获取与整理,这个部分其实是巨大的市场。
信息包装本身就有500亿美金的市场,而整个生产力赛道比这个更大一个量级。包含办公场景的生产力赛道更多是一个需求市场,怎么在这个领域做应用,是做一个AI-First,还是AIEnhance?
AI-First的好处在于,第一,极大降低了用户使用办公软件的产品门槛,原来这些软件之所以用户用,并不是因为它好用,而是因为没有新的技术带来颠覆它的可能性。AI大模型这个能力是巨大的变量,如果它能把最开始的交互从空白页,让你自己想怎么下笔,变成我只需要输入思路标题,就给到非常多的灵感,然后再把中间的编辑过程提效,原来几个小时做一个PPT,现在花十几二十分钟,这就是一个十倍体验的提升,因为降低了用户的成本,用户就更多使用AI-First。
我们海外产品是面向全球的,过程中会发现一些东南亚地区,包括一些欠发达国家地区的用户热情是非常高的。
02
模型公司做产品的优势
黄文灏:我们要打破壁垒,算法团队和应用团队不应该是两个团队,而是一体化oneteam。
一方面以应用为目标的产品经理,大家要不断的去了解基础,哪些是模型能做的,哪些是模型不能做的,一定要了解产品的边界在哪里。
黄文灏:因为我主要负责预训练团队,预训练是以模型通用为目标,我们没有太多考虑应用需求。零一万物有比较多的应用在做,包括像生产力、社交、娱乐,我们希望所有的应用都基于一个通用的模型,来自每个应用的需求也是不一样,所以我们希望预训练模型作为一个基础可以服务所有的应用,这里面最重要的还是模型general能力的提升。
我们也发现,看起来社交和娱乐没有太大关系的复杂推理能力,在模型通用复杂推理能力提升以后,用户的沉浸感也会变得更好,留存各方面指标都有提升。
另一方面,为了未来做得更好,在预训练阶段应该有所保留,我们在算法上做一些控制,让未来那些应用做得更好。如果我们只想追求一些预训练的目标,我们可以做到一个模型的的指标比今天发布的更好,但是会透支未来的潜力,这对应用不利,所以我们还是在考虑应用的情况下做一些预训练的工作。
黄文灏:最大的挑战还是在组织和人才方面。
另一方面做应用的人,他们会觉得模型能力的提升给用户带来的体感不是那么明显。我们花了很多钱,去追求模型性能上或者指标上的提升,但是并没有解决很多用户的问题,所以这个割裂感很强。
硅谷更偏向于追逐梦想,国内更脚踏实地,所以我们一开始会追求模型和应用一体做建设。这两边的割裂是所有大模型公司都要碰到的问题,这里面最难的还是在组织层面和人才层面怎么能把这个事情打通。
蓝雨川:我们到底是专注于AI1.0时代做项目模式交付模式,还是真正能够服务好一些AI应用的商业化?
AI1.0时代有大量公司做项目交付,但是赚到一次性的钱之后没有后续。我们今天的思路更像云平台,提供一个非常强大的API技术能力;我们会提供一系列工具,帮助大家轻便上线;我们提供行业解决方案针对各行各业应用场景做优化。这是我们API平台发展的方向和目标。
李开复:我们会做很多事,整个公司的设计就是要做一个AGI时代的微软。
万知AI上线以前,我们在海外市场就已经有4个应用了。但有些事我们暂时不会做,比如在国内做2B,我们不会碰项目制的订单,我认为它还没有逃离上次AI1.0的魔咒。
2B我们会走API路径,不管国内国外,花钱买API都是一个已经被教育过的市场。所有的创业基本都应该避免去教育市场,因为这是大厂才能付得起的事情,创业公司没有这样的成本。
03
国内外AI产品生态
蓝雨川:海外GPT-4的API在去年发布,使海外AI生态非常繁荣,很多AI原生应用已经诞生,达到了数千万美金的收入,也有非常多的成熟产品和公司用OpenAIAPI做出自己的第二曲线新业务。国内的情况会慢一点,有许多企业在探索,但阶段没这么快。
国内外AI生态差异的背后,有两个非常重要的因素。
第一个因素,TC-PMF,我们是不是有一个最优秀的大模型让企业跑通自己的AI业务,跑通AI新产品的PMF,能够赚到钱,这是非常重要的。
第二点,我们有足够强大的推理优化能力,把模型API成本降得足够低,这样企业的AI产品才能赚到钱,持续扩大规模。
曹大鹏:第一点,我们海外产品第一阶段的商业模式采用会员订阅制,这从C端来看算是最健康的商业模式之一。和国内一些视频网站类似,用户如果点击订阅,下个月不退订的话会自动续订。用户不用很多,但是付费订阅费能够支撑增长,包括成本。
第二点,我们的海外产品去年九月份推出,从有部分用户进来,到现在10倍、20倍收入的增长,为什么我们ROI能够越来越好?一方面是AI渗透的快速增长。新的模型或者产品发布之后,从earlieradopt变成往大众推广,尤其是海外欧美国家走得更靠前一点。另一方面是我们的产品力,包括增长获客效率也在持续优化。
曹大鹏:我们现在海外产品模型选型是Yi-Large加GPT-4的组合,我们最开始推出的时候自研模型还没有做好,现在Yi-Large已经推出并在海外产品上线,并成为我们实时对比测试自研模型的平台。
我们的海外产品是在去年9月份上线,第一版只有Chatbot、ChatwithDoc两个基础功能。当时推这个功能的原因在于,首先ChatGPT是一个爆款产品,它两个月做到一亿用户量,是一个超级的PMF产品。但我在用ChatGPT产品的时候,发现它的短板在于Chatbot只解决基础的问答、文案,包括很简单的任务,但如果定位是生产力方向,我的日常使用场景大量集中在文档角度:找、读、写。ChatGPT很厉害,我就打它的弱点,所以我们要把ChatwithDoc这个功能跟Chatbot结合做一个完整产品。
一个新技术刚来的时候,一个产品就是一个功能,但是往后都会被更强大的产品替代掉。ChatPDF很早就推出一个海外产品,但用户不太可能在ChatGPT和ChatPDF这两个产品里面切换。经过大半年,我们的文档阅读功能,无论在文件处理大小,字数,还是表格处理能力上,在全球同类产品里达到了全球领先。
第二,我们用GPT-4API时发现,它在一些特有场景里面体验非常糟糕,比如说做PPT,但我们只能用它的API,只能用promptengineering的方式去解决,因此瓶颈是显而易见的。
但我们的自研模型Yi-Large会在这些领域显著超过GPT4,这也是为什么我一直坚信只有模型应用上、能力上,组合上结合起来,才能最终做出AI-First产品。