万字对话有道四高管:“模型即应用”的时代,到了?

5月底,有道交出了2024年第一份答卷。

2024年一季度未经审计的财务报告中:有道净收入13.9亿元,同比增长19.7%;智能学习硬件一季度收入1.8亿元,同比下降14.8%,连续第五个季度下降;数字内容服务一季度净收入5亿元,同比增长11%……

很快,有道又在上周对外公布多个产品的更新——AI全科学习助手“有道小P”上线独立APP,虚拟人口语教练HiEcho儿童版和新一代知识库问答引擎QAnything。

其中:

AI全科学习助手“有道小P”可以在手机端便捷使用,解决学生全科学习的诉求;

HiEcho3.0在功能、教学模式、虚拟人等方面全面创新,计划于6月中旬推出“儿童模式”,并新增两个全新的“语伴”角色;

有道自研的RAG引擎QAnything在私有化部署和智能体生成方面进行提升,从单纯的文档问答进化成智能引擎——“企业AI大脑”。据介绍,目前,QAnything已经服务了20多个不同行业的上百家客户……

它们正是有道当前的布局缩影——以大模型为基座,持续、深度布局SupperAPP,从C端向B与G端延展,从线上到线下,用教育数据的积累,应对数字世界的疯狂变化。

“有道不是市场上最大的公司,网易的文化也不是说看到一个技术风口就一定要去追的公司。”回顾有道的一路尝试,周枫在现场坦言:“我们在大模型上的做法从第一天开始,就是以应用为王。我们就是要紧紧盯着到底哪几个应用领域我们能够抓住。”

“子曰”推出至今,有道已经基于其推出10余个应用,覆盖了翻译、作文批改、语法精讲、句子解析、体育教育、口语练习、家庭辅导等多个细分场景……

AI依旧还不是有道所有业务的收入支撑。

但却已经成为有道高增长的核心支点。

“每天都讨论得很辛苦,很多项目干了一个月又要推倒重来,但总体来说,做得挺开心的。”周枫说道。

01

“模型即应用”的时代,到了

Q:GPT-4o对子曰带来压力了么?

周枫:OpenAI跑的比较快,GPT-4o的出现证明实时交互对用户吸引力很大的。

在技术端倒没有完全的壁垒,因为它本身是端到端模型技术方向,我们看完之后发现其实有道之前的翻译就是这么走过来的。

在2018年以前的翻译系统是多个模型串联、并联组合起来的,2018年以后翻译模型就变成端到端的模型,一端进去是文字,另外一端出来时候就已经变成另外一种文字,中间没有语法、没有拆分这些东西。

(网易有道CEO周枫)

这些问题其实才是有道的消费者最关心的,所以我们是在把大模型应用到关键领域,也会继续坚持解决更多的问题。

Q:最近不少大模型业务厂商都在做降价或者免费,这种趋势已经辐射到应用端了?

周枫:我可以根据我们的观察提供一个数据,实际上大模型的成本它是下降的,基本上一年至少下降了一半。

外部大家观察到的信息是比较多元的,可能大家会看到类似GPU涨价等等而认为大模型不可能降价。其实是下降的,而且如果下降确实达到一年一半或者更多的话,这就比摩尔定律的下降速度要更快。

那么这个时候,对于做云端服务的公司来说,目前的降价是一个市场行为。它可能会希望降价之后能够拉更多客户,我觉得是云厂商的一个动作。

这样的动作可能不会是互联网上第一次,也不会是最后一次。

Q:但目前的模型训练还是很贵的,这对价格战来说会不会造成更大的压力?

周枫:大家今年会比较关心70b模型,甚至130b的模型应用,现在不管训练还是推理都贵,所以价格能降低肯定对行业是个好事。

我们也可以看到,现在直接卖API并不是好的商业模式,一定程度上这也是促成降价非常实际的一个动因,相信做B端的这些公司肯定也会探索出新的模式来的。

Q:有道子曰到目前为止,区别于同类型大模型最大的差异和优势是什么?

周枫:最大的优势就是我们自研的,可以对它根据我们的需求做任何的优化和修改。

Q:今年大环境变化也比较大,有道对整个教育大模型赛道的速度和趋势有什么判断?

周枫:行业发展还是比较快的。从趋势角度讲的话,我们看到全科辅导还是很大的需求,用户教育需求从来都是多元的,所以需要把各个学科都做好,这个也是我们的现在一个特色。

后面的话应该说是C端、B端、G端都会有机会,比如HiEcho现在也在海淀这边的学校开始试点。同时在产品形态上也会涉及到APP、硬件等等。

从我们的尝试节奏也可以看到,端侧的大模型对教育很重要——端侧提供的离线服务有很多好处,比如响应速度更快,一些硬件做不了的事情也得以落地。

一定程度上,大模型会取代掉原有很多AI技术。

02

多模态:有道的新重点

Q:文生视频出现的时候,团队是什么感受?

周枫:应用空间变得更大,现在教学过程中间特别耗费人力的地方是课件制作,图表、视频,有了文生视频还是可以提效的。但它的局限性也比较大,用起来发现有很多要解决的问题。

Q:怎么理解局限性?

周枫:比如说我要讲一个数学题,要换个坐标轴展示一下等等,让它去生成视频现在根本生成不了。目前它更擅长生成叙事性的、讲故事类的内容。

对精确性、精准度要求高的内容还搞不定。目前它还是比较偏科的,跟最初文字大模型在数学方面的能力完全不行是一个逻辑。

外界普遍会关心现在的大模型还缺什么,是不是到顶了。从我们角度来看,还远远没有,还有太多问题没被解决了。

另外一个问题刚才讲到成本问题,还是太贵,多模态带来的是计算量方面非常本质的挑战,大家知道摩尔定律早就结束了,但这些东西哪里来、要怎么解决更大的计算量的问题,我们还是要相信人类的智慧。

段亦涛:文生视频现在的角色更像艺术家,不是工程师。

(网易有道首席科学家段亦涛)

Q:有道有没有研发文生视频的想法?

周枫:我们现在是基于整个规模的大框架下去尝试,基于自身条件去做的话还是可以做不少尝试。多模态是我们现在重点。

Q:多模态的尝试和思路上能否再解读下?

段亦涛:我认为多模态是AI的未来。

从技术端来看,现在先是基于语言模型涌现了很多能力,但这些能力还流于表面,很多事情还没有做透。即使有些模型已经做得很大了,但可能只是理解了一个词而已,还不足以对齐整个现实世界。

多模态语言模型和现实对齐的办法我们还没有很好地掌握。

比如视觉模态是客观信号,为什么是这样分割的物体,是因为光线在这里面有客观规律,导致这个东西他就是分开的,或者说导致这个地方就是高亮的,那个地方有光源,跟现实是紧密结合的……

现在的使用角度来讲还不够好,还有很大的空间。

周枫:算法上会有突破,应用上会有突破。

03

移动端真实的AI渗透率仅1%

周枫:总体我们是在用AI去推动我们各方面业务的发展,只是不同的业务它介入的程度和深度会有一些不同。

我们的课程业务、硬件业务也与AI的关系很深,另外还有个很重要的方向是AI作文批改。

2024年Q1比2023年Q4作文批改量上升了大约70%上下,每个季度都在快速上升。

Q:为什么在这个时候,AI作文实现了很大提升?

周枫:其实就是现在把AI作文跑通了。

我们这个AI批改的产品其实五年前就有,核心区别第一个是大模型能力进来之后能力的大幅度提升;然后是模型和人的分工找到了更好的比重和方法。

其实我们现在的AI作文批改是人和机器同时做,总体是机器为主。

最后还有商业模式,它作为课程的增值服务是希望用户用了这个功能之后,更喜欢这个课程,确实为提高续费率带来了帮助。

Q:能否再展开解读下“跑通”?

周枫:所谓跑通,必须解决供应问题、营销问题和经济模型问题。

Q:提到经济模型,今年的财报中首次提到AI订阅的概念,有道内部对它是怎样理解的?

张艺:AI订阅这个事算比较新的概念,大家去年老问一个问题AI怎么落地,我觉得AI订阅应该是AI落地非常直观的一个体现。

AI订阅的这几件事情,第一是教育,第二是营销,第三是效率,第四个是娱乐。效率换一句话就是生产力。

(网易有道智能应用事业部负责人张艺)

Q:AI订阅产品的渗透率如何?

但实际上,在真实的行业里,AI用户渗透是非常低的,大家觉得好像大家都在用AI,那可能是因为我们住在这个环境里面,真实的可能移动端真正用户AI渗透率只有1%。

未来半年或者未来一年渗透率有非常大的空间,这是必然趋势。

Q:在有道的AI订阅产品中,会先跑出一个SuperAPP么?

张艺:站在企业的角度,如果想要务实地判断,我觉得目前单纯靠AI赚钱的还不多。那么怎么通过AI赚钱、怎么通过AI找到健康的模式,并且为C端提供AI服务,从有道的角度来说,AI会员订阅应该是一种不错的模式。

现在已经有一些企业在这上面尝到甜头,我们也是比较早开始尝试的企业之一。

Q:小P会是有道的第一个SuperAPP么?

周枫:超级APP这个事情本身如何定义,现在还没有标准化,有人觉得要日活1000万、有人觉得要日活1亿,没有定论。

至少目前我们还是希望小P能够有越来越多人用起来。

Q:小P老师当用户达到一定量级之后,付费动作上如何考虑?

周枫:小P现在就有付费和免费的业务,基础业务基础工作都会是免费的。

但我们也认为AI订阅服务是AI大模型目前最好的商业模式,所以我们基本上都会有付费订阅的这种尝试。

Q:现在市面上也有不少AI助手出现,他们都在结合语音交互和AI能力提供免费的口语教练功能。但有道的虚拟人老师已经开始收费,它的差异化想如何建立?

张艺:首先大家从我们的迭代可以看到,在整个口语助教这个行业我们还是非常自信的,它现在还是在AI口语教练的第一梯队。

其次从C端来看,降价或者免费本身对于市场繁荣是一个非常好的事情。在这个过程中,我们的HiEcho也在做很多的创新和升级,比如最近和雅思的合作等等。

我们认为产品质量在提高的过程中本身就在给用户提供价值层面的创新和帮助。所以我们认为用AI去把这个产品的能力和服务做得更好才是有价值的。

Q:小P老师和Echo未来有没有融合的可能?

周枫:肯定是可以的。

我们目前对这两款产品的设计很像有道词典和有道翻译,用户对产品的第一印象其实就是这款产品的内核。

现在从定位来说,HiEcho是语言学习、英语学习,小P是全科学习助手。我们希望用户既能感受到共通之处,又能感受到定位的区别。

04

儿童也有了虚拟人口语教练

Q:有道已经推出了搭载大模型的词典笔,但目前可能依旧有一定量级的用户对大模型本身并不敏感,相对更在意价格和性价比。这一点有道是如何思考的?

吴迎晖:是的,市场上从去年开始出现了大量低价的词典笔产品,包括我们自己也推出了S6,它的销量也很不错。

我们观察发现,用户目前对词典笔本身的认知还是还是更倾向于第一场景,就是查词翻译的场景。

(网易有道高级副总裁吴迎晖)

X6Pro是我们推出的第一款搭载大模型的词典笔,从去年到现在数据也很好,这个好不仅反映在销量上,也反映在搭载的AI功能的渗透率和使用率也在变高。

这也印证了用户对搭载AI功能词典笔的接受度在变高。

价格战确实会影响大家对它的判断,这个趋势也很明显。但大模型的能力让学习硬件成为学习助手本身,它的机会和空间也一样极大。

我们今年会推出词典笔新品,它也会搭载更多的AI能力以及将AI能力更彻底地运用到关键场景里。

我们也会在前面提到的第一场景之外,拓展属于它的第二场景。

Q:前面提到了关于端侧大模型的落地,这对于有道的AI学习机有哪些影响和可能性?

吴迎晖:端侧模型上的机会是非常巨大的。

虽然目前我们的学习机产品、包括小P还是依赖于云端。但在更多的学生场景尤其是校园环境下,端侧将有更大的发挥空间。

而且,我可以提前预告一下,我们今年推出的新品将会在这方面有所突破。

Q:此次HiEcho面向低龄用户群体,有哪些特别的设计吗?

张艺:这次儿童模式的升级变化还是比较大的。

坦率说之前HiEcho的1.0、2.0版本更偏成人一些,真正到小孩手里太严肃了,聊的东西也比较难,体验过程少了些趣味性的东西,成人可能可以听20分钟,但如果不好玩的话孩子2分钟也待不住。

这次推出新的形象本身就下了功夫,技术方案和之前Echo技术方案不一样,虚拟形象本身也是小孩子的角色,也会有高兴、悲伤或者有手舞足蹈的动作,小朋友捕捉起来非常明显的。

在体验的过程中,孩子们会得到我们提供的适配选题,HiEcho则会作为旁观的老师,只在孩子寻求帮助时出现。

另外我们希望还原和鼓励小孩子日常聊天的场景,不像教科书里面这么标准英式美式发音,让孩子想到什么说什么就好。

我们会有很多迭代,预计6月中旬正式上线。

Q:对于低龄用户,在社交上会有一些专门设计么?

张艺:软件上面是有这样考虑的,大家会发现小朋友也有规模化效应,如果大家都用,比如这个班级老师都推荐孩子去练,就会产生整个班都在用的现象。

所以我觉得非常有机会在软件上面做规模化产品,我们也在尝试中。

Q:有道的听力宝在社交上的尝试也有很多。

吴迎晖:听力宝是让小孩以聊天的方式去互动交流。

这个过程中会遵循两个原则,第一个原则是家长比较期待的,通过社交来推动孩子的学习动力。所以我们基于社交做了比较多尝试,像学习营就是其中之一。

社交这件事情我们今年会在我们的某一款新品里面去做这方面的尝试,具体是哪个现在还不能说。

Q:有道内部怎么看今年硬件市场的发展?

很多企业都有好的想法,也想把自己的各种思考装到学习机里,探索是多元的。谁现在销量大或者小,都不是绝对性的。另外整个行业也在趋于理性,以前有不少厂商愿意花钱去冲销量,现在也少了很多。

不能形成用户口碑的产品,冲量都只能是暂时的,所以短期可以不要太在乎学习平板的销量。

我们还是更喜欢有道的词典笔产品,确实帮用户解决了一些问题,也帮助我们在用户端建立了信任。

05

线下业务:多团队、多模式同步探索

Q:Q1财报中提到线下课程业务已经进入多个城市,具体布局思路是怎样的?

周枫:线下目前是有多个团队在探索,我们其实是非常喜欢线上课程的,我们也喜欢线上形态。因为科技公司本身擅长的就是做数字化,数字化肯定在线上会更好做,所以我们肯定还是会以线上为主。

那么线下的部分,是我们去做探索的时候发现说有一些方面家长、学生对线下非常在意。就像小一点的孩子还是更适合面对面、人与人之间的直接接触;又或者是一些高年级的孩子在学习一些内容的时候,他们的家长也会对当地的机构更容易产生信任。

面对高年级的孩子,我们还会提供一种线上线下融合的方式,线上是我们一些核心的内容,线下是根据家长需求由老师给出的个性化的指导。

Q:目前在线下的探索节奏是怎样的?是自营还是合作?

周枫:门店现在是我们自己开为主。

节奏上,线下会比较慢一些,开店周期也会比较长,我们会耐心去尝试,逐渐应该会越来越多。

目前我们在郑州、南京都已经有线上线下融合的门店,也在做一些创新的模式,还在探索中。

THE END
1.2024年点读笔品牌排行榜前10名:帮助孩子轻松学习的智能工具口语训练功能,打造专业语言学习环境。内置AI口语教练,通过跟读和实时打分,能够有效提升学生的发音和口语表达能力。借助考试知识点精讲与AI语法讲解,学生可以根据自己的学习进度有针对性地进行语言训练,让口语技能得到快速的提高。与传统学习方法不同,这种互动式教学方式更加生动有趣,激发学生的学习兴趣。强大的辅助https://baijiahao.baidu.com/s?id=1818569997867967081&wfr=spider&for=pc
2.破壳AI口语AI教练免费版下载破壳AI口语AI教练是一款专为提升用户英语口语能力而设计的智能学习应用。它结合了先进的人工智能技术,通过模拟真实对话场景、个性化学习路径规划以及即时语音反馈,帮助用户突破口语学习瓶颈,实现流利交流。 【破壳AI口语AI教练简介】 破壳AI口语AI教练致力于为用户提供沉浸式、高效的英语学习体验。无论是初学者还是有一定https://m.xueba5.com/soft/283804.html
3.Vol.3深度拆解AI口语教练Speak!说OpenAI亲儿子AI含量不高,你受得这是一期付费节目,全网最硬核深度拆解AI产品的频道!这次聊聊OpenAI的亲儿子,AI口语教练Speak!3个月收入翻倍,OpenAI多次下注,AI口语教练Speak做对了什么? 【购买方式】: 1) 音频版:小宇宙《AI创投内参会》全集; 2)视频版:打包全集(可入微信群和我们互动~还可以参与直播录制,和视频/逐字文本等),请复制这个链接https://www.douban.com/podcast_episode/266388
4.视频虚拟口语教练来啦,AI帮你练习英语不仅能像老师一样因材施教,展开对话,也能针对练习者的发音给出定制化的建议和润色。 头图为网易展台的AI虚拟人口语教练 劳动报颜筱依 摄影 摄影:颜筱依 摄像:颜筱依 视觉编辑:颜筱依 责任编辑:叶赟 劳动观察新闻,未经授权不得转载https://www.51ldb.com/shsldb/cj/content/018935afe96cc0010000df844d7e124a.htm
5.口语教练口袋AI英语私教口语教练-口袋AI英语私教Quizás te interese 视频口语大师 Productividad Productividad 小鱼AI写作 Productividad ClipMemo - Memo for Any Media Talkie Productividad AI翻译-沈水模型 AR拍照翻译学英语AI练口语语音翻译软件 Productividad 小白试卷宝-真题试卷&错题整理 https://apps.apple.com/cr/app/%E5%8F%A3%E8%AF%AD%E6%95%99%E7%BB%83-%E5%8F%A3%E8%A2%8Bai%E8%8B%B1%E8%AF%AD%E7%A7%81%E6%95%99/id6471080709?see-all=customers-also-bought-apps
6.AI大模型还有多少惊喜?未来,你的口语教练可能是位虚拟人未来,你的口语教练可能是位虚拟人 极目新闻消息,11月23日至11月27日举办的第二届全球数字贸易博览会上,阿里巴巴的“通义家族”、腾讯的混元大模型、百度的文心一言、网易的教育大模型“子曰”等全球50多个大模型集中亮相,吸引参展观众现场沉浸式体验AI带来的乐趣。https://www.cqcb.com/shuzijingji/2023-11-27/5434670.html
7.HiEcho网易有道出品的人工智能口语教练官网入口及介绍Hi Echo是网易有道出品的虚拟人工智能口语教练,搭载子曰教育大模型的全球首个虚拟人口语教练。 它是一款一对一的口语教练,具备全天候多平台的陪伴能力,为用户提供随时随地高质量的口语练习,帮助用户彻底告别哑巴英语。 Hi Echo有一下功能: 口语练习:Hi Echo能为用户提供高质量的口语练习,其发音地道,口型自然,重音、https://www.aieva.cn/sites/1374.html
8.WAIC2023AI+教育,网易有道虚拟人口语教练首次现身AIGC正在重塑教育,网易有道作为国内领先的教育科技企业,率先自研教育领域垂直大模型,且以场景为先,以有道词典笔、有道翻译等爆款产品作为依托,已跑通大模型落地应用全链路。在第六届世界人工智能大会上,网易有道首个教育领域自研大模型“子曰”全新应用成果虚拟人口语教练首次亮相。 https://m.thepaper.cn/newsDetail_forward_23729533
9.网易有道虚拟人口语教练口语练习:虚拟人口语教练能够像老师一样循循善诱,有步骤地引导、启发式学习陪伴,同时还能进行实时反馈。 对话报告生成:在生成对话报告中,AI老师会从发音、语法等维度给予建议和润色,有效解决长期困扰英语口语学习者无话可说、不知从何说起、害怕说错等问题。 https://www.aihub.cn/tools/study/oral-mentor/
10.破壳AI口语流利英语 脱口而出 破壳AI口语是一款AI英语口语教练程序。我们通过人工智能技术,为每个用户构建个性化的AI口语教练,您可以与AI教练谈论任何感兴趣的话题,并获得专业的口语指导。 联系我们 企业客服 support@poclas.com(客服邮箱) 关于破壳 用户协议 隐私协议https://www.poclas.com/
11.破壳AI口语app下载破壳AI口语正式版下载v2.1.2破壳AI口语是一款专业的AI英语口语培训软件。在这里你可以选择你的专属AI教练进行英语口语训练。 破壳AI口语提供多样化的情景对话内容供大家在线练习,包括日常交流、职场沟通等,破壳AI口语还支持自定义创建个性化会话练习,帮助用户纠正不正确的发音,轻松提高你的英语水平。快来下载吧! 破壳AI口语APP怎么使用 1.在本站http://www.1666.com/sjrj/v720232.html
12.TalkOnAIOralEnglishCoach官网AIAI口语教练:使用尖端AI技术提供个性化反馈和指导,帮助学习者识别在发音、流利度、词汇和语法方面的优势和改进区域。AI教练能够适应每个用户的熟练程度,确保学习者在进步过程中获得适当的挑战和支持。 无压力实时聊天:TalkOn能够创造一个无压力的实时聊天环境,让学习者能够在真实场景中练习英语口语,而不必担心语言学习过程https://www.msbd123.com/sites/36947.html
13.网易有道发布国内首个教育大模型“子曰”周枫称大模型将对教育产生颠覆7月26日,网易有道(NYSE: DAO)正式推出国内首个教育领域垂直大模型“子曰”,并发布了基于“子曰”大模型研发的六大创新应用——“LLM翻译”“虚拟人口语教练”“AI作文指导”“语法精讲”“AI Box”以及“文档问答”。 “一个好的技术有没有价值、能不能发挥巨大的作用,很多时候关键在场景和应用的选择以及细节的https://finance.eastmoney.com/a/202307272794777716.html
14.高效提升口语,AI陪练的秘密武器!雅思备考:小程序中收录了最新的雅思口语题库,实时更新,让你的练习更加有的放矢。针对Part1、Part2、Part3的不同话题,AI教练会提供详细的指导,让你在模拟对话中体验真实的考场环境。 想象一下,在校园生活中,你遇到了外国同学邀请你参加一个聚会。在AI陪练小程序中,你可以提前练习相关的对话,比如询问聚会的时间地点https://m.sohu.com/a/811962095_121814834
15.学为贵AI口语陪练助你提升口语实力!对于很多人来说开口即“哑”缺乏语言输出的思路时,软件对于没有思路或不知道如何组织语言的学员,AI口语教练可以根据话题智能给出对话回复提示,帮助学员克服开口难题,如果学员头脑中有思路但碍于表达,AI口语教练还提供中译英功能,帮助学员及时锁定思路并说出流利英语。 https://m.tantuw.com/sh/Schoolnews/3264_785540
16.快来网易有道查收你的虚拟人口语私教Echo!优设网「Hi Echo」是「网易有道」推出的国内首个搭载了教育大模型「子曰」的 AI 虚拟人口语教练App。用户通过与Echo视频聊天的形式,可随时随地练习口语。Echo表情生动,口型自然,如真人一般,不仅有高效的语意理解能力和表达能力,会对用户的对话给出快速反馈;还十分善解人意,https://www.uisdc.com/hunter/0221543015.html
17.AIEnglish100(口语100)智能学习空间清睿智能,清睿智能官网,清睿教育,清睿教育官网,苏州清睿智能科技股份有限公司,智能听说作业平台,听说作业,智能口语教练,Aryn,一对一口语训练,是一个跨平台,包括互联网,手机,平板电脑的听说作业平台,是十二五国家课题支持项目,网络学习空间,http://www.kouyu100.com/