(报告出品方/作者:华泰证券,段联、郑裕佳)
国内教育垂直大模型陆续发布,初测效果尚可
有道:「子曰」教育大模型亮相,场景应用效果良好
7月26日,有道在北京举办了“POWEREDBY子曰”教育大模型应用成果发布会。据发布会,公司认为大模型在教育领域中最大的机会将是助力因材施教:(1)大模型具有强大的语言理解和生成能力,可以提供个性化分析与指导;(2)大模型基于人类反馈塑造性格和语言习惯,能够循循善诱为学生讲解,提供引导式的学习体验;(3)大模型在对全学科知识进行整合后,可以灵活为用户提供全科和跨学科知识的支持。
有道发展大模型的思路:应用驱动、依托场景、扬长避短
「子曰」大模型在中英文基础对话、数理逻辑推算等方面表现良好
开放式问题的回答逻辑清晰,中翻英较为地道。当回答“踢足球有哪些好处”时,子曰大模型可以迅速条理清晰地列出八点优势,并能够准确将其翻译为英语。
在进行数学和物理能力测试时,大模型并不是直接给出答案,而是将公式先列出来,在对文本进行数据提取后将数据带入公式中得出正确的答案。并且,大模型能够理解和支持多轮对话,在数学题中用“一个足球”提问后,在随后的物理题中用“这个球”进行指代,模型可以理解指的是同一个小球。
有道:“场景为先”,推出六大产品化应用成果
在此次发布会上,有道展示了子曰教育大模型六个产品化的应用:LLM翻译、AI作文指导、语法精讲、虚拟人口语教练、AIBox、文档问答。
LLM翻译:更符合中国人语言逻辑的翻译引擎
有道15年来不断升级翻译技术模型以满足用户多元化的需求。2008年,有道首先推出国内第一个商用机器翻译引擎,经过15年技术迭代,有道逐渐从统计翻译发展到神经网络翻译,并一步步升级到Transformer模型,翻译质量越来越高,翻译的应用形态越来越丰富,越来越受到用户的欢迎。公司介绍,有道词典月活用户已超过1亿,是国内词典翻译市场的第一名。随着用户对翻译的上下文理解、文体、语气等方面提出了更丰富的要求,有道推出大语言模型(LLM)翻译,为用户提供更加场景化、高质量的机器翻译技术,公司预计今年Q3上线。
文档问答:文档阅读助手,万字长文10秒get
AI作文指导:精准定位写作痛点,提供审题和批改两大功能
英语语法精讲:私人英语习题家教,AI老师讲解长句难题
语法精讲功能可以像老师一样,一步一步带领学生抽丝剥茧般分析句子里面的语法结构,还能推荐同类型的考题,帮助学生触类旁通,真正理解考纲中的考点。在长难句分析中,语法精讲会首先概括句子的核心意思,让学生对整句话有掌握,然后抽离出句子的主干成分,然后按照逻辑分析从句,每一步讲解完都会有暂停,方便学生理解和消化。语法精讲功能还支持单选题扫描。与传统的答疑产品不同,语法精讲功能不会直接给学生提供答案,而是会首先识别考点,然后拆解分析句子结构、上下文语义,这样将解答的思路分步提供,让学生在面对难题的时候依然能够保持独立思考。
AI口语教练:用地道发音和真实对话语境让用户享受一对一口语私教
AI口语教练主要针对中国人缺乏语言环境的问题,通过打造真正贴合实际的“语境”,帮助中国人更好地练习英语口语。与传统的口语联系产品不同,AI口语教练具备类真人、发音地道、能还原真实对话语境、循循善诱、提供实时报告等特点,让用户享受到类似一对一口语私教的体验。实现AI口语教练的四个核心创新技术:1)对话大模型:利用子曰大模型,实现有感情、能推理、能互动的沟通。例如,发布会现场AI口语教练与演讲人进行了多轮随机对话,从比较抽象的“人生目标一个亿”谈论到生活化的“成都旅游”“最喜欢的作家刘慈欣”等话题,AI口语教练会主动引导话题,让交流变得生动有趣,保持交流持续进行下去。2)虚拟人驱动:虚拟人具有真实的情感表达和实时沟通,在口语的升降调、语音的重度、弱读以及口型的变化等方面表现俱佳。3)语音识别以及语音合成能力:语音识别以及语音合成能力得益于网易打造了一个非常强大的自研技术,可以实现回音消除、自动语音检测、自动短句等技术,带给用户更好的体验。4)口语评测:在每次结束对话后,AI都会对文本进行全维度测评,细化至音素级的发音纠正以及文本批改润色,在口语和内容两方面提供改进意见。
AIBox:高效便捷的中英文写作“神器”
搭载「子曰」教育大模型应用的智能硬件新品将于八月起上市
据发布会,以上六项「子曰」教育大模型应用中,除文档问答和AIbox功能已上线有道翻译外,公司预计有道LLM翻译将于今年第三季度上线;AI口语教练功能将上线多种软硬件产品,包括8月发布的词典笔、听力宝新品;语法精讲功能将在8月上线至有道词典笔新品;AI作文指导功能将在8月上线至有道AI学习机新品。
好未来:MathGPT开放公测,支持小、初、高数学解题及讲题
好未来自研的数学大模型MathGPT已开放公测。该模型以数学领域的解题和讲题算法为核心,致力于弥补和攻克大语言模型在数学解题方面的三个问题:正确率、解题步骤的清晰稳定性、讲解的趣味性和个性化。相比于只能输入文字的通用大模型,MathGPT增加了公式编辑器和图片上传功能,输入体验上更加友好便捷;并且,MathGPT的回答包括知识点分析和解答两部分,并非直接给出计算结果。
教育垂类大模型VS通用大模型:虽有差距,亦有优势
中英翻译:「子曰」表达更符合中文习惯,但知识性认知方面稍有不足
AI口语对话:「子曰」在仿真性、话题灵活度、反馈详细度等方面表现优秀
讯飞星火大模型支持多轮AI口语对话,但并未应用虚拟人形象;有道的AI口语教练具有真人的形象,在对话中也会模拟真人的神态和口型,给人身临其境的感觉。Duolingo(成立于美国的线上语言学习平台)的Roleplay对话功能与子曰大模型的AI口语教练相似,但对话相对局限于某些特定的话题,相比之下,有道AI口语教练可以自由畅聊任何话题,灵活性更佳。并且,Duolingo每次对话结束后的反馈仅有简短的几句话,而有道的AI口语教练会从语法、发音等多维度生成评价报告,更为详尽。
写作指导:「子曰」大模型功能更丰富
讯飞星火大模型也被应用于学习机的“作文批改”功能上,但有道除批改外还提供主题立意讲解、素材参考等功能,可以在写作前、写作后较为全面地帮助学生提升。
文本生成:「子曰」大模型指令操作更灵活便捷
数学能力:MathGPT在小学阶段正确率超过通用大模型;整体仍待突破
目前通用大模型在文字创作和语义理解上已有较好表现,但在数理逻辑方面仍有较大进步空间。我们分别选取一套小学、初中、高中试题,对MathGPT和通用大模型进行测试对比。我们的测试结果显示,在小学阶段,MathGPT的正确率显著高于通用大模型,达到约86%。我们认为这与好未来(TALUS)在小学数学领域多年的教研教学积累密不可分。在初中和高中阶段,随着题目难度的快速提升,参与测试的大模型的正确率均出现明显下滑。我们认为整体来看,现有大模型的数学能力仍需进一步突破。
未来展望:以Duolingo为例,大模型有望赋能现有业务增长
23年3月,Duolingo宣布推出整合了GPT-4大语言模型的DuolingoMAX服务,在Super订阅服务基础上提供ExplainMyAnswer和Roleplay两项新功能,每月收费30美元:1、ExplainMyAnswer功能:语言学习者在练习后,若对答案感到疑惑,可以进入与Duo机器人的聊天界面,要求Duo机器人进行举例解释或进一步澄清。2、Roleplay功能:允许学习者通过与虚拟角色进行对话来获得经验值,虚拟角色会引导学习者完成不同场景和话题的对话,例如“与Lin的未来度假计划”“在巴黎的咖啡馆订购咖啡”“与Eddy一起去购买家具”等,并在完成对话后生成反馈和改进建议。
虽然目前DuolingoMAX服务面向的用户有限(仅限iOS平台,主要面向学习西班牙语和法语的英语用户,且仅在美国、英国、爱尔兰、加拿大、澳大利亚、新西兰等国家开放),但仍对公司财报产生了积极影响。据Duolingo财报,作为接入GPT-4后的第一个季度,23Q2其DAU同比增长了62%,MAU同比增长了50%,付费用户数同比增长了59%;总收入同比增长44%达到约1.27亿美元,总订阅收款同比增长41%达到约1.38亿美元,净利润约370万美元,同比扭亏为盈。随着DuolingoMax的预订人数和营收加入财报,Duolingo上调其23全年指引,预计总订阅收款将同比增长33%-34%至5.69亿-5.75亿美元(vs前次指引:同比增长29%-31%至5.52亿-5.61亿美元),总收入将同比增长38%-40%至5.10亿-5.16亿美元(vs前次指引:同比增长35%-38%至5亿-5.09亿美元),调整后EBITDA利润率有望达14%-15%(vs前次指引:11%-12%)。