ChatGPT火了之后,我就一直在等基于它开发的语言教育应用。你想啊,问答已经解决了,文本转音频、音频转文本都有成熟的模型,这事儿不就水到渠成了?
前些日子我给你推荐过一款应用OpenCat,它已经往前进了一步,可以集成微软TTS引擎,用自然语音来念出回答的文本。
但彼时你还得自己输入文本,这依然只是文字输入,文本+语音输出。你要说这种交流对听力有帮助吧……也算,但是不大。
所以,当我看见CallAnnie这款AI应用的时候,不禁眼前一亮。
AppStore提供这款应用的下载。
Annie可以跟你直接语音交互。她可以在发音的过程中,能根据发言调整自己的表情和动作,让你感觉仿佛在和真人对话。
对话过程里,你可以进行录像。我把和Annie的交谈,录制了一段视频,你可以先看看。
仅从这段对话来说,交流并不太顺畅。一上来让她帮我查询天气,她告诉我没有联网功能,查不了。然后就是聊聊经历、兴趣爱好之类。你已经看到,我好几次都显得非常粗鲁,打断了Annie的讲话。其实在日常生活中对话,我并没有那么不礼貌。问题出在哪儿呢?
首先是软件设定。为了让天儿不被「聊死」,Annie是会主动询问你问题的。而且问题问得非常详细。几乎每一次回答以后,都要进行反问或追问。但这会带来问题,有时我并不想转移话题,还想顺着原先的路径继续聊,于是不得不打断她的发言。
目前的交流形式,还有很大的改进余地。但是,比起从前那些得照着台词儿来念的「AI语音纠正」应用,Annie已经有了很大的进步。
我把这一则视频发布,很多小伙伴欢欣雀跃。不过有人很焦虑,说:
口语教师要失业了。
我觉得多虑了。通过刚才的视频,你可以看到Annie缺乏实时交互特征,延迟不小。以目前的视频,我们一眼就能看出这是AI而不是真人。它对于我们的表情动作,尤其是情绪,实际上没有什么感知能力。这些因素决定了,对话体验与真人相比,还是有差距的。
所以目前为止,口语教师们还是可以把心放在肚子里的。
和口语教练差距这么大,这款应用是不是对普通学习者没有意义?当然不是。我们学习外语,一个很重要的提升途径就是获得反馈。你开口跟外国人说话的时候,很多时候也是在担心自己的发音和表述方式,是否能被听懂和理解。如果AI都能听懂你说的是啥,那些nativespeaker自然就更没有问题了。
这种自信,对于外语学习来说真的很重要。只不过很多人经历过这一阶段,就把这事儿彻底忘记了。
CallAnnie里面,还能专门设置她的角色和功能。你看这里我设定的,是「教育」分类之下的「英语对话」。
你也不妨尝试设定Annie为其他角色和功能,体验对话内容和风格的差异。
ChatGPT的出现让很多人兴奋。但是现在有的人已经感受到了「ChatGPT倦怠」。他们觉得AI进展太慢了,提不起兴致。如果看单一维度的话,大语言模型的最前沿进展速度确实不能做到一直保持超高速狂飙。但这不是很正常吗?指望把100年的科技树,在一年点完,是不是太贪心呢?
关键是,开发者能不能使用已经出现的技术进展,做出让人惊艳的应用?我觉得CallAnnie可以算一个。之前已经有人做了类似的对话机器人,技术上并没有什么差距,但是主要是为了拿来玩儿的,没有解决大规模人群的「刚需」。而CallAnnie则不同,至少它客观上推进了英语口语练习的AI应用发展,让有趣有用的工具快速触达大众。
在你熟悉的细分领域里,有没有类似的需求亟待解决?如果有的话,建议你思考一下,怎么把「如今已觉不新鲜」的ChatGPT模型与其他技术、专业知识结合,切实解决痛点。
技术的进展依然重要。我也希望能够早日看到多模态在CallAnnie这类对话应用中使用,让机器人随时了解我们的情绪表情、肢体动作。另外如果交互延迟也能缩短的话,我们就可以跟一个随时读懂我们的机器人直接无障碍沟通了。到那个时候,AI不但可以成为更合格的英文教练(或者陪练),许多日常助理工作也可以靠着AI应用来高效完成了。
你有没有发现更好用的应用可以帮自己练口语?欢迎留言,咱们一起交流讨论。