思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.降智慧選擇:早了解早安心,分享與生活態度降节目脱口秀访谈健康智慧選擇:早了解早安心,分享與生活態度2024-12-09 17:14:49 朗威谈星座 辽宁 举报 0 分享至 0:00 / 0:00 速度 洗脑循环 Error: Hls is not supported. 视频加载失败 朗威谈星座 1.6万粉丝 分享星座 03:40 天秤座12.1-12.10:关系已经彻底没有结果了,断舍离 02:44 苹果15对比苹果16的使用https://www.163.com/v/video/VAI25T5F9.html
2.胡来人生被贩卖的人生,要如何救赎?2024-11-20 先成家还是先挣钱?金钱和婚姻谁该放在第一位 31:20 2988 2024-11-13 职场恋爱未成,如何拓展社交圈,找到理想另一半? 29:38 2912 2024-11-6 抱养来的孩子把抱养人的父母杀了,是农夫与蛇,还是走火入魔 24:48 3576 2024-10-30 世界上最奇葩的心理疾病,连名字也奇奇怪怪 https://m-pre.qingting.fm/vchannels/416566/programs/24086233/
3.海内同心天涯若邻——留学生疫情心理降疏导所以,为了在这段充满不确定性的时间里给予留学生心理支持,让他们对生活建立更强的掌控感,在北京时间5 月 22 日(星期五)上午9:00,我们邀请留美心理咨询师张临风老师,为广大留学生带来一场线上公益直播课。 直播内容: 1、分享心理疏导技巧 以助留学生在疫情期间缓解自己和亲友的焦虑等常见负面情绪 https://m.qlchat.com/wechat/page/topic-intro?topicId=2000010028515545
4.直播预告理解疫情对幼儿及青少年产生的来自循证心理曼朗直播预告 | 理解疫情对幼儿及青少年产生的影响讲座时间: 5月23日(周二)上午11:00-12:00 讲座内容:从发展角度看孩子在青春期的生理和心理变化识别儿童和青少年发出的预警信号 支持并帮助他们 ?线上https://weibo.com/7646663221/N1aAHsl2C
5.曼朗心理咨询电话,地址,价格,营业时间(图)上海生活服务今天体验下了脆皮打工人心理讲座,老师讲得非常好,环境也好,很喜欢!以后也希望能参加更多这类的活动! dotSource: lawyer_psychology_categoryId: 来曼朗参加实习生见习计划咯!非常温暖有趣的一次经历() 参加疑难病例讨论分析会是我印象最深刻的 可以和业界大佬们一起听一些https://www.dianping.com/shop/l1m2fkwOtMU4mbWb
6.曼朗app安卓正式版下载安装曼朗app是一款功能使用性十分不错心理健康咨询服务软件,这款软件专为对心理健康有需求的用户提供的心理服务神器,为医生提供在线问诊渠道,医生可以为患者解决心理问题,建立患者档案,帮助患者们拥有健康的心理状态。app上拥有非常多专业的心理医生能够帮助用户有效的了解心理问题,能够从根本出发有效的缓解病人的不健康心理问题http://www.dianwannan.com/app/1000000211249/
7.曼朗医疗上海旗舰门诊中心开业,多学科团队打造国际化心理诊疗体系门诊中心位于上海静安寺CBD晶品大厦,建筑面积1100余平方米,提供近30间针对个人、家庭、团体等不同来访者的诊疗室,浅色调的装潢营造出柔和舒缓的氛围,令来访者在安全、舒适、放松的诊疗环境中体验到专业的团队服务,以及安心的个人隐私保护。 △上海曼朗心理静安门诊中心在喧嚣都市中提供一个温暖、治愈的心灵港湾。 https://www.luye.com/info.php?id=394
8.连线CEO曼朗医疗唐德凯:我们为什么要引入可循证的精神心理诊疗目前,曼朗医疗完成了在国内的4个城市布局,上海的门诊中心刚刚于2021年11月拿到医疗机构执业许可证,西安的医院在12月拿到许可,但由于西安受到疫情影响,在春节后正式投入运营。 在写稿期间,记者在朋友圈看到唐德凯搭乘2月9日晚11点的飞机赶往西安,参加第二天西安高新曼朗心理医院的开业仪式。结束后,他又在当天飞回上海https://m.cls.cn/detail/937774
9.36氪首发提供基于循证的药物及心理治疗体系,「曼朗医疗」获数36氪获悉,专注于精神心理综合诊疗和循证心理治疗服务的曼朗医疗已完成数千万元Pre-A轮战略融资和独立分拆,投资方为北极光创投。 曼朗医疗于2020年正式布局国内,依托绿叶医疗集团在澳洲的18家精神专科机构成熟的临床服务产品和运营体系,在澳洲机构的临床、心理和管理等专家持续支持下,结合国内知名精神专科机构战略合作和专https://36kr.com/p/1575121540222852
10.坚定布局精神心理降领域,绿叶医疗集团旗下曼朗医疗完成首起并购2020年3月30日-绿叶医疗集团旗下精神心理健康服务品牌——Mindfront Health(曼朗医疗)宣布,已完成对私立心理医疗机构——广东心邻医生集团的并购,由此正式开启在中国精神心理健康市场的布局。曼朗医疗将利用在精神健康领域的国际资源优势,为中国患者提供国际水准的价值导向医疗服务。 https://static.nfapp.southcn.com/content/202003/30/c3337914.html
11.西安市第三医院精神心理科网上预约挂号专家门诊心理咨询 (1位) 心身疾病 (1位) 发作性睡病 (1位) 睡眠障碍 (1位) 科普·直播义诊专区 查看全部 精选 “听说你失眠了?” | 入睡困难、早醒、睡眠维持障碍也是一种病 原创 曼朗 曼朗mindfront最近睡得好吗?是不是还在所有睡不醒起不来的日子里都自我约定早睡,却总是一到夜晚就无比清醒?世卫组织数据https://m.haodf.com/hospital/5031828601/keshi/6971920370.html
12.曼朗医疗获北极光PreA投资,全球领先精神心理品牌加速中国布局精神心理健康服务领域的佼佼者曼朗医疗近日宣布,得到了北极光创投的Pre-A轮投资支持,这不仅标志着该公司在国内的发展步入了快车道,也为其未来拓展提供了坚实的资金后盾。此次融资后,曼朗医疗还将进行独立分拆,以更加灵活的姿态应对市场变化,抓住行业发展机遇。 https://www.yoojia.com/ask/17-13790217210976385537.html
13.「上海曼朗医疗工资待遇怎么样」曼朗(上海)医疗管理有限公司薪酬说明:上海曼朗医疗员工工资待遇数据取自该企业近一年在各网站发布的公开薪酬,仅供参考。关注曼朗医疗的人还关注了 更多 西安高新区曼朗心理医院有限公司 医院 互联网医疗 医疗服务 心理健康 PK 职位(1) 工资(¥7.0K) 浏览(393次) 100-499人 百汇(上海)医院管理有限公司 医院 心理咨询 眼科 PK 工资https://m.jobui.com/company/16906163/salary/shanghai/