思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.医联:又在严肃医疗路上前进一公里治疗规划等的潜力挖掘;②对儿童溃疡性结肠炎、儿童过敏性紫癜等具体病种的深入研究,提高诊疗专业性;③完善“医联AI医疗应用平台”院端解决方案,开始在商业端案例一:分析的首个患儿是一名8岁女童,问诊时发烧至39度,伴有关节疼痛等。 蔡栩栩医生点评:通过审查AI医生创建病情小结,以及给出详细的用药建议,初步判断用药https://health.ifeng.com/c/8fDtq81Xjgy
2.医联:又在严肃医疗路上前进一公里互联网治疗规划等的潜力挖掘;②对儿童溃疡性结肠炎、儿童过敏性紫癜等具体病种的深入研究,提高诊疗专业性;③完善“医联AI医疗应用平台”院端解决方案,开始在商业端案例一:分析的首个患儿是一名8岁女童,问诊时发烧至39度,伴有关节疼痛等。 蔡栩栩医生点评:通过审查AI医生创建病情小结,以及给出详细的用药建议,初步判断用药https://news.iresearch.cn/yx/2024/12/514524.shtml
3.爱问医联人脉圈怎么样发现86+脉友平台定位爱问医联科技(深圳)有限公司是新浪微博平台上的医疗及健康养生领域的官方运营商,致力于执业医师的品牌建立与医患关系的建立。旗下爱问医生平台服务于巨大的患者与潜在患者用户人群。 爱问医生平台在新浪微博上运营并管理着执业医生资质认证,健康排行榜,健康话题排行榜,健康热门微博排行榜,健康类话题等等新浪微博医疗https://maimai.cn/mai/NVHerd3hgZJQsMt5lucoeOYZuxz28J3gsmsvWmPyWPU
4.智能分析快速诊疗AI“把脉”VS老中医问诊哪家强?12月12日上10时,记者来到杭州市拱墅区东方茂商业中心,体验“黑科技”——AI把脉问诊。 “把右手放进去保持不动就好。”八脉科技有限公司创始人金建新引导记者体验“俏郎中”,桌上一个如巴掌般大小的仪器就是他和团队研发的智能中医体检仪。电商平台显示这套设备售价2980元。 https://zjnews.zjol.com.cn/zjnews/202412/t20241213_30706644.shtml
5.大数据时代下的人工智能医疗智慧医疗提高算法可信度的方法对于用户的信息安全,现在普通的医学研究做法是进行隐私数据脱敏,把敏感信息隐藏掉,然后把数据进行发布,但是这样有非常大的风险,因为虽然不知道用户的名字,但是可能知道用户的性别及一些其他特性,通过这些特性,其实有很大概率能够反映出来这个人是谁,所以很多问诊平台将用户的治愈案例公布吸引其他患者进行咨询问诊,某种程度上https://blog.csdn.net/wangzi11322/article/details/107844192
6.现代男科降探索,在线平台eknanke.com的角色与贡献解析eknanke.com平台概述 eknanke.com是一个专注于男科健康的在线平台,集健康咨询、疾病预防、疾病科普、在线问诊等功能于一体,平台汇聚了众多专业男科医生和医疗专家,为男性用户提供全方位的健康服务,eknanke.com还致力于普及男科健康知识,提高男性对自身健康的认知与关注度。 http://www.hljbdh.net/post/6596.html
7.创新创业项目选择思路9篇(全文)相比之下:你能说出5个知名化妆品品牌吗? 5个餐饮品牌呢?10个呢?几乎没什么难度。这就是互联网医疗需求的低频带来的心智认知的难度,导致互联网医疗平台很难成为大众就医的一个默认选项,让用户推广和留存更加困难。因此低频需求是互联网医疗之所以没有能够成功构建商业模式(至少是2C模式)的最重要原因。https://www.99xueshu.com/w/fileybbeeo3l.html
8.远程联网(精选十篇)在物联网应用必须是由三种商业模式的结合:物联网公共服务模式、物联网提升服务模式、行业需求模式形成有机的产业链。江西群星软件系统有限公司在提升服务进行近8年产业化的实践与探讨, 成功开发物联网平台与云块定制研究与应用, 将公共服务与行业需求相结合构成真正的物联网系统。 https://www.360wenmi.com/f/cnkeyhrahtwd.html
9.2018级降管理专业人才培养方案具备初步的健康管理技术的研究与开发能力。 具备进行健康管理技术应用的成效评估等能力。 具有一定的英语应用能力和计算机应用能力,以适应现代化办公的需要。 具有较强人际沟通、组织协调和开发拓展创新能力。 具有较强的语言逻辑性,优秀的决策力、解决复杂问题的能力以及良好的客户沟通能力和团队协作能力。 (三)素质结构https://jwc.wfhlxy.com/info/1023/1356.htm
10.互联网背景下,线上问诊认知状况及患者咨询意愿调查问卷您好!我们正在进行一项关于“线上问诊认知状况及患者咨询意愿”的研究,旨在深入理解您对线上问诊的看法、偏好以及需求,以促进医疗服务的优化与创新。您的参与和意见将为我们的研究提供宝贵的数据支持,帮助我们更好地了解公众对于这一新兴服务模式的认知和期望。 https://www.wjx.cn/xz/287745642.aspx
11.每日热点1127卢江书记指出,此次岗位调整,是中心党委根据工作需要,经过充分研究,集体作出的决定,并报请局党组审批同意。在充分肯定以往工作成绩的同时,卢江书记代表中心党委对两处室提出了新的要求和希望。一是要提高政治站位、强化政治理论学习,坚定不移用习近平新时代中国特色社会主义思想武装头脑、指导实践。二是要深入学习https://www.sccdc.cn/Article/View?id=32527
12.小荷降app下载小荷降免费问诊全部平台 历史版本 标签:医疗 介绍 小荷健康,一般又称小荷app,小荷在线问诊,小荷健康问诊,小荷健康免费问诊,小荷医典app,小荷健康医生线上问诊。 真实经验,安心借鉴!了解真实治疗经历,让医学科普有价值更有温度!-【治疗经验分享】覆盖数千种疾病内容,累计1亿字的用户真实治疗经验和感受;你想了解的,这里都有!-【快https://m.liqucn.com/rj/124154.wml
13.2024最全美国看心理医生攻略(预约方式+流程+费用+保险+常见问题2024年15个国内外在线医生咨询和问诊平台推荐(服务时间+收费) 2024最全美国看眼科指南(眼科医生分类+预约眼科医生+视力及眼底检查+费用+常用英语) 2024最全美国整牙攻略 - 美国矫正牙齿流程、牙套种类、费用等大揭秘! 2024最全美国牙医保险购买指南(牙科保险比较及推荐+保费+报销)- 留学生洗牙拔牙补牙等都能省!https://www.extrabux.cn/chs/guide/7722584
14.在线问诊小程序预约挂号江浙沪杭州成熟系统一、预约挂号:在线问诊小程序制作,可以显示附近的,点击自己要选择的,选择要预约的科室,然后选择自己要预约的医生,即可进行在线预约。用户通过小程序可以在线查看相关的服务内容,提供在线预约的功能,让用户可以透明化地了解服务的价位信息, 二、在线咨询:同时提供线上沟通平台。用户根据自己的问题,选择不同的门诊,然后跟https://m.11467.com/blog/d9482051.htm