思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.“好看皮囊”与“有趣灵魂”何以整合带着这些疑问,本文对虚拟数字人的情感互动模式和形成过程进行描绘探究。考虑到此类虚拟数字人在内容生产运营模式下中之人和虚拟形象组合运营的特殊性,探究虚拟数字人的情感互动路径,可以在以往虚拟数字人研究基础上丰富情感互动的视角,剖析其情感互动模式与情感互动过程,对虚拟主播类的虚拟数字人运作,特别是与粉丝之间https://baijiahao.baidu.com/s?id=1818558335496119516&wfr=spider&for=pc
2.AI数字人智能交互,激活展厅展馆景区博物馆数字化升级无限潜能世优科技虚拟人 北京 0 打开网易新闻 体验效果更佳为了帮兄弟完成梦想,找人假扮女朋友 南瓜观影 1433跟贴 打开APP 茅台酒降价在所难免,价格只会越来越低! 北京作家编剧肥猪满圈 488跟贴 打开APP 悲哀!7岁男孩走失,八年后被父母找到,认亲现场母亲却不想要了 侦探大狗故事汇 68跟贴 打开APP 中国076型两栖攻击https://m.163.com/v/video/VFIOVN8IN.html
3.2024文化和科技融合生态汇干货放送!探索有效机制发展新型业态围绕文化和科技融合趋势、文化大数据、文化人工智能、遗产数字化、文博新体验、沉浸式文旅、VR大空间、投融资、人才培养、国家文化和科技融合示范基地发展等主题开展多场研讨活动,现场发布了《中国文化和科技融合发展战略研究报告》、2024文化和旅游领域科技创新应用教学案例、2024文化和科技融合优秀产品、“灵境·系列优秀https://www.shangyexinzhi.com/article/22895500.html
4.元宇宙周刊丨华为首个虚拟数字人“云笙”正式入职;腾讯已申请近百是一个有着各种各样的艺术作品、角色扮演的虚拟活动空间,有超过200个独立的房间可供游玩。Rec Room 还推出了新的功能“Rec Rally”VR 卡丁车游戏,让玩家在 6 人在线比赛中与朋友或陌生人一较高下,吸引了更多用户的加入。 同时,截止今年 9 月份,腾讯已申请注册了近百条元宇宙相关商标,如“王者元宇宙”“天美https://www.niaogebiji.com/article-89087-1.html
5.AI数字人:人工智能虚拟数字人的新趋势与应用云典AI智库3. ?可24/7全天候服务,提供更高效、便捷的服务体验; 4. ?建立情感联系,与用户建立更加亲密的互动关系。 AI数字人的发展趋势 随着人工智能技术的不断发展,AI数字人成为了新一代的焦点。这些虚拟数字人可以在多个领域进行应用,包括: 客户服务 教育和培训 https://cosoh.com/aishuzirenrengongzhi/
6.虚拟数字(精选十篇)芬兰赫尔辛基市也推行了可视化数字城市计划。现在, 还有不少网站提供虚拟三维场景与聚会空间, 甚至用于设计竞赛, 例如美国ANY杂志社1997年举办的“虚拟住宅”国际设计竞赛。在2003年中国建筑学会举办的“青年建筑师设计竞赛”中, 来自西南建筑设计研究院刘艺的获奖作品“数字城墙”就是以多媒体视觉艺术的方式来完成两段https://www.360wenmi.com/f/cnkeyatnpe6s.html
7.2022年度陕西省重点研发计划项目申报指南目录5.10 面向低轨星座的相控阵卫星动中通天线技术 6.文化和科技融合 6.1 公共文化空间关键共性技术研发与应用示范 6.2 传统文化元素创意转化关键技术研发与应用示范 6.3 面向增强现实博物馆的虚实融合显示与智能交互关 键技术及应用示范 6.4 虚拟数字人技术与融媒体结合研究与应用示范 http://www.kt180.com/html/sxs/9889.html
8.Avatar——元宇宙和Web3的超级入口最近,也越来越多的文章讨论Avatar自我,这是心灵哲学中的一个概念,旨在研究人和avatar之间的关系,Avatar-self是人在虚拟世界中中有意识的、有意识的和内在连贯的存在。一些有趣的发现如下: 1、相比于传统游戏角色,玩家倾向于在情感上依附于Personalised Avatar,这种情感依恋会增加玩游戏的时间提高付费意愿。(哈佛商业评论https://www.panewslab.com/zh/articledetails/8r628qab.html
9.群英荟萃话VR汇智聚能谋发展在这个时期,区块链、元宇宙、虚拟人等众多的新名词汇聚而来。在这样的大背景下,景德镇中国陶瓷博物馆紧抓机遇,以服务景德镇陶瓷创新试验区为主线,主动寻求科技赋能,在保护、展示、研究、传播应用VR技术的相关理念,大到智慧博物馆的构建,小到文创产品的开发,都突破传统的形式,通过了技术和内容的整合和重构,最终形成了以https://www.ncnews.com.cn/xwzx/ncxw/jrnc/202211/t20221114_1896701.html
10.中国传媒大学:2024中国虚拟数字人影响力指数报告(95页).pdf定制报告-个性化定制-按需专项定制研究报告 行业报告、薪酬报告 联系:400-6363-638 《中国传媒大学:2024中国虚拟数字人影响力指数报告(95页).pdf》由会员分享,可在线阅读,更多相关《中国传媒大学:2024中国虚拟数字人影响力指数报告(95页).pdf(95页珍藏版)》请在本站上搜索。 1、中国虚拟数字人影响力指数报告CHINAhttp://www.baogao118.com/_____ban_/6336.html
11.数字藏品被疯抢,盲盒卖出3000万,博物馆IP为何火了?令小娱吃惊的是,聊天过程中,说起汉服热、沉浸式剧本杀、数字藏品、IP产业链、短视频直播等年轻人偏爱的新产品和新媒介,馆长们各个如数家珍。 显然,博物馆IP被商业选中的背后绝不是偶然。媒介的变革与国潮的兴起像一场好风,而博物馆与年轻用户对话的决心和拥抱数字化、商业化的种种主动尝试,才更是“上青云”的https://www.digitaling.com/articles/777643.html
12.虚拟数字人赋能文旅新形态!打造多元沉浸式交互新体验“元宇宙”已成为文旅产业发展的新动能,结合AR、VR等虚拟技术将线上线下联动,实现现实与虚拟的链接。在促进传统文旅行业产业价值与商业价值“活起来”的同时,也为用户创造出独特的消费体验。 其中,“数字虚拟人”逐渐承担起“向导”的角色,通过“数字虚拟人”与用户进行多模态互动,“面对面”实现低延迟地实时交互交流https://zgooh.zhaoguang.com/neican/article-30182.htm
13.关于组织参加第17届中国好创意暨全国数字艺术设计大赛校内选拔赛物理空间,非物理空间的创意设计。 作品包括:直播间设计、空间MAPPING、环艺设计、景观设计、数字展览、数字展演、数字展示、多媒体展览、雕塑作品、多媒体娱乐空间设计、装置等均可。 例如现实与虚拟的办公、直播、家居、文化和休闲空间设计(博物馆,展览馆,图书馆)、商业(商业街区、商场专卖)空间结构、灯光设计、装修、https://jw.whxy.edu.cn/info/1108/8561.htm
14.AI视频生成技术爆发标贝科技虚拟数字人构建未来互动新体验事实上,随着去年类ChatGPT语言大模型的问世和AIGC的强势崛起,已经催生数字虚拟人在多个场景的应用价值。包括文旅、电商、金融等行业。如新华社主播“新小微”、航天员“小诤”、故宫博物馆导游“福大人”等,虚拟数字人正代替真人,代言品牌,出演真人影视剧,作为AI主播攻占直播间。 https://www.newskj.org/kejixun/178083.html
15.预告中国图象图形学学会青年科学家论坛2021会议日程安排(线上2002年获浙江大学工学博士学位,2007年入选教育部长江学者特聘教授,2008年获得国家杰出青年科学基金,现任浙江大学计算机辅助设计与图形学国家重点实验室主任。研究领域为计算机图形学、计算机视觉、人机交互和虚拟现实。在ACM/IEEE Transactions上发表论文100余篇,获发明专利60余项。曾获得国家自然科学二等奖、陈嘉庚青年科学https://www.zhuanzhi.ai/document/9781e6b8a16a730e53029ebaddc2d129
16.?虚拟数字人的商业价值元宇宙是当下非常火热的话题,虚拟数字人又是元宇宙范畴中应用落地比较领先的领域。 虚拟数字人作为链接虚拟世界(元宇宙)与物理世界的一个重要媒介,是元宇宙在当前阶段的重要分支应用场景。虚拟数字人带来的不仅是类似人与人交流的体验,而且是通往元宇宙的一个窗口,对用户交流互动模式以及品牌传播带来全新的变革,无论是在技https://mp.ofweek.com/ai/a156714573367
17.2700亿元产值,虚拟数字人将成为文旅赛道新风向而今,虚拟数字人正在成为文旅行业的一种新风向。那么,虚拟数字人在文旅行业的具体应用场景有哪些呢?迈点总结以下几点仅提供参考: 1、博物馆,景区的旅游向导 虚拟数字人可以作为文旅导游角色。为游客提供路线规划、信息查询、导览讲解等智能服务,打造沉浸式的交互体验,让游客更好地感受人文、历史和自然风景。例如国内首位https://m.thepaper.cn/renmin_prom.jsp?contid=22162350