思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访证券要闻股票

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.10个建筑AI工具,从设计到施工全覆盖!肯定有你从来没听过的今天聊到的大部分工具都是由国外软件公司开发的,这一款很特殊,是由湖南省建筑设计院集团股份有限公司数字研究院推出的AI工具,光是看开发者的身份,就值得先竖个大拇指。 HD-AidMaster是一款云端工具,浏览器可以直接访问,建筑师可以在平台上使用主流的AIGC功能,进行有趣的集卡式方案创作,整个过程高度贴合方案设计师工https://www.hxsd.com/information/9177/
2.建筑设计AI软件目前市面上有哪些建筑设计AI软件? 目前市面上有许多建筑设计AI软件,例如Rhinoceros、Grasshopper、SketchUp、Revit等,这些软件都可以应用于建筑设计中的各个环节。这些软件可以通过各种算法和工具帮助设计师制作3D模型、提供可视化模拟和分析、进行数据处理和优化,从而提高设计效率和质量。 https://www.3vjia.com/seo/seodetail/00041/06257.html
3.申万宏源策略:地产链后续展望如何?各行业中报有何亮点?【TMT:“买兑现”阶段已至,把握确定性】短期数字经济已经历较大幅度的回调,后续存在哪些投资机会?应如何选股?计算机分析师认为,前期市场更倾向于“买格局”,目前已来到“买兑现”的时间点。算力方面,兑现度最高的是英伟达产业链;应用方面,建议关注有成熟应用落地的企业。传媒分析师认为,6月起,AI应用将加速落地,将https://stock.jrj.com.cn/2023/07/11100437682542.shtml
4.日本最高设计奖GOODDESIGNAWARD2021百件获奖作品精彩出炉拥有50多年历史的电线老铺推出的高质量延长线系列产品。采用高压VCT电缆,电极与本体一体成型,在确保耐用性的同时,以简洁的设计方便融入家庭、商店、建筑工地、户外等任何环境。 18、缓冲材 supasupa 获奖公司/组织:kawakamisangyo Co.,ltd. 无需使用剪刀等工具便可手动整齐分割的缓冲材。提高了整体作业效率,且避免了https://www.digitaling.com/articles/621312.html
5.锈AI云小库AI云的目标是通过计算机处理设计过程中高度重复的计算、数据分析和应用,使建筑师能够更专注于需要人类创新的工作。通过采用SaaS技术,小库AI云将产品部署在云端,用户只需购买ID即可访问云端的软件和硬件服务。 小库AI云提供了多个功能模块,包括灵感广场、灵感创作、模型集市、模型训练和AI工具箱等。这些模块帮助用户根https://pidoutv.com/sites/8381.html
6.天津博奥教育设计培训课程主要包括室内设计培训,平面设计培训,PS天津室内设计培训_天津平面设计培训_天津CAD培训_天津犀牛Rhino培训_天津SolidWorks培训_Rhino建筑参数化设计培训_天津UG培训_天津模具设计培训_天津三维机械设计培训_天津办公软件培训_天津博奥教育培训http://www.boaoit.com/
7.上海自考数字媒体艺术概论(14265)自学考试大纲3.领会服装 CAD 技术的概念,识记服装 CAD 系统的内容和优势。识记市场上主要的 3D 服装设计软件和特点。 4.领会虚拟服装展示系统的概念和应用。 (九)建筑渲染与漫游动画 领会数字化在建筑领域最成功的应用—— 建筑效果渲染和建筑景观漫游动画,分别领会它们的概念和应用领域,识记典型艺术家和作品。 https://www.zikaoben.cn/n/e-9719833081.html
8.第一批用AI替自己干活的人:一个人顶一个团队–比特币行情▲用建筑AI软件一键导出的**风格效果图贝聿铭**风格(左)和扎哈·哈迪德**风格(右) ▲用建筑AI软件一键导出的建筑**弗兰克·盖里风格效果图 与此同时,AI制图软件Midjourney也在中国社交平台火了一把,摄影师用它复原20世纪老照片,设计师直接用它出图。还有建筑行业的AI,可以一键生成**风格的效果图…… https://www.btchangqing.cn/522360.html
9.6000字干货!超全面的AI绘画基础知识扫盲优设网最近大火的 AI 绘画,并不是一个全新的事物,早在 2015 年就已经出现了基于 GAN (生成对抗网络) 生成图像的 AI 应用实例,但因为技术的不成熟,并没有得到广泛的推广。 这两年因为显卡算力的增长和扩散模型的出现,AI 绘画迎来了一波热潮,大有要把设计师干失业的凶猛势头,无论是网上的社区还是微信社群,都弥漫着一https://www.uisdc.com/aigc-basic-knowledge
10.(上海)AI.建筑–项目建筑师/团队领导/中级建筑设计师/初级gooood是中国第一影响力与最受欢迎的建筑/景观/设计门户与平台。坚信设计与创意将使所有人受益,传播世界建筑/景观/室内佳作与思想;赋能创意产业链上的企业与机构。https://www.gooood.cn/job-ai.htm
11.PSAICADSUID制图软件在线课程汇总PS、AI、CAD、SU、ID 制图软件在在线课程 文中根据难易程度分类整理了景观、建筑专业常用制图软件在线自学课程,如果你苦于在海量的视频中寻找质量较好的课程,那就不要错过。 PS基础入门级别 1. PS2019从入门到精通视频课程 主讲人:张盛陵/方国平 http://www.landscape.cn/article/66898.html
12.建筑学长课程平台——最受欢迎的软件及设计课程建筑学长官网课程平台,提供全网最受欢迎的软件及设计课程。包括建模 渲染 PS出图 参数化 AI设计全流程及竞赛设计等。https://appgabvoqqe6202.pc.xiaoe-tech.com/
13.自学电脑3D教程平面教程影视动画教程办公教程机械设计我要自学网-免费视频教程,提供全方位软件学习,有3D教程,平面教程,多媒体制作教程,办公信息化教程,机械设计教程,网站制作教程,电脑培训https://www.51zxw.net/
14.2023年建筑业13大创新技术国外动态中装新网事实上,到2024年,建筑行业对三维激光扫描的需求预计将增长100亿美元。 事实证明,这项技术在项目的整个生命周期都非常有用,从设计、施工到运营和翻新。与二维扫描相比,三维激光扫描仪不仅能提高精确度、减少人工、促进协作并加强关键项目数据的收集,还能将成本降低50%。 http://www.cbda.cn/html/gwdt/20240802/140514.html
15.ArkoAI云端智能渲染工具建筑设计渲染ArkoAi是首款应用人工智能辅助渲染的云端AI渲染器工具, 支持SketchUp、Rhino、Revit等软件, 提供高效且易于使用的渲染解决方案, 适用于建筑设计、室内设计、产品设计等领域。https://hao.archcookie.com/sites/2399.html