思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.ai画cad建筑设计图共有1259914个AI画CAD建筑设计图相关内容为您呈现 灿灿的昵称 中国古建筑151套CAD图纸设计图+施工效果图 15 triedless 承接东莞机械设计图代画,建筑效果图,CAD画图 132 3D画图建模 CAD相关设计建筑钢筋CAD施工图大全合集 297 triedless CAD常用建筑门拉手大样设计CAD施工图 https://www.zcool.com.cn/tag/ZODEyMzE4MA==.html
2.10分钟一张效果图!根据cad平面图ai在线生成建筑室内设计效果图学习AI如何在室内设计方向的应用和流程。 首先我们来学习用文生图生成室内设计,我这边使用的大模型是这个室内设计通用模型。 我们先在文生图输入提示词:moden interior design, Huge white room 一个现代的设计,白色的房子。直接让SD生成,反向提示词我就用一个通用模板,下面的参数设置采样方法我选择Eular a,迭代步数https://blog.csdn.net/xiqng17111342931/article/details/141266078
3.国产中望CAD建筑版2025亮点快速指引 | 中望CAD建筑版企业方案 400-806-2030 「点击这里」留资,工程师5分钟回电提供! 中望AI楼梯助手介绍 建结一体化AI楼梯自动生成,一天画完二十套楼梯图。 一直以来绘制楼梯详图都是一件工作量大技术要求繁琐错漏空,缺多发的工作——不但在绘制前,需要根据各种规范,一层层的计算,踏步步数,设计楼梯的排布方https://www.xwzsoft.com/h-nd-516.html
4.计算机辅助设计CAD的全面指南计算机辅助设计(CAD)是一种使用计算机软件来辅助设计过程的技术。CAD软件允许工程师和设计师创建二维(2D)图纸或三维(3D)模型,从而替代传统的手工绘图方法。CAD的主要目标是提高设计效率、改善设计质量、简化文档交流,并支持制造设计数据库。这种技术广泛应用于建筑、工程、制造等多个领域。 https://www.feishu.cn/content/guide-to-computer-aided-design-cad
5.Vectorworks2025破解版VectorWorksDesignSuite29、AI 可视化工具 将Vectorworks的优势与由Stable Diffusion提供支持的Al图像生成速度相结合。此实验性功能可直接在Vectorworks界面中使用,使用Vectorworks云服务实现零安装、不间断的工作流程,以便在设计的任何阶段使用Vectorworks 模型快速构思说明性概念或创建精细的图像。 10、VECTORWORKS ODYSSEY-META QUEST 查看器 用程序http://www.sd173.com/soft/8854.html
6.建筑学长——千万建筑师的资源库和AI绘图创作平台建筑学长官网,为青年设计师建立的线上资源共享及AI绘图创作渲染平台,免费提供海量设计案例、CAD图纸、SU模型、PS素材、软件插件下载,提供丰富的设计软件教学与灵感参考素材图库。http://www.jianzhuxuezhang.com/?/
7.AI神器完虐CAD?一键生成线稿图,施工图分分钟画好!最近,小溜发现了一款神奇的AI插件,能够在AI平台上完成各种高级的CAD操作。想象一下,从图表分析、立体剖面到施工图,全部可以在AI平台上完成,那真的太爽了! (此处强调:AI指软件Adobe Illustrator) 这个神奇的插件拥有CAD软件中的92种功能:包括尺寸测量、墙体绘制、各种图形生成、场地标注等等,让你能够轻松应对各种任务https://www.msn.cn/zh-cn/news/other/ai%E7%A5%9E%E5%99%A8%E5%AE%8C%E8%99%90cad-%E4%B8%80%E9%94%AE%E7%94%9F%E6%88%90%E7%BA%BF%E7%A8%BF%E5%9B%BE-%E6%96%BD%E5%B7%A5%E5%9B%BE%E5%88%86%E5%88%86%E9%92%9F%E7%94%BB%E5%A5%BD/ar-AA1r1loj
8.AI生成城市设计热潮,让梦幻建筑变成现实建筑大师暗藏的AI设计 加拿大著名建筑师Frank Gehry会在他的一些作品中使用AI生成的设计元素。 例如,他在设计迈阿密的新世界交响乐团大厅时,使用了一种名为CATIA的软件,这是一种计算机辅助设计(CAD)软件,可以根据不同的参数和目标,生成具有独特形态和特点的建筑设计方案。 https://m.thepaper.cn/renmin_prom.jsp?contid=22862708
9.{写手代写代笔接单平台}{AI智能写作论文生成器}压缩包2024土木工程毕设一套定稿(论文+pkpm建模模型+建筑结构施工CAD图纸)5层宜宾教学楼设计内部文件含有: 压缩包中第1文件: 向培林毕业设计/ 压缩包中第2文件: 向培林毕业设计/04 向培林 202026070079 整套图纸/ 压缩包中第3文件: 向培林毕业设计/04 向培林 202026070079 整套图纸/04 向培林教学楼设计.dwg http://www.no1paper.cn/doc-1402739.html
10.CAD如何导出ai文件怎么打开AI绘画NEW 更多 溜溜问答 > CAD图纸 > CAD如何导出ai文件怎么打开 CAD如何导出ai文件怎么打开浏览量:261CAD如何打开AI文件 AI如何打开CAD文件 ai如何打开 CAD文件 CAD如何打开.ai文件 如何打开AI文件 CAD如何导出 文件怎么打开的文件 CAD如何导出 文件怎么打开的文件 AI导出CAD生成png文件怎么打开 为https://www.3d66.com/answers_relation/relation_2295389_49.html
11.TEXTTOCAD:文本生成CAD在线AI工具Text-to-CAD是一个开源的提示界面,用于通过文本提示生成CAD文件。你可以生成模型,并将其导入到你选择的CAD程序中。 Text-to-CAD背后的基础设施利用了他们的设计API和机器学习API,以编程方式分析训练数据并生成CAD文件。 Text-to-CAD允许用户通过文本提示转换思维为复杂的https://www.aihub.cn/tools/design/text-to-cad/
12.CAD建筑工程图自动识别算量软件AI成果价值解读: 开启AI成果分析成果概况 你可能感兴趣 服务案例 常见问题成果概况 简介 该软件的主要特色包括,采用多元信息集成的智能理解方法进行自动识别,避免了繁琐的人机交互操作,同时,在自动理解和组织尺寸系统的基础上自动确立构件的拓扑关系,生成建筑物的三维模型,在统计工程量时按定额的计算规则自动扣减和汇总https://www.1633.com/tec/eoeeukxo.shtml
13.FastAI人工智能审图平台建筑图纸设计效率的倍增器一、 AI 审图的需求背景 建筑信息模型 BIM,在建筑设计领域正成为一个关键、甚至强制的过程,用以确保规划、设计和建设协作的高效,BIM 允许多个利益相关者和 AEC(建筑设计、工程、建筑施工)专业人员在一个模型中协作规划、设计和施工建筑物。 目前建筑设计行业大都使用 CAD 软件绘制施工图(如图 1 所示),人工绘制的住https://xie.infoq.cn/article/07ea0fb3a6a7826f1356a4dbf?utm_medium=article
14.AI施工图插件CADtools(支持CS6CC2019)Illustrator专区可以直接推拉线稿体块,推拉形体,快速绘制轴测图,快速生成轴测图。▲ 各类标注,直接生成 跟CAD的标注https://www.52cnp.com/thread-19651-1-1.html
15.TexttoCAD:通过文本生成CAD文件的在线AI工具,提高设计效率Text-to-CAD 是一个开源工具,它通过简单的文本提示帮助用户生成CAD文件。这些文件之后可以导入到任何主流的CAD软件中进行进一步编辑和使用。该工具背后的基础设施整合了设计API和机器学习APAI写作,AI办公,AI医生,AI图像处理,AI客服,AI对话聊天,AI开发编程,AI律师,AI提示词,https://www.uied.cn/55936.html
16.集CAD翻模智能协调构件AI匹配国标清单计算工程量并内置造价管理等功易达BIM造价管理for Revit 秉持Revit强大的操作功能基础上再加持易达自主研发的多专业协调与传统造价简易操作相结合,支持多专业建模与CAD识别翻模,Revit模型智能匹配造价分类计算清单工程量【内置完整国标清单计算规则与钢筋平法规则,计算清单工程量含:建筑+钢筋+机电工程量】(不需要繁琐的导入导出,避免构件丢失),操作简单易https://bbs.co188.com/thread-10279977-1-1.html