思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访证券要闻股票

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.为什么全域经营下,品牌却更难了?澎湃号·湃客澎湃新闻同时,Nint 任拓打通了从电商到内容的数据,开发出了种草、转化两大标签矩阵,通过大数据 AI 生成,将内容标签置于分别以曝光、销售指数为横轴,以互动指数为纵轴的矩阵中,量化评估内容标签的效果,以辅助内容营销,带动销售、人群、品牌资产的增长。 结语 全域经营下,品牌到底可以如何破局? https://www.thepaper.cn/newsDetail_forward_29662900
2.最新群控系统引领数字营销未来趋势网络科技摘要:最新群控系统引领数字营销新趋势,实现更高效、精准的市场推广。该系统具备强大的控制和管理能力,能够自动化管理多个社交媒体平台,提升品牌曝光和互动率。通过数据分析,优化营销策略,提高转化率。群控系统的出现,将极大改http://fr5duod.cn/post/15069.html
3.数字广告生态:平台营销与革新2.1.2数字广告的定义在线阅读互联网平台开发推广的数字技术和人工智能技术,不仅创造了数字广告技术产品和市场,而且赋予了消费者积极主动地与品牌保持联系的能力。数字广告信息流成功地连接起互联网平台、消费者和企业供应方,形成了一个充满活力的数字广告生态系统。数字广告已成为互联网技术推动营销数字化转型的主要力量。https://book.qq.com/book-read/52804159/24
4.全域营销的概念应用和趋势分别是什么?DIACT数皆DIA在当今数字经济蓬勃发展的时代,企业面对着越来越复杂多样的市场环境和消费者需求。在这个变革的潮流中,全域营销概念应运而生,成为企业成功融入全球化市场的关键战略之一。全域营销不仅仅是传统营销的延伸,更是一种以用户为中心、跨足线上线下各个渠道的全新模式。 https://www.diact.com/wp/archives/5336
5.2024上海国际商业空间博览会明日开幕美通社PR10:30-12:00 全域运营助增长 传统百货的全域探索 乐音 常州泰富百货副总经理 MALL会员数字化运营,怎么做? 卢智明 沙井京基百纳广场副总经理 全触点、全链接数字营销 付闯 上海悦容匯商业管理有限公司合伙人,数科总经理 13:30-14:30 新技术应用 数字化重塑消费体验 https://www.prnasia.com/story/440925-1.shtml
6.行研丨数字营销行业研究报告01数字营销概念全球最大的信息管理软件01数字营销概念 全球最大的信息管理软件及服务供应商ORACLE(甲骨文)公司将数字营销定义为指通过数字媒体渠道(网站、落地页、社交媒体、电子邮件和移动应用)来创建和传播内容,并利用跨付费、口碑和自有数字渠道的各种策略来推广内容,包括 SEO、SEM、点击付费 (PPC) 广告、内容联合、社交、电子邮件、文本等等。 https://xueqiu.com/1378655667/292103926
7.驾驭“全域营销”——数字化时代零售营销的数据合规之道(下篇在数字化营销时代,品牌方的营销策略已逐渐从过去的大规模流量采买和广告投放转向“公域引流+私域沉淀”的全域营销。全域营销更强调贴近消费者需求的个性化营销触达,更依赖对消费者个人信息的深度挖掘,相应地,这需要品牌方加强个人信息保护,确保个人信息收集、使用、交互等环节的合规,在合规运营的https://www.kwm.com/cn/zh/insights/latest-thinking/uni-marketing-data-compliance-in-retail-marketing-in-era-of-digitalization.html
8.数字化营销的底层逻辑——以数字化医疗为例这就叫实名客户下的匿名数据,这个有了,才真正把数字化营销给发挥出来。数字化最核心的就是我们要从匿名客户营销,变成实名客户和匿名客户的全域营销,从到大江大海去捞鱼,到捞的同时我们自己家里也养鱼,而且我知道我养的鱼跟大江大海的鱼是什么关系。 2. 行业趋势:从治病功能专业市场,到健康消费医民融合 https://maimai.cn/article/detail?fid=1525692654&efid=ZyzFQaJuRBWeMbv1E2PrKA
9.了解阿里全域营销AIPLFASTGROW三大数字模型一知十电商行业走的最快的肯定就是阿里了,在17年提出“全域营销(Uni Marketing)”概念,18年上线,19年这概念已经得到了发展,这套模型牛皮的地方就是在于,他不是纯学术派理论,他被提出的同时,也开始在阿里内部实践了,并顺应潮流进行了迭代。 那这套中国领先全球的数字用户增长模型讲的是什么? https://www.shangyexinzhi.com/article/details/id-1677001
10.阿里全域营销将实现品牌数字化升级5月24日消息,阿里巴巴全域营销将从全域内容、全域会员、销量增长锁定器三个方面推动品牌数字化升级。 据悉,在此前的阿里数据服务生态大会上,阿里巴巴集团首席市场官董本洪分享了主题演讲“品牌确定性增长的新势能”。演讲中提到,阿里全域营销将实现升级。 首先,在全域内容方面,构建“全域种草、消费者资产沉淀、生意增长”https://www.dsb.cn/149040.html
11.什么是全域营销?公私域联动上线下链接以及跳出营销范畴做生意全域营销是阿里巴巴于2016年提出的一种以数据为导向,以消费者为中心的数智化营销方法论。 全域营销设计的初衷是:全面洞察、全渠道、全触点、全链路,以“AIPL消费者运营”为方法论,全面加速品牌营销数字化升级。 在1.0阶段,它开创了以消费者为中心的品牌数智化营销,而2.0则实现了三个飞跃:数据洞察能力的提升;推动https://www.softunis.com/676.html
12.2024医药数字营销报告:合规时代必选项,深入渗透药品生命全周期随着互联网、人工智能的快速发展,数字化已经融入行业的方方面面。即使是最传统保守的制药领域,近几年也普遍大力拥抱数字化转型。在医药营销这一环节,经过产业多年的努力与尝试,现下已经取得不错成果:数字化已经融入医药营销的方方面面,覆盖药品全生命周期以及患者全病程,而这一过程还在不断深化。 https://36kr.com/p/2765106008898563
13.14家广告集团的大模型应用,看懂AI×营销公司计划从2020年开始大力投入,建设基于大数据技术和AI人工智能技术的智能化数字营销技术平台,包括智能化营销大数据管理系统、智能化营销洞察分析系统、智能化营销内容创意系统、智能化营销内容精准投放系统以及智能化营销转化系统。平台建成后,因赛集团将拥有行业领先的全链条智能化数字营销技术支撑体系,实现品牌营销传播业务的https://www.digitaling.com/articles/1217670.html
14.深度洞见罗兰贝格联合天猫发布《车企数字化营销白皮书》:围绕用户根据罗兰贝格观察,更加规模化地运用合适的工具推动全面数字化转型的概念已全面渗透主机厂管理战略,积累用户数据和提升用户体验等话题已成为车企业务转型的重要课题。由此,罗兰贝格携手天猫,紧抓车企数字化升级的核心,基于用户全生命周期运营的数字化营销理念,提出了车企数字化营销解决方案 (O-AIDL)。https://blog.csdn.net/weixin_55366265/article/details/122505458
15.全域营销2021所以,为了更好的做营销,营销人需要知道在消费者最后一次看广告之前,消费者都接触到了什么信息。 所以全域营销的概念开始出现,即用统一的身份识别码,将某个消费者在一段时间所有接触到的特定广告信息,和该特定消费者对于品牌转化行为(浏览/加购/购买等)等行为进行串联。 https://www.jianshu.com/p/fbe2cf915fe7
16.丝路视觉丝路视觉以数字创意为核心,打造视觉科技与应用的整体解决方案。提供从设计、营销到最终整体呈现的全流程服务。现公司员工超2000人,合作客户遍布全球20个国家/地区,项目总数超4000个,获国内外260项大奖。https://www.silkroadcg.com/
17.腾讯黄识:突围增长难题,全域营销是“必选项”12 月 1 日,在腾讯数字生态大会「营销服 CRM」腾讯企点专场上,腾讯企点营销产品全新升级的能力版图,发布全域营销产品图谱。通过帮助品牌构建的“全域增长飞轮”,连接腾讯生态资源与第三方能力,突破传统市场内运营思路,实现全域数据洞察。 腾讯云副总裁 黄识“现在用https://cloud.tencent.com/developer/article/2183148
18.私域运营进阶课私域流量链路构成及转化方式如何破除「全域营销」概念迷思,洞察趋势,实现弯道超车? “中式快餐No.1”?老乡鸡如何打破快餐私域同质化竞争困局 Qian LinkFlow 内容运营专员 Qian Wang,LinkFlow 内容运营专员,负责过多款SaaS品牌的内容营销工作,擅长内容专栏策划与创作。 进入作者专栏 7 让https://www.linkflowtech.com/blogs/convert-private-domain-traffic-chain