思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访证券要闻股票

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.刚才百度问医生,按他要求输了姓名和身份证号,有危害吗姓名和身份证号泄露确实存在一定风险,比如可能接收到垃圾短信、骚扰电话,甚至被冒用身份办理金融业务等。https://china.findlaw.cn/ask/lawyer_66111917.html
2.百度降黑猫投诉投诉百度健康医生问诊服务:等待40分钟未接诊且问题未获解决,要求立即退款并致歉 我于2024年11月21日晚上,突然接到家人来的病危消息,因为在县城医院水平达不到治疗标准,想问一下北京的医生,找到百度健康里的一声买完服务以后等了40分钟一直未接诊服务,平台给我推了19.9的一个医生问诊,解答了我病例诊断的问题,可是107https://tj.tousu.sina.com.cn/company/view/?couid=5075618359
3.别总靠事后“打补丁”为强化智能汽车数据隐私保护,近年来,有关部门做了不少工作:无论是在个人信息保护法中列出相关规定,还是出台《汽车数据安全管理若干规定(试行)》等,都体现了对这一问题的高度重视。 不过,随着当前汽车智能化和网联化程度的不断提高,新问题一直层出不穷:一些车企用户的敏感信息被频频暴露于公众视野,车内隐私视频被随https://wxb.xzdw.gov.cn/wlcb/wsznl/202412/t20241210_533178.html
4.来宾市人民医院医院信息系统升级改造建设服务2. 设置了VTE管理的科室,在HIS住院医生站或护士站,可看到VTE相关的信息或操作。4.1.2 VTE项目要求支持能够维护VTE项目的类型、属性、名称、来源等属性,其中现有类型有有五类:诊疗项目、宣教项目、诊断条目、评分表单、知情同意书。属性是做统计用;名称自定义;来源项目根据类型不同,来源于不同的系统或项目。4.1.https://www.lbsrmyy.com/sys-nd/997.html
5.降云医生端隐私政策本隐私政策摘要主要向您说明:我们在必要范围内收集和使用您的个人信息类型和业务场景,以及我们处理您个人信息的基本规则。如您想了解我们可能收集和使用您个人信息的全部场景,以及我们处理您个人信息的全部规则,请您查阅附文中的《健康云医生端隐私政策》。 https://h5.wdjky.com/healthcloud-common-h5/html/protocol/privacy-detail.html?isNew=1&type=14
6.隐私协议电子处方单只可整单购买并只可有效使用一次,有效期为三天,超过有效期电子处方单自动作废。叮当快药会记录您的电子处方单及开具处方时医生的咨询信息(包含姓名、性别、年龄、病症描述、药物过敏情况、问诊记录、处方药品信息)。 上述所有信息构成您的“订单信息”,我们将使用您的订单信息来进行您的身份核验、确定交易、https://www.ddky.com/privacy20211208.html
7.封面报道财新周刊频道个人信息保卫战打响 利益与安全如何博弈|特稿精选 保护个人信息权益,促进数字经济发展,维护公共利益,三者如何平衡 (0) 封面报道|3A级国企债违约冲击波 高评级地方国企债突现违约,冲击25万亿元非金融企业信用债市场。怎样遏制蓄意逃废债?如何市场化出清? (0) 洞穿赌博网络|特稿精选 搜索引擎、直播、电商、快递、支付https://weekly.caixin.com/m/coverstory/
8.隐私政策5.如果我们将信息用于本政策未载明的其他用途、将基于特定目的收集而来的信息用于其他目的时,或我们开展业务需进行的个人信息处理行为超出你原本向第三方提供个人信息时的授权范围,会事先征求你的明确同意。 6.你可以通过本政策介绍的方式访问和管理你的信息、设置隐私功能、注销账户或进行投诉举报。 http://view.seeyouyima.com/users/privacy.html
9.中国驻外使领馆近期疫情相关领事保护提醒汇总(北美地区)香港请您关注国内健康咨询平台信息 为更好保障在加拿大的中国公民健康安全,便利大家免费远程问诊,现提供“阿里健康在线咨询平台”和“微医互联网总医院全球抗疫平台”的情况介绍及使用方法(附后),敬请关注。 驻加拿大使领馆特别提醒,在线咨询意见仅供参考。希望在加中国公民注意防范新冠肺炎,遵守加各级政府和卫生部门的防范措施https://www.cuhk.edu.cn/zh-hans/article/5104
10.隐私政策我们会记录用户的电子处方单及开具处方时医生的咨询信息(包含姓名、性别、年龄、病症描述、药物过敏情况、问诊记录、处方药品信息),记录这些信息是为了符合监管机构要求。上述所有信息构成用户的“订单信息”,我们将使用用户的订单信息来进行用户的身份核验、确定交易、支付结算、完成配送、为用户查询订单以及提供客服咨询与https://www.yaofangwang.com/help/ServiceAgreement.html?type=%E9%9A%90%E7%A7%81%E6%94%BF%E7%AD%96
11.微医,一站式降管理智能伙伴,轻松下载安装开启降新生活在微医首页点击“在线咨询”,选择医生进行咨询。 4、如何保护个人信息? 在使用微医时,请确保在安全的网络环境下进行操作,避免泄露个人信息。 本文详细介绍了微医的下载安装过程,以及使用微医带来的便捷与健康,随着科技的不断发展,互联网医疗将成为未来的主流,我们期待微医能够不断创新,为用户提供更加完善的服务,共同迈向https://www.liguanjiajz.com/post/21055.html
12.DB31T+14752024医院门诊预问诊信息系统基本要求DB31T+1475-2024医院门诊预问诊信息系统基本要求.docx 31页内容提供方:使者使者 大小:189.29 KB 字数:约1.03万字 发布时间:2024-12-07发布于江苏 浏览人气:3 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)https://m.book118.com/html/2024/1206/7054166023010005.shtm
13.百度大数据力量参与疫情最新动态监测与追踪,疫情最新百度深度报告疫情期间,百度健康守护成为公众获取健康知识的重要平台,百度通过搜索引擎、社交媒体等渠道传播防疫知识,提高公众的自我防护意识,百度还推出了在线问诊服务,让公众可以在线咨询医生,解决疫情期间的就医难题。 百度大数据助力疫苗研发 百度大数据在疫苗研发过程中发挥了重要作用,通过收集和分析疫情数据,百度为疫苗研发提供了宝贵https://4g.jiaot.com/post/6047.html