低门槛重构人机交互,百度想要创造AI应用的未来

“大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。”

“未来自然语言将成为通用的编程语言。你只要会说话就可以成为一个开发者,用自己的创造力去改变世界,而这一天并不遥远。”

2024年4月16日,VR陀螺受邀参加“Create2024百度AI开发者大会”,在会上,百度创始人、董事长兼首席执行官李彦宏直接对大模型的落地方式进行了定性。

面对着台下激动的开发者群体,李彦宏开场并没有直接对大模型高谈阔论,反而是将话题放到了“大模型到底改变了什么”上。

图源:百度

百度将生成式AI的应用场景最先定位到了编程领域。传统编程依赖于严谨的代码编写,而今,大型模型与生成式人工智能正颠覆这一常态。

在ChatGPT问世后,社会各界普遍预见到AI技术将对所有行业带来深度变革,引发各领域的工作模式重构。一方面,部分岗位可能会面临被AI技术取代的局面;另一方面,许多工作也将经历形态与方式的显著调整,其中就包括编程技术。

不久前,以“世界第一位人工智能软件工程师”为噱头的超级智能计算机程序“Devin”问世。

图源:网络

虽然在风头过后,Devin背后的公司Cognition被质疑演示视频造假,但AI改变程序员行业的势头还是让不少人类工程师彻夜难眠:AI程序员可能是假的,但AI编程助手却已经成为现实。

以百度Comate为例,这款基于文心大型模型的智能代码助手覆盖百种语言与所有IDE平台,不仅能推荐代码、撰写注释、检测缺陷、提出优化策略,甚至能深度解读现有代码并生成全新代码。

短短一年多,Comate已入驻数万家企业,其生成代码占比高达46%。仅在百度自家每日的新增代码中,就有27%出自Comate。

在李彦宏看来,自然语言将成为编程的通用语言,开发者无需精通编程语法,仅凭自然语言交流即可驾驭技术,创新世界。在生成式AI的加持之下,从代码到语言,开发门槛骤降,无编程背景的个体如今也能轻松构建智能应用,成为创新力量。

在现场,百度给出了一组数据。自去年3月16日首发以来,文心一言用户数已经突破了2亿,API每日调用量同样也突破了2亿,服务的客户/企业则已经达到了8.5万家。

再加上VisionPro等XR设备对沉浸式办公的普及,虚拟空间对办公场景的再塑造以及AI技术对于办公流程的变革使得编程体验做到了快上加快。

当然,大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才是能够真正的满足市场需求的东西。

一是“MoE架构”:未来大型AI应用将以MoE(大小模型混合)架构为主,依据场景灵活匹配模型规模;

二是“小模型”:低成本、高速响应的小模型,经精细调整与SFT处理,在特定场景表现媲美大型模型。

三是“智能体”:智能体具备理解、规划、交互等能力,能自主完成复杂任务,实现自我迭代进化。

作为开发者大会的重头戏,百度也为开发者们备好了上述三大方向的开箱即用工具,并现场手把手教学。

在对“人人都能成为开发者的阐释”中,百度抛出了一个绝佳的例子:今年年初举办的百度AI原生应用开发挑战赛中,冠军选手在没有手写一行代码的情况下就开发出了一款游乐场排队规划助手应用,最终斩获10万元大奖。

按照百度的说法,对于有编程基础的开发者来说,这样的应用程序可能并不难写,但对于没有编程基础的人来说,基础模型带来的低代码甚至是零代码开发模式就十分重要。

如果你是新加坡旅游局的开发人员,你要如何开发出一个能够解答问题、提供指导方案的国家旅游应用工具?

百度的答案是只要三步。

首先,在文心平台的创建页面,选择“零代码”模式,通过自然语言描述智能体工具名称。

其次,为智能体工具设定其解答旅游咨询、提供预订服务等职能,便于平台自动填充基础配置。

然后,如需专业级智能体,还可以进一步添加官方知识库、实时更新功能,并集成酒店查询、门票购买等实用工具,实现全面服务能力。

那么,是不是意味着在人人都可以是开发者的时代,程序员们的生存空间就会受到挤压了呢?

一个主流的说法是:虽然生成式AI将逐渐改变各个行业,但软件开发模式的转型还没完成。

且不说以Devin为代表的的AI程序员还未能真正做到在效率上打败人类,就从程序员群体自身出发,作为一项需要终生学习的职业,程序员们在工作中本就需要接触大量的辅助工具,对于技术开发人员,与其说AI取代人类,不如说AI辅助人类更为贴切。

在美国技术研究咨询公司Gartner发布的2024年十大战略技术趋势中,就预测到了2028年,75%的企业软件工程师将使用AI编程助手。

在Software2.0的概念中,随着深度学习的进步,我们可以构建一个神经网络,学习获得结果所需的指令或规则:软件能够解决更多问题,而这些问题是人类无法建模的。

在这种情况下,程序员将得到深度学习神经网络系统的帮助,角色也随之转变为“数据管理者”或“数据推动者”而不是被AI完全取代。

图源:CopilotX

在百度看来,普通人能够使用AI工具无痛打造出自己的智能助手,而开发者能够借助AI工具不断提高代码生成能力,将AI渗透到产品开发的全生命周期,专业的人更要做专业的事。

而对于开发者来说,“用好大模型的重点之一在于掌握模型增强的方法”,区别于低代码工具AgentBuilder、AppBuilder,百度为编程基础的专业人员推出了专业模型定制工具“ModelBuilder”,通过数据集构建、模型精调与部署,让大模型更贴合特定应用场景需求。

以教育行业作文批改为例,作文批改有着明确的评分标准,但对于不同年纪的学生,批改标准和得分要求都不一样,这就要求大模型有充足的数据训练。

现场演示案例中,用于训练的原始数据只有180套,质量也不够高,这就要求ModelBuilder必须能做到数据清洗、数据标注和数据增强,对大模型进行精调。

通过将低质量原始数据从180套扩充至920套高质量数据,并选择基础模型进行训练,ModelBuilder将精调后的模型部署至平台。

在AgentBuilder、AppBuilder与ModelBuilder三大工具的加持下,大模型到AI应用的落地方向拓展到了工作、学习等生活的方方面面。

大模型使用门槛的降低让每个人都能成为开发者,通过打破技术壁垒,赋予全民创新力量,加速各行各业迈入大模型驱动的智能化新时代,通用人工智能未来已来。

在AI应用的热潮之下,对于AI的落地方向还着重强调了AI原生人机交互,软硬件深度融合如何推动AI技术与应用的革新与普及成为AI时代的新选题。

百度智能云事业群总裁沈抖认为:“回顾整个IT的历史发展史,我们发现软件跟硬件的合作是互相促进的,缺一不可。”

在过去的一年,对于AI技术的吐槽中总是不乏一种声音:为什么AI没被用在做家务、做饭、解放人类双手上,而是最先开始跟打工人抢饭碗?

对于很多人来说,AI应该将重心更多放在如何帮助人类解决现实中的难题,而不只是写写画画。这种对于AI落地的现实想象也意味着具身智能将成为引领人工智能的下一波浪潮。

AI原生应用的时代已经解开了序幕,那么最适配AI原生应用的会是什么?

百度的答案是AI家庭机器人。

作为全场开发者大会的压台好戏,小度科技CEO李莹重磅介绍了小度添添AI平板机器人以及为小度量身打造的全球首个AI原生操作系统DuerOSX。

这款基于百度文心大模型构建的操作系统——DuerOSX打破了“人适应系统”的传统模式,实现了端到端连接用户意图与任务,极大地拓宽了操作系统的功能边界。

而早在开发者大会开场,李彦宏就已经通过自然语言交互完成了与小度添添AI平板机器人的互动。

经过一系列对话,小度展现出了精准处理繁杂日程的能力,不仅在智能程度、执行效能和理解用户需求方面有了显著提升,同时由于其生动活泼的言语交流形式,更增添了提供情感陪伴的新功能,被李彦宏评价为“有望成为一款适用于广泛用户群体、实用且富有人性化内涵的AI伴侣。”

李莹认为:“小度AI智能助手是百度文心大模型规模化应用的典型代表,DuerOSX的推出预示着AI原生应用进入全新纪元,有力推动AI原生应用跨入崭新的发展阶段。这款操作系统将为我们解锁前所未有的智能化体验,翻开智能生活的新篇章。”

从现场体验来看,小度添添AI平板机器人中搭载了多个数字人AI应用程序,除了能讲睡前故事的“数字人偶像”之外,还有能指导健身动作要领的数字人健身教练兼健身搭子。

这一功能实际体验类似于百度之前推出的另一款AI产品“智能健身镜”,运动过程可以参照任天堂健身环,只不过对于健身动作的识别不依赖于控制器配件,而全部由平板机器人完成。

在全民健身火热的当下,百度对于AI健身产品/应用的打磨其实已经很接近于VR健身的概念。同样是在虚拟游戏的框架下、在技术手段营造出的有限空间中挥洒汗水,区别只在于沉浸式体验的深与浅。

或许,百度在未来可以将小度AI智能助手融入以希壤为代表的的XR技术场景中,在虚拟空间中复刻小度添添产品带来的智能健身体验,冲击未来十亿量级的VR健身游戏市场。

设想一下,如果可以参考波士顿动力已经下线的液压机器人Atlas以及EngineeredArts推出的人形机器人Ameca,当家庭机器人能跑能跳、能哭能笑,具身智能才算是真正渗透到家庭生活中。

总的来说,技术总是在磕磕碰碰中前进的,回顾整场开发者大会,就像本次的主题一样,在对AI的探索中,百度也正在“创造未来”。

百度以大型模型与生成式AI为核心,构建了完善的工具链、操作系统以及创新硬件产品,不仅在技术层面实现了开发方式的变革,更在理念层面倡导并践行“人人皆可开发者”的愿景。

“未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”

在开发者大会现场的掌声之中,李彦宏还宣布第二届“文心杯”创业大赛正式启动。除了项目筛选范围扩大、设置分赛场外,百度还首次设立了“特别大奖”,最终获胜的AI原生应用项目将有机会获得最高5000万元的现金和资源支持。

AI工具普及带来的AI应用的繁荣不仅为大模型落地创造了条件,更深刻地影响了社会对技术创新的认知与参与,标志着一个全民创新、通用智能的新时代已然来临。

在这样的时代背景下,每一个个体都有可能借助强大的开发工具与平台,释放自身创造力,参与到这场前所未有的智能化进程中,共同描绘一个更加智慧、便捷、人性化的未来世界。

投稿/爆料:tougao@youxituoluo.com

元宇宙数字产业服务平台

下载「陀螺科技」APP,获取前沿深度元宇宙讯息

(*收到爆料后VR陀螺将尽快联系爆料者进行二次确认,并判断内容是否适合发布。)

THE END
1.元宇宙行业动态百度披露虚拟形象生成专利开启新时代元宇宙交互近日,北京百度网讯科技有限公司在专利领域取得了新的进展,其“虚拟形象生成方法、装置、电子设备和存储介质”一项专利正式公开。据天眼查App的最新数据显示,百度公司通过其高科技团队开发了一种集成了人工智能技术的创新方案,该方案不仅涉及到增强现实和虚拟现实技术,还融合了计算机视觉和深度学习等先进领域。这意味着这一https://www.gbrczjzrq.cn/xu-ni-xian-shi-vr/501571.html
2.百度VR虚拟产品,VR平台解决方案VR编辑管理系统 专业全面的全景、3D环物等VR内容编辑创作功能,生成可在手机和VR头显上体验的3D化、交互式、沉浸式的虚拟现实内容 详情介绍>> VR Suite开发者套件 基于感知层算法技术的深度研究,以及业务场景的能力沉淀,百度VR在开发能力SDK、Cloud VR,网端渲染以及核心算法领域有着深厚的积累,我们将尽快开放核心能力https://ai.tuidc.com/ar-vr/xuni.html
3.初识UE4VR开发三51CTO博客初识UE4 VR开发三 UE4入门 虚幻编辑器介绍(From:百度百科) 配置需求 软件需求 UE4入门 很多天不写了,因为我发现我电脑配置不太够,不太支持HTC VIVE的头显,所以想办法上了RTX2060,打算先建一下大场景。 https://blog.51cto.com/u_13640003/4711461
4.宝通科技:被投企业哈视奇与百度合作完成了百度VR平台四大板块的开发另公司参股公司哈视奇是否为字节跳动的供应商,为其定制开发元宇宙AR产品? 宝通科技(300031.SZ)12月14日在投资者互动平台表示,公司被投企业哈视奇与百度合作完成了百度VR平台四大板块的开发,四大板块主要为百度大脑、未来出行、智能生活、AI教练展区;另外,哈视奇为字节跳动的供应商,定制开发AR产品。https://finance.eastmoney.com/a/202112142213403962.html
5.百度手机浏览器WebAR+VR公开课引来谷歌大牛WebAR和WebVR首次把AR、VR这两项前沿技术与Web结合起来,被认为是继智能手机之后,产生下一个千亿市场的革命性技术。 近日,百度手机浏览器WebAR+VR公开课面向开发者分享了WebAR与WebVR相关标准、现状以及在此两项技术上探索与研发成果。目前,百度手机浏览器T7内核首家支持WebVR标准,WebAR技术已经完成原型开发,是国内https://g.pconline.com.cn/x/870/8706443.html
6.9.7新闻:百度VR浏览器即将上线界面新闻·JMedia日前,百度宣布将于9月15日上线正式版的百度VR浏览器。与之前的开发版不同的是,正式版将新增视觉主题飞向太空,在首页直接推荐热门vr视频及直播精选内容。用户可以在太空舱的中控台进行位置Reset、亮度调节等多种操作,让人有种置身家庭影院的感觉。 京东公布VR/AR战略,布局VR购物 https://www.jiemian.com/article/841173.html
7.AppStore上的“百度VR摄像头”百度VR智能摄像头是一款软硬一体化产品,聚焦政企和民用安防市场,充分发挥百度在AI、VR、IOT等技术领域上的领先水平,和摄像头硬件相结合,大幅提升产品智能性和功能性,提供智能无死角的监控摄像头。 【支持百度账号登录】 软件可通过百度passport账号快速登录。 https://apps.apple.com/cn/app/id1605735817
8.智东西早报:高通5G芯片亮相;百度明年量产无人巴士2、三星展示GearVR开发框架最新成果 三星将于10月18至19日在美国旧金山莫斯康展览中心举行三星开发者大会,届时三星研究院将展示Gear VR服务框架Gear VR Framework(GearVRf)的最新成果。GearVRf项目是一个轻量级,功能强大的开源渲染引擎,采用Java接口,可用于开发Gear VR和谷歌Daydream View游戏与应用程序,支持轻松访问Androihttps://www.zhidx.com/p/96184.html
9.百度低调推出VR浏览器,我们聊出了这些干货摘要基于WebVR技术打造的浏览器,更适合用户在VR环境下,浏览网页、观看视频甚至玩一些VR游戏。WebVR技术能够降低开发者对于VR内容的开发成本,让创业者、开发者开发得更方便一些。 图片来自网络 【编者按】虽然VR资本寒冬,但仍有一些公司似乎毫不在意。近日,百度低调推出了VR浏览器,集成了全景、视频、导航、下载等功能,https://www.o2oteam.com/41588.html
10.MetaDaily蔚来汽车上线AR眼镜,苹果在开发至少三款VR/AR设备根据彭博社的Mark Gurman称,苹果正在开发至少三款VR/AR头显,其中首款设备将以“Apple Reality Pro”的名字推出。 在最新一起Power On Newsletter平台中,Mark Gurman表示,据他了解,苹果目前正在开发的VR/AR头显至少有三款,代号为“N301”、“N602”和“N421”,其中“N301”即“Apple Reality Pro”。 https://www.yoojia.com/article/9364918675371904523.html
11.百度多业务线减员;华为鸿蒙汽车「问界M5」曝定价24.9万元起;SteamFacebook 母公司 Meta 解散 AR 和 VR 操作系统开发团队;梁汝波卸任抖音法定代表人;京东增持达达集团,目前持股 52%;理想发布 2020 年四季度及全年财报 百度多个业务线减员,涉及核心技术部门 25 日消息,从 2022 年 1 月开始,百度 AIG(ACG、TPG、INF)、MEG 等多条业务线正在进行减员。本次减员涉及百度多个部门,https://www.geekpark.net/news/299078
12.山东文旅虚拟现实科技融合发展中心成立联合光电已储备AR/VR恒信东方近日在互动平台表示,公司具备开发适用于各类VR/AR/MR硬件终端的内容制作的能力,并已与国内领先的MR头显厂商Nreal建立战略合作关系,同时针对MR硬件的最主要的交互手段——手势交互,正在开发原创VR内容,旧有内容也可根据业务需要,实现针对各类终端硬件的移植适配。 https://m.cls.cn/detail/1258083
13.百度VR和腾讯AI开放平台哪个好有什么区别优缺点百度VR和腾讯AI开放平台对比页面从功能、价格、点评为您详细介绍了百度VR和腾讯AI开放平台哪个好,好用,区别,对比,优缺点,便于您更好的了解产品。https://www.36dianping.com/vs/coga.html
14.如何上线百度地图vr全景也可以嵌入在百度地图里面进行展示,这样其他人在搜索到百度地图的时候,就可以看到vr全景展示了。 如下面这样的效果, 上海炯眼网络科技有限公司专注vr全景拍摄,数据采集,程序开发制作业务。 所属分类:中国传媒广电网/其他广告、展览器材 成立日期2017年06月05日 https://shanghai.11467.com/info/19208813.htm
15.宝通科技:虚拟数字人加百度vr加游戏?你好。公司对于具有前瞻性的宝通科技:虚拟数字人加百度vr加游戏? 你好。公司对于具有前瞻性的技术和赛道一直非常重视,公司具备数字人(虚拟人)开发的能力,目前,公司正在推动虚拟数字人和Boton Space1更好的结合,通过裸眼3D混合现实的方式呈现更好的虚拟数字人体验。在元宇宙领域,公司提前布局,在AR/VR、裸眼3D、数字孪生等元宇宙技术方面进行深耕https://xueqiu.com/1102819579/296969779
16.百度地图离线开发包百度地图专家百度地图离线开发包,包含下载地图控件https://www.iteye.com/resource/bodown001-9719603
17.unityVR体验商城——附上资源说明及百度网盘链接.docx谷歌VRAPP实战UNITY与CARDBOARDAPP基础实践(三).docx 浏览:142 谷歌VRAPP实战UNITY与CARDBOARDAPP基础实践(三).docx Unity模拟HTC手柄拿枪瞄准及射箭瞄准.docx 浏览:115 unity虚拟现实开发 unity5.x从入门到精通百度网盘下载地址 浏览:115 unity5.x从入门到精通的pdf资源,百度网盘下载地址,全高清。 https://download.csdn.net/download/qq_37387068/11420261