新闻分析丨“具身智能”如何加速人形机器人“进化”新闻频道

新华社北京12月13日电新闻分析|“具身智能”如何加速人形机器人“进化”

新华社记者彭茜张漫子

继大模型后,“具身智能”成为今年科技界的新热点,被认为是新一波人工智能(AI)浪潮中的重点方向。众多初创公司涌现、融资屡创新高、技术不断突破……人形机器人作为该领域最具代表性的实体,正在大模型催化下加速产业化落地。

如果将大模型视为“有趣的灵魂”,“具身智能”赋能的人形机器人则有了“好看的皮囊”,已在多个领域成为人类的有力助手。

重新定义机器人

作为连接虚拟空间和现实空间的桥梁,“具身智能”是指将AI融入机器人等物理实体,赋予它们像人一样感知、学习和与环境动态交互的能力。

“具身智能”一词本身具有浓厚的技术哲学色彩。1945年,法国哲学家莫里斯·梅洛-蓬蒂提出“具身性”概念,认为人类需通过身体与周围环境进行互动和感知,进而理解世界。1950年,被称为“AI之父”的英国计算机科学家图灵在论文《计算机器与智能》中首次提出“具身智能”这一概念。

事实上,智能化水平相对较低的工业机器人(机械臂)早已在制造业广泛应用,带来质效提升。但传统工业机器人是“固定程序+机械臂”的组合,而“具身智能”赋能的机器人则是“多模态感知+大脑决策”的迭代。

清华大学交叉信息研究院助理教授许华哲认为,未来机器人将呈现多姿多彩的形态:双足、四足、轮式,机械狗、智能无人机甚至机械小蜜蜂,但人形机器人对人类社会适配性最佳,将成为最能够帮助人类的机器人。

人形机器人可解决生产线“最后一公里”的问题。很多个性化、定制化的产品无法靠流水线统一组装,这就需要具有泛化能力的人形机器人来“帮忙”,把批量生产的零部件按客户的定制需求组装成产品。在家庭服务、公共服务等更复杂多变的场景中,人形机器人也更具优势,可适应不同的环境和需求完成多种任务。

三大难点待突破

人形机器人研发始于对人类的学习与模仿,其研发难点也可以比照人类的大脑、小脑和本体来理解。“大脑”主要是机器人负责自主学习、规划和决策的中枢;“小脑”负责运动控制,包括从行走到跑跳,以及从简单抓取到复杂的手部动作等;而“本体”部分则包括躯干四肢结构和灵巧手设计。

优必选科技副总裁、研究院院长焦继超告诉记者,目前这三大领域都有较多技术难点有待突破:“大脑”方面,云边端一体计算架构、多模态感知与环境建模等是近年技术焦点,“仿人最大难点在于对人脑的模仿,现有科学理论对人脑的研究远远不足”;“小脑”方面,人机交互能力、复杂地形通过、全身协同精细作业等是重要方向;“本体”方面,刚柔耦合仿生传动机构、高紧凑机器人四肢结构与灵巧手设计等关键技术,是人形机器人灵活运动所需的重要硬件基础。

大模型的出现让机器人“大脑”显著“进化”,大大提升了机器人的通用性和泛化性,有望降低人形机器人开发成本,加速其走入千家万户。

据优理奇机器人科技公司创始人兼首席执行官杨丰瑜介绍,现在业界主要使用预训练大模型对机器人进行预训练,让其具备更强学习能力;大模型可将特定任务的学习迁移到机器人任务上,提高其适应能力;另外还可利用大模型的多模态处理能力,结合视觉、听觉、触觉等各种输入,提升机器人对复杂场景的理解。

中国起跑不落后

环顾全球,人形机器人已进入产业化落地初期阶段,在工业制造、商用服务和家庭陪伴领域开始“试水”。无论是技术突破、落地进展还是融资规模,人形机器人研发竞赛基本以中美为主导。

优必选人形机器人Walker今年聚焦汽车、消费电子等制造业重点领域,已进入多家车厂实训;宇树科技的机器人实现了完全仿人的自然行走;优理奇机器人正在酝酿“进家”计划;波士顿动力的新版Atlas机器人实现了在工厂中不同储物柜之间灵活搬动零件;特斯拉人形机器人“擎天柱”计划2025年开始量产……

焦继超说:“如果把人形机器人行业比喻成一场马拉松,中国和欧美国家,目前几乎都处在前面1000米的起跑阶段。”

杨丰瑜持同样观点,大模型研发能力、感知技术的领先使美国企业在机器人决策系统和复杂任务处理方面具有更强竞争力。而中国的优势更多体现在工业机器人领域,特别是在制造业中的应用较为成熟。在人形机器人技术专利方面,中国也已走在前列。

虽然机器人“大脑”的核心算法和高端芯片仍存在挑战,但中国机器人行业拥有丰富的应用场景和庞大的潜在用户人口,数据是最大竞争优势之一。

如何在真实世界场景中采集大量数据,并将数据统筹流通和供给人形机器人行业是关键。许华哲介绍说,真实世界的数据一般都靠各家机器人公司自己采集。北京人形机器人创新中心有限公司正计划打造一个开源数据集供学界和业界使用。未来,高质量的共享数据集将大大助力行业发展。

THE END
1.AI生成3D模型再进化!距离真实模型师还有多远?实测结果一览!生成的一个角色模型 质量也是相当哇塞 稍微修修细节 用作3D打印也挺不错 那么这个质量 和真实的艺术家作品相比 到底差多少 小编做了个实验 先找来一个艺术家的模型 ?这个结构比较简单 主要测试一下AI的硬表面能力 ?我截了一张图上传给Tripo? 虽然只有一个角度? 但生成的结果竟然和原模型非常接https://dy.163.com/article/JCI7OK4R0514CVVN.html
2.AI3D模型生成器怎么选?这4个关键因素你不能忽略这两年,AI驱动的3D模型生成器爆发式增长,越来越多的公司和设计师开始使用AI 3D模型生成器。那如何选择适合自己的AI 3D模型生成器呢?以下四个关键因素你千万不能忽略。本文还附2024年排名前 5 的 AI 3D 模型生成器供大家参考使用,感兴趣就看下去吧! https://blog.csdn.net/LhcyyVSO/article/details/140128441
3.AI自动生成创意视频:如何让大模型助你一臂之力在科技日新月异的今天,人工智能不仅仅局限于数据分析或自动驾驶等领域,其在创意产业中的应用也越来越广泛。那么,能不能让大语言模型与AI视频生成模型联手,为我们带来高度个性化且极富创意的视频内容呢?本文将介绍如果通过输入几个关键词让大模型帮助我们生成创意视频。其中用到了OpenAI,Huggingface开源库,LangChain等技https://www.51cto.com/article/771753.html
4.什么是ai自动生成在过去的几年中,人工智能(AI)技术一直在迅速发展,并且已经被广泛应用于各种不同的行业中。其中之一是AI自动生成。那么什么是AI自动生成呢? AI自动生成是指使用自然语言处理(NLP)和机器学习技术来自动创建文本内容的过程。这些内容可以包括文章、博客文章、新闻报道、产品描述和广告文案等。AI自动生成技术可以帮助企业和https://tool.a5.cn/article/show/39859.html
5.妙话AI:在线智能写作应用,自动生成绘画语音对话机器人新媒派妙话AI,为您研制的在线AI智能体集合平台,根据您的需求轻松实现智能写作、模拟角色语音对话、自动绘画生成;大量AI机器人让您快速上手;轻松完成您的AI工具需求。https://pidoutv.com/sites/13848.html
6.了解人工智能生成内容(AIGC)的基本原理和应用人工智能生成内容(Artificial Intelligence Generated Content,简称AIGC)是指利用人工智能技术和算法来自动生成各种形式的内容,例如文章、新闻、广告、代码等。AIGC的发展可以追溯到机器学习和自然语言处理等领域的进展,以及深度学习模型的快速发展。 ? AIGC的发展历程 AIGC的发展历程可以追溯到上世纪50年代的机器翻译研https://www.skycaiji.com/aigc/ai11801.html
7.自动生成一个完整的Revit模型,这是AI干的?!(2/3)#BIM#BIMBOX#自动生成一个完整的Revit模型,这是AI干的?!(2/3)#BIM #BIMBOX #建筑 #工程 #数字化 #AI #自动化 #数字化 #智能 #人工智能 #模型 #三维 #BIMBOX进步学社 - 建筑科技BIMBOX于20230219发布在抖音,已经收获了3.8万个喜欢,来抖音,记录美好生活!https://www.douyin.com/video/7201823980163042615
8.AI自动生成绘画软件,图生图功能免费使用随着科技的飞速发展,艺术创作领域的创新也日新月异。其中,人工智能绘画软件尤为突出,它已经无所不在,从平面设计到动画制作,甚至于雕塑艺术,无一不在人工智能的影响之中。本文将介绍一款AI自动生成绘画软件:Pixso AI,深入探讨这款软件的功能,AI绘画教程以使用体验。 https://pixso.cn/designskills/ai-automatic-generation-painting-software/
9.人工智能在法官裁判领域的运行机理实践障碍和前景展望人工智能辅助办案引发深刻的裁判结构性变革,可能导致庭审虚置化、判决同质化、司法碎片化和算法模型代替法官裁判等溢出效应。司法裁判是一个复杂的判断和决策过程,融合了法官技术理性和经验理性,人工智能无法替代法官自由裁量权,也无法实现实质正义。未来,应当明确法律人工智能是辅助性而非替代性的司法实践工具,法官在具体https://www.thepaper.cn/newsDetail_forward_5264350
10.一键AI绘画怎么智能生成画作?AI自动生成绘画软件推荐(1)AI绘画的概念:AI绘画是利用人工智能技术进行绘画创作的一种方式。在AI绘画中,计算机会通过机器学习算法学习大量的绘画作品,然后使用这些学习到的知识来生成新的艺术作品。 (2)AI绘画的原理:AI绘画是将一张输入的图像进行分析和处理,然后生成一张与之相关联的新图像。为了实现这一过程,AI绘画模型需要经过训练,通https://www.xunjiepdf.com/25482
11.《2020科技趋势报告》:AI和中国,成为未来科技世界关键词研究人员使用大量的三维模型、转换成三维模型的图像和从不同角度显示物体的二维图像训练神经网络。结果:一个新的系统,可以渲染三维模型,无需任何人为干预。实际应用包括仅使用二维图像自动生成环境真实模型的机器人。 3.2 神经符号人工智能算法与系统 人工智能的发展一直走在两条概念轨道上:符号(机器使用表示概念的知识和https://www.tmtpost.com/4274113.html
12.上海科技党建近日,上海人工智能实验室(上海AI实验室)联合香港科技大学、德国图宾根大学、香港大学推出首个大规模自动驾驶视频生成模型GenAD,通过预测和模拟真实世界场景,为自动驾驶技术的研究和应用提供支撑。 视频生成模型GenAD进一步拓宽了自动驾驶技术的研究路径,结合此前推出的端到端自动驾驶模型UniAD、“语言+自动驾驶”全栈数据集https://www.shkjdw.gov.cn/c/2024-03-22/531951.shtml
13.什么是生成式AI?IBM生成式 AI,有时也称作gen AI,是一种人工智能(AI)。生成式 AI 能够创建原创内容(例如文本、图像、视频、音频或软件代码)以响应用户的提示或请求。 生成式 AI 依赖于复杂的机器学习模型,称作深度学习模型,即模拟人脑学习和决策过程的算法。这些模型的工作原理是识别大量数据中的模式和关系并对其进行编码,然后使用这些https://www.ibm.com/cn-zh/topics/generative-ai
14.什么是生成式AI生成式AI的定义与应用SAP生成式人工智能(生成式AI)是一种人工智能模型,能够创作各种格式的新内容,例如文本、音频、图片和视频等。生成式人工智能的应用和用例十分广泛。例如,生成式人工智能可以根据特定作者的写作风格创作短篇小说;生成虚构人物的真人形象;以著名作曲家的风格谱写交响乐;根据简单的文本描述创作短视频。 https://www.sap.cn/products/artificial-intelligence/what-is-generative-ai.html
15.一文读懂“生成式AI”腾讯云开发者社区生成式 AI 的定义 生成式 AI 的工作原理 生成式 AI 模型的分类 生成式 AI 的应用 二、生成式 AI 介绍 2.1 生成式 AI 的定义 人工智能不等于机器学习 人工智能是关于赋予机器以模拟人类智能的能力的广泛领域。它涉及使计算机系统能够执行类似于人类智能的任务,如语音识别、图像识别、自然语言处理和决策制定等。 https://cloud.tencent.com/developer/article/2286454
16.生成式AI:定义工作原理和示例生成式AI的简单定义是什么? 生成式AI是一种人工智能技术,广义上指的是能够生成文本、图像、代码或其他类型内容的机器学习系统,通常是作为对用户输入提示的回应。 生成式AI模型越来越多地被整合到在线工具和聊天机器人中,使用户能够在输入框中输入问题或指令,随后AI模型将生成类似人类的回应。 https://www.jianshu.com/p/7cdca5f0048a
17.生成式人工智能生成式人工智能生成式人工智能是指一类能够自动生成全新的、真实的、有用的数据的人工智能技术。这些技术包括文本生成、图像生成、音频生成、视频生成等。生成式人工智能基于深度学习技术,通过训练神经网络来学习数据的内在结构和模式,从而生成与真实数据相似的新数据。生成式人工智能在许多领域都有广泛的应用,如自然语言处https://vebaike.com/doc-view-2917.html
18.“全要素生成”会是未来的游戏形态吗?一文看懂AIGC在游戏领域的从作者个人视角探讨AIGC引发游戏形态革命的可能性,畅想科幻电影中的情境何时照进现实 AIGC定义:AIGC即AI Generated Content,又称生成式AI,即人工智能生成内容。在量子位《AIGC内容产业展望报告》 中,将AIGC定义为基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关https://www.youxituoluo.com/530782.html
19.一文搞懂ChatGPT相关概念和区别:GPT大模型AIGCLLMChatGPT横空出世后,伴随而来的是大量AI概念,这些概念互相之间既有联系也有区别,让人一脸懵逼,近期大鱼做了GPT相关概念的辨析,特此分享给你。 1)Transformer 2)GPT 3)InstructGPT 4)ChatGPT(GPT3.5/GPT4.0) 5)大模型 6)AIGC(人工智能生成内容) 7)AGI(通用人工智能) https://blog.itpub.net/70027828/viewspace-2953696/
20.什么是生成式AI?它是如何工作的?Oracle中国甲骨文公司董事会主席兼首席技术官 Larry Ellison 在 2023 年 6 月的电话会议上表示,未来几年,很多公司都会训练自己的专业化大型语言模型。 生成式 AI 与 AI 的区别 人工智能(AI) 是一个庞大的计算机科学领域,而生成式 AI 是其中的一小部分,至少目前是如此。当然,生成式 AI 与传统 AI 有着许多共同的属性,https://www.oracle.com/cn/artificial-intelligence/generative-ai/what-is-generative-ai/