研报EAI(具身智能)行业:驱动通用人工智能与机器人产业的关键技术

具身智能(EmbodiedAI)最初是由艾伦-图灵(AlanTuring)于1950年提出的“具身图灵测试”(EmbodiedTuringTest),旨在确定智能体是否能够展现出解决虚拟环境中问题的能力,而且能够驾驭物理世界的复杂性和不可预测性。网络空间中的智能体通常被称为非实体人工智能,而物理空间中的智能体则是实体人工智能。多模态大模型(MLMs)的最新进展为具身模型注入了强大的感知、交互和规划能力,从而开发出能与虚拟和物理环境积极交互的通用具身智能体和机器人。因此,具身智能体被广泛认为是MLMs的最佳载体,目前最有代表性的具身模型是RT-2和RT-H。

要让AI像人类一样理解这个物理世界,它必须能够以人类的方式解释和理解场景。比如,当AI被放臵在一个房间里时,它需要能够像人类那样分析和解读周围的环境。另外,在不同领域之间建立联系,或者试图发现新知识时,传统的预编程和特定领域的专业系统已经无法满足需求。这些系统受到现有内臵知识的限制,很难实现新的发现、创新和创造。让AI变得更聪明的关键在于利用“想象力”,其实就是人类和其他动物依靠世界的现有模式生成的想法,它是一个非常强大的规划工具。为了让AI有效地规划,它需要构建一个关于世界的模型(WMs),并能够利用这个模型进行推理和决策。因此,具身认知至关重要。系统需要通过具身认知来获取知识,并进一步生成抽象的认知。

美国在机器人工业应用和商业化方面的进展更为成熟,中国仍在探索阶段。美国和中国的机器人技术进展和落地进度存在一些显著差异。美国的机器人企业,如特斯拉和FigureAI,已在2024年中旬进入工厂,负责分拣电池和简单抓取的任务。AgilityRobotics与亚马逊的合作已经在2023年展开,推进了物流和自动化领域的实际应用。SanctuaryAI也计划在2024年开始商业运营,重点放在智慧城市和建筑领域的智能服务上。相比之下,中国的机器人企业虽然在多个领域(如安防、教育和娱乐)都有布局,但整体落地进度稍慢。例如,优必选的WalkerS预计在2024年初开始量产,主要用于门锁质检和汽车制造领域。其他企业如小米机器人和波士顿动力的项目仍在研发阶段,逐步优化视觉和环境交互技术。

2.技术背景:从模拟、感知、交互三方面训练

EAI实现通用人工智能(AGI)的关键基础在于具身智能的发展。具身智能体与仅限虚拟对话的智能体(如ChatGPT)不同,它们可以通过控制物理实体在现实和模拟环境中进行交互。该技术涵盖了多个领域,包括计算机视觉、自然语言处理和机器人技术,特别是在具身感知、具身交互以及从模拟到现实的机器人控制方面展现了显著优势。具身智能体依托于多模态大模型(MLMs)和世界模型(WMs),像“脑”一样理解虚拟与物理环境,主动感知多模态元素,并根据人类的意图进行任务分解与执行。它们不仅能够与人类互动,还能够借助知识库和工具完成复杂任务,展现出比传统深度强化学习更高的灵活性和通用性。模拟器在训练具身智能中扮演了重要角色,通过提供逼真的虚拟环境进行算法开发和模型训练,帮助研究人员在降低成本、提高安全性和加速迭代的同时,将研究成果更快地转化为现实应用。同时,具身感知让智能体理解物理世界中的视觉推理和空间,技术包括视觉同步定位与绘图(vSLAM)和3D视觉定位,帮助智能体在动态环境中移动和互动。具身交互则强调智能体在物理或模拟空间中与环境和人类的互动能力,典型任务如具身问题解答(EQA),需要智能体主动探索环境,整合信息并执行目标导向的动作。

2.1EAI概念解析,虚拟与物理环境的结合

具身智能的发展是实现通用人工智能(AGI)的重要基础。与类似ChatGPT的对话智能体不同,具身智能可以通过控制物理实体并在模拟和物理环境中进行交互来实现。目前,具身智能涵盖了计算机视觉(CV)、自然语言处理(NLP)和机器人技术等多个关键技术领域,最具代表性的是具身感知、具身交互、具身智能体和模拟到现实的机器人控制。

2.2具身模拟器(EmbodiedSimulator)

2.2.1通用模拟器(GeneralSimulator)

该工具包还提供了创建稳健、物理精确的仿真和合成数据集所需的工具和工作流程。IsaacSim支持常见的机器人框架,如ROS/ROS2,允许用户通过这些框架进行导航和操作应用。此外,IsaacSim能够模拟来自多种传感器的数据,包括RGB-D、激光雷达和IMU,适用于各种计算机视觉技术,如域随机化、地面真值标注、分割和边界框的生成。

2.2.2基于真实世界的模拟器(Real-SceneBasedSimulators)

在室内活动中实现通用具身智能一直是AI研究领域的重点。这些具身智能体需要深入理解人类的日常生活,并执行复杂的具身任务,如室内环境中的导航和交互。为了满足这些复杂任务的需求,模拟环境需要尽可能接近真实世界,这就对模拟器的复杂性和逼真度提出了很高的要求。因此,基于真实世界环境的模拟器应运而生。这些模拟器大多从现实世界收集数据,创建逼真的三维资产,并使用UE5(虚幻5)和Unity等三维游戏引擎构建场景。丰富而逼真的场景使基于真实世界环境的模拟器成为研究家居活动中的体现式人工智能的首选。

利用TDW的多智能体API的灵活性,可以创建各种多智能体交互设臵的实现。其中包括一个“观察者”智能体被安臵在一个有多个无生命物体的房间里,与几个不同控制的“行动者”智能体一起(图9a)。“行动者”智能体由硬编码或交互策略控制,实现对象操作、追逐和隐藏以及运动模仿等行为。在这种情况下,人类观察者只被要求看他们想看的任何东西,而虚拟观察者寻求最大限度地提高其预测同一显示中参与者行为的能力,根据“进展好奇心”的度量来分配其注意力,该度量寻求估计哪些观察最有可能增加观察者做出参与者预测的能力。

2.3具身感知(EmbodiedPreception)

具身感知未来主要的发展方向是以智能体为中心的视觉推理。与仅仅识别图像中的物体不同,具有具身感知能力的智能体必须在物理世界中移动并与环境互动。这就要求对三维空间和动态环境有更深入的了解。

2.3.1视觉同步定位和绘图(vSLAM)

2.3.23D视觉定位

3D视觉定位的核心任务在于确定当前图像中相机的位臵和姿态。为实现这一目标,最直接的方法是构建三维空间点与二维图像点之间的对应关系,并基于这些匹配点对来估算相机的位姿。这一过程被专门定义为PnP(Perspective-n-Point)问题。求解PnP问题的方法有很多,常见的有P3P、EPnP、UPnP等。视觉定位需要解决的一大关键问题是如何建立3D点与2D点之间的匹配关系。对于这一点,在论文《FromCoarsetoFine:RobustHierarchicalLocalizationatLargeScale》中,作者Sarlin提出过一种分级定位的方案。

分级定位的框架大约可以分成三步:预检索、共视聚类、局部匹配与定位。预检索:预检索的意义在于获取前k张与当前图像最相似的图像,判断相似的依据通常是通过匹配图像的全局特征。一般而言,产生全局特征的方法可以依赖于局部特征所组成的词袋,不过近些年,一些深度学习方案也被引入了进来,例如NetVLAD或更加轻量级的MobileNetVLAD。最终通过获取当前图像的全局特征的k个最近邻来获取预检索得到的相近图集。共视聚类:然而由于可能产生的错误匹配,所获取到的预检索图集并不一定全部都面向同一场景,这时就需要先将面向不同场景的图像区分开来,这项技术就被称作共视聚类,简而言之就是将具有共视关系的图像聚成一类。局部匹配与定位:一般认为图像数量较多的类所对应的场景是正确场景的可能性较大。因此从这一场景开始,尝试获取相机位姿。获取的方式主要依赖求解PnP问题,因此需要首先构建当前图像的2D关键点在3D模型中的坐标位臵。在尚不知道相机姿态前,这一信息的获取需要首先匹配当前图像和场景内的图像,特别要匹配那些能够对应到3D位臵的2D特征点,若能够匹配上则确定了当前图像中的2D点和3D点的对应关系,继而即可通过对PnP问题的求解获取相机位姿。

2.3.3视觉语言导航(VisualLanguageNavigation)

视觉语言导航(VisionLanguageNavigationVLN)是一种技术,它结合了计算机视觉、自然语言处理和自主学习三大核心技术,使智能体能够跟随自然语言指令进行导航。这种技术不仅理解指令,还能理解指令与视角中可以看见的图像信息,然后在环境中对自身所处状态进行调整和修复,最终做出对应的动作,以达到目标位臵。例如,如果把一个机器人放臵在一间卧室里,并给它一个指令去取放在另一间卧室里的足球,由于两个房间之间无法直接看见,机器人需要走出房间,经过走廊、客厅等场所,通过理解并处理看到的每一处环境信息,判断下一步的行进方向,最终找到足球。NaVid是首个专为视觉语言导航(VLN)任务设计的基于视频的视觉语言大模型。此模型模仿人类导航策略,仅将视频信息作为输入,无需地图、里程计或深度数据的支持。在视觉语言导航任务中,模型需要借助历史信息来判断自己已完成指令的进度。然而,历史帧中往往包含大量冗余和重复的信息。对于当前帧,模型不仅要提供该帧所在的最新场景信息,还需预测出符合指令的下一步合理动作。

目前该方法还有两个难点:1)导航数据的模态与大模型常见的数据模态不一致。机器人的导航数据需要建模历史信息和当前信息,并保证导航过程中动作输出的格式一致性。2)缺少大量高质量的视觉语言导航任务的真实数据。在真实世界收集这样的数据极其耗时耗力,且在场景和指令的多样性上有欠缺。这些困难限制了视频大模型用于导航任务的前景。

2.4具身交互(EmbodiedIntereaction)

具身交互任务指的是智能体在物理或模拟空间中与人类和环境进行交互的场景。典型的具身交互任务是具身问题解答EmbodiedQuestionAnswering(EQA)。在这个任务里面,一个agent在三维虚拟空间中被进行询问,agent为了回答这个问题,需要在环境中进行探索和信息整合。这个任务需要agent具有主动的认知、语言理解能力、目标驱动的探索、常识推理并将自然语言的信息整合到动作序列中。

2.5具身智能全面落地仍需解决四大难题

1.通用本体平台的挑战

2.智能体系统设计的难点

智能体作为具身智能的核心,必须具备复杂环境感知和认知能力。这包括3D环境感知、任务编排与执行、多轮人机交互、long-term记忆和任务迁移等多项挑战。此外,具身智能要求实时感知和决策能力,以适应复杂和变化的环境。这要求高速的数据采集、传输和处理,以及实时的决策反应,尤其是LLM所消耗的算力规模巨大,对于资源有限的机器人处理系统将形成巨大的数据量、AI计算能力和低延迟的挑战。

3.高质量数据需求

现实场景的复杂多变,使得现阶段缺乏足够的场景数据来训练一个完全通用的大模型,进而让智能体自我进化。耦合的本体,需要实际部署到真实环境中,才能够采集数据,这也是和非具身智能的明显不同。但对于关键业务,要求成功率,则仍然需要高质量的垂域数据。同时,通过层次化的智能体设计,将不同任务限定到特定领域,则是一个解决泛化和成功率的有效尝试。

4.虚拟与真实交互中的学习进化

通过虚拟与真实环境的互动,具身智能体能够持续学习和进化,以应对复杂环境。尽管形态变化无穷,但要在有限计算资源下快速学习合理的规划和决策能力,是具身智能进化中的重要课题。

3.应用场景:具身智能产品多样,覆盖广阔市场

不同类型的机器人在各自的应用领域中展现出重要的功能和价值。1)固定式机器人因其高精度和稳定性,广泛应用于实验室自动化、教育和工业制造。2)轮式机器人在物流、仓储和安全检查中表现优异,而履带式机器人适用于农业、建筑和军事等复杂地形。3)四足机器人因其稳定性和适应性,广泛用于复杂地形探索、救援任务和军事行动。4)人形机器人在服务业、医疗保健和协作环境中日益普及,应用于智能交互、精密制造和医疗手术等领域。各类机器人在不同应用场景中展现独特优势,同时面临成本和技术挑战。

3.1固定基座机器人:全面赋能实验室与工业场景

3.2轮式/履带式机器人:高机动性适应复杂道路环境

移动机器人适应复杂多样的应用场景。轮式机器人因其高效机动性,广泛应用于物流、仓储和安全检查。其优点包括结构简单、成本较低、高能效及在平坦表面快速移动的能力,但在不平坦地形中表现有限。与此不同,履带式机器人在复杂地形中表现出色,适合农业、建筑和军事领域,但能效较低且在平坦表面上移动较慢。两种机器人各有优劣,适用于不同环境和任务。在物流领域,亚马逊的Kiva机器人较为成熟。自2012年收购KIVA以来,亚马逊探索各类机器人及智能化技术在仓储物流领域的应用,截至目前,亚马逊内部使用的机器人数量已超75万,是全球最大的机器人使用主体之一。

KIVA机器人能够提升仓库拣货效率。Kiva开发了一套系统,包括可移动货架、二维码地板网格、智能包装站、橙色机器人和强大的软件系统。我们认为,Kiva彻底改变了仓库内部的物流方式。创新想法是让货架移动到工人面前,而非让工人走到货架前。这一系统大幅提高了配送中心的效率,减少了人工错误和操作成本。

Kiva机器人通过精巧的设计提升了仓库自动化的安全性和效率,同时优化了制造成本和操作可靠性。Kiva部署的仓库地面上每隔大约1米就有一个二维码,Kiva就根据这些标记进行定位和误差补偿。它的每一个动作都来自于云端的指令。在它到达目标货架底部后,其使用一个滚珠丝杠升降梯结构,通过原地旋转来升高自己,将货架顶起约10厘米。从外面看,Kiva机器人外壳的每一侧都有红外传感阵列,以及气动保险杠,用于检测和缓冲碰撞。外壳上还有充电接口和一系列状态指示灯。每一台Kiva机器人有三个独立的自由度:两个驱动轮,加上一个用于起重的旋转电机。起重电机转动时,两个驱动轮反方向旋转,结果是托盘相对于地面没有旋转,只在滚珠丝杠的作用下升高。相比于传统的大负载直线驱动方案比如液压、剪式升降台,Kiva的这种利用轮子的结构显然更加简单可靠。

3.3四足机器人:龙头制造商占据大量市场份额

例如AIRS团队的麒麟机器人,团队引入仿生设计思路来优化设计四足机器人整体结构。基于对中型犬解剖骨骼结构的仔细研究,合理设计每个部位的尺寸。机器人整体结构具备较高负载能力,同时大大提升了越障性能。团队结合复杂地形感知技术,提出了一种能够让四足机器人在通过崎岖3D地形时实现高能效的运动。根据AIRS援引QYR(恒州博智)的统计及预测,2023年全球腿式机器人市场销售额为6.02亿美元,预计2030年将达到15.11亿美元,CAGR为14.3%(2024-2030)。全球主要的的腿式机器人(LeggedRobot)生产商包括索尼、优必选、蔚蓝智能科技和乐聚机器人,市场占比超过68%。其中,索尼以约28%的市场份额领先。亚太地区是最大的市场,占比约57%;其次是北美和欧洲,分别约占比24%和12%。从产品类型来看,四足机器人占市场份额最大,约56%。在产品应用方面,最大的应用领域是教育和娱乐,其次是科学研究。

3.4人形机器人:未来拥有强大潜力,技术仍需探索

人形机器人因其类人形态在服务业、医疗保健和协作环境中越来越普及。它们模仿人类的动作和行为,提供个性化服务,特别是在医疗手术和精密制造等需要复杂操作的领域。人形机器人的灵巧手设计拥有多个自由度和高精度传感器,使其具备出色的抓握和操纵能力。例如,BostonDynamics的Atlas以其卓越的机动性和稳定性闻名,能够执行复杂动态动作。AIST的HRP系列在研究和工业应用中表现出色,具有高稳定性和灵活性,适合复杂环境下与人类协作任务。Honda的ASIMO能够行走、跑步、爬楼梯,还能识别面部和手势,适用于接待和导游服务。SoftbankRobotics的Pepper是一种小型社交机器人,能够识别情绪并进行自然语言交流,广泛应用于客户服务和教育环境。尽管人形机器人在复杂环境中的稳定性和可靠性方面仍面临挑战,但通过引入电机驱动系统和整合大语言模型(LLMs),人形机器人有望在制造业、医疗保健和服务行业中填补劳动力缺口,提高效率和安全性。

人形机器人的市场普及需要产品价格的逐步下降。目前相较于商用服务机器人和工业机器人,人形机器人的价格仍然高达数十万至百万级,这限制了用户的采纳意愿。然而,随着技术突破、产业链发展和应用规模扩大,价格有望持续下探,从而提高用户的购买意愿。产品的核心优势在于其场景通用性,特别适用于复杂、多变的环境和需要高度人机协同的任务。为了实现这一目标,软硬件的解耦设计至关重要,即在坚实的硬件基础上,根据不同需求动态加载各领域的大型模型。

人形机器人的商业化进程需要循序渐进。首先在商用服务领域,如酒店、商场等场所提供智能交互服务。随着技术迭代,机器人将逐步进入灾害救援和极限环境作业等特种应用领域。在工业制造中,人形机器人会率先在精密装配和物料搬运等环节实现自动化作业。最终,随着技术和市场的成熟,人形机器人将进入家庭市场,承担陪伴、教育和家务等多种角色,满足家庭日常生活需求。

人形机器人行业的快速发展受到政策支持、技术进步和成本控制等多方面因素的推动。未来三年,人形机器人产业的年增长率预计将维持在40%以上。政策方面,北京亦庄将出台人形机器人三年行动计划,进一步打造国内领先的机器人技术创新策源地、高端制造集聚地、集成应用新高地和产业生态示范地。同时,上海举办的2024中国人形机器人开发者大会,围绕人形机器人创新中心建设、核心技术壁垒突破、产业链成本降低、应用落地场景、投资赛道方向等议题展开。根据证券时报援引赛迪顾问发布的《2024中国人形机器人产业生态发展研究》显示,2023年人形机器人产业进入爆发期,预计到2026年中国人形机器人产业规模将突破200亿元,未来功能型整机将逐步占据主流,发展潜力巨大。

4.潜在标的:美国商业化更为成熟,中国仍需探索

4.1FigureAI:获巨头投资,技术不断成熟

Figure.AI专注于人形机器人领域,并与汽车厂商合作。公司成立于2022年,专注于设计和制造自主人形机器人。其旗舰产品Figure01是全球首款商业化的自主人形机器人,主要应用于制造、物流、仓储和零售行业。Figure.AI的团队由经验丰富的机器人专家组成,致力于推动人工通用智能(AGI)的研究,并在机器人性能和稳定性方面进行深入研究。公司近期与BMW签署了合作协议,将其机器人技术引入汽车生产领域。Figure02搭载语言模型,距离具身智能更进一步。2024年8月公司推出新Figure02机器人,相比Figure01更加紧凑,电源和计算设备的布线被巧妙隐藏,提升了美观性和耐用性。其手部设计是亮点,配备了具有“16个自由度”的机械手,和人手尺寸相当,上面还配有传感器。这种设计使得机器人能够处理人类需要完成的任务,并且可以提起重达20公斤的物体。其手部的改进为实现与人类相当的力量和灵巧度铺平了道路。机器人还配有6个RGB摄像头,帮助其通过视觉语言模型进行语义理解和常识推理。

人形机器人在工厂和仓库环境中具有广阔的应用前景,Figure02可以有效面对劳动力短缺的问题。除了工业应用,Figure公司暗示其机器人未来可能进入家庭领域。FigureAI并非唯一玩家,其他公司如1XRobotics、特斯拉等也在这一领域竞争,许多公司还使用英伟达的多模态AI“ProjectGR00T”来驱动机器人功能。值得注意的是,FigureAI与OpenAI建立了合作伙伴关系,并获得了微软、亚马逊等科技巨头的投资,助力其机器人开发和语音交互能力的提升。

4.2特斯拉Optimus:优先赋能特斯拉工厂

在2024世界人工智能大会(WAIC2024)上,特斯拉展示其最新Optimus人形机器人进展。这表明人形机器人产业化的进度可能超预期。Optimus人形机器人现已具备在工厂内执行任务的能力,并在多项技术上取得了显著提升,预计到2025年将有超过1000个Optimus机器人在特斯拉工厂内工作。特斯拉的持续创新和技术投入将推动智能制造和自动驾驶领域的发展,并为全球市场带来新的变革。

当前Optimus已更新至第二代,身高1.7米、体重56公斤,最高行走速度达到5英里/小时,搭载了特斯拉自主设计和制造的执行器和传感器驱动。2024年5月,Optimus二代走进特斯拉工厂实训,已经可以进行分拣电池、行走等任务。根据36氪援引特斯拉官方介绍,Optimus基于其自身的视觉神经网络和FSD(完全自动驾驶)芯片,能够将电动车电池单元进行分装,精准放到卡槽中。根据第一财经报道,马斯克预测,明年特斯拉将有超过1000台,乃至数千台在运行的Optimus机器人。目前已有两台在弗里蒙特工厂工作。虽然Optimus仍处于早期阶段,但其未来潜力巨大,马斯克预计人形机器人数量将超过人类,并在工业领域发挥主力作用,目标年产10亿台。特斯拉计划将Optimus的成本控制在1万美元,以2万美元出售。人形机器人商业化元年已至,特斯拉及多家公司正在探索汽车工业作为落地场景,推动产业化进程。

4.3宇树科技:技术领先,覆盖场景多元

商业模式上,新的人形机器人产品主要面向高校、研究所、科技公司和工业落地,作为机器人开发平台研究或落地使用。四足机器人产品目前正在向toC和toB方向齐头并进,toC定位个人以及家庭服务场景;toB在特定的消防、巡检、军警等领域执行任务。

产品针对多样客户群体,覆盖大量行业。在C端领域,Go部分型号产品就是消费级产品。其中,宇树2023年发布的UnitreeGo2四足机器人适用于外出陪跑、散步等场景,支持实时视频图传和雷达高度图显示功能,奔跑速度可以和最顶级的马拉松选手不相上下,还搭载了公司最新的AI交互技术,引入了大语言模型能力。该产品售价仅9997元起。B端例如更大体型的B2则是一款工业级机器狗产品,极限负重100kg,持续作业负重40kg以上,可以应用于农业、工业、安防巡检、勘测探索、公共救援等行业级场景。宇树科技四足机器人销量领先,核心零部件自研能力强。根据36氪对宇树科技创始人王兴兴的采访,2024年宇树科技的四足机器人产品占全球出货量的60%以上,处于全球历年销量领先的位臵。在智能机器人赛道,宇树科技的核心竞争力在于全栈自研技术积累的先发优势——公司不仅自研了高能量密度关节电机、减速器、3D激光雷达等机器人核心零部件;以及传统机器人领域的感知和运动控制算法;同时还在开发机器人AI世界模型。

中科创达通过核心技术实现机器人不同场景中的智能化。公司可以提供核心技术和生态合作广泛地赋能机器人产业发展。从基于基础类半导体模块,提供平台工具软件、平台层、算法和应用的集成,到构建边缘计算成为一个共通的计算平台,推动操作系统走向平台化,从而支撑算法的可扩展、可扩充和之后的可延展的维护,进而迭代开发工具和环境去支撑应用厂商更快产品和更低成本。未来是各种各样的机器人存在的世界。本质上是随着智能化和信息化的分离,信息化是以人和人交互为中心,智能化则是通过机器感知周边的世界和环境,关键是传感器及其运动能力、操作能力进行连接,而形成一个所谓的机器人时代。公司的端侧智能+机器人的布局,进一步为机器人产业的变革注入了更多活力与可想空间。

4.5有鹿机器人:引入“通用智能大脑”概念

根据中自数字移动传媒报道,2024年5月从事具身智能技术和产品研发的有鹿机器人正式签订一笔超千万元的具身智能通用大脑Master2000的订单。订单来自中国头部清洁设备制造商,采购大脑用于对现有全系产品进行智能化升级。有鹿机器人也正式实现了具身智能从实验室走向商业化的阶段。公司同步披露了创新工场、元璟资本、百度风投等超1亿元融资的信息。

有鹿机器人创始人陈俊波博士表示,中国拥有世界领先的制造能力,在具身智能时代,预计中国制造的产品即将爆发式迎来机器人形态,如轮式机器人形态的叉车、物流车、清洁车、割草机、充电车等,复合式机器人形态的挖掘机、装载机、吊车等,以及中国大力发展的新型人型机器人。这些机器人产品形态的总体市场规模预计将在万亿级以上。有鹿机器人的使命就是打造一个可以赋能不同制造企业的通用机器人大脑,适配于专业设备,帮助成熟的制造企业进行产品的具身智能模态升级。

科大讯飞打造全球领先的智能交互机器人开放创新平台,为机器人产业提供通用化的智能应用服务,大幅降低行业技术研发和使用门槛。机器人开放平台旨在赋能机器人硬件,快速接入AI能力,并提供可视化开发机器人业务以及项目管控和运营监测能力。实现可复用化、服务统一化、流程角色优化、运营监控化和资源管控化,使平台成为一个强大的机器人能力支持中心。最终依托机器人开放平台,赋能于机器人产业公司,建立机器人合作生态,推动机器人产业持续健康快速的发展。

科大讯飞机器人业务应用广泛,覆盖多个垂直领域。业务应用前台包括酒店、餐厅、展厅、政务、商超、工业等多个行业,展示了AI解决方案在不同行业的应用场景。AI中台由AI能力服务和平台服务两部分组成。AI能力服务包括语音能力(如语音识别、语音合成、声纹识别)和图像能力(如人脸识别、OCR识别、工业检测)。平台服务则包括深度学习平台、运营监控平台和管理平台。深度学习平台提供整体的AI开发工具,运营监控平台涵盖数据监控、AI运维服务等,而管理平台则负责角色权限、数据管理等功能。数据中台则为这些服务提供支持,涵盖数据采集、数据处理、数据分析等内容。

4.7海康威视:视觉与移动机器人提供商

海康机器人是面向全球的机器视觉和移动机器人产品及解决方案提供商,业务聚焦于工业物联网、智慧物流和智能制造,构建开放合作生态,为工业和物流领域用户提供服务,以创新技术持续推动智能化,引领智能制造进程。

产品随着基于AMR、iWMS-1000和RCS-2000等智能设备和系统为核心的解决方案落地实施,持续推动内物流智慧化变革。通过全方位的智能算法驱动、智能设备联动、智能系统应用,实现内物流运营的集约化、可视化和智慧化,持续为客户创造价值。

公司基于英伟达Isacc机器人开发平台打造自主移动机器人。公司为保障工人安全、优化运输流程、节省生产成本,且为其他各界客户提升生产智能化,比亚迪电子自主开发全系自主移动机器人(AMR),为工厂提供全面物流解决方案。比亚迪电子开发高阶AMR过程中,NVIDIA基于NVIDIAIsaac和Jetson平台给予了技术支持,帮助客户加速物流应用的部署。

比亚迪电子的AMR采用了NVIDIAJetsonOrin高性能人工智能系统级模块,结合了激光雷达和视觉感知模块。利用激光雷达、IMU、轮速计等多传感器融合技术,AMR能够在室内大面积且复杂动态环境中进行实时高精度建图和定位。此外,其自有调度系统能够对多种类型的AMR进行实时集群调度,同时通过实时回环检测自动更新局部子地图,以适应室内动态多变的环境。为了提高环境适应能力和安全性,比亚迪电子的AMR还应用了人工智能自动驾驶技术。

THE END
1.中国AI大模型平台排行榜8月澎湃号·湃客澎湃新闻中国AI大模型平台排行榜 | 8月 作者|参商 Valentina 编辑|星奈 媒体|AI大模型工场 国内大模型发展趋势|8月份解读 一、具身智能上桌 2024年8月,AI 领域机器人发展迅猛。前有华为天才少年 “稚晖君” 的智元机器人一口气发布五款商用人形机器人,后有世界机器人大会27款人形机器人亮相。苹果也宣布将进军机器人行业https://www.thepaper.cn/newsDetail_forward_28718294
2.中国机器人网中国机器人网是中国机器人行业专业门户,是业内公认的集工业机器人、智能机器人、娱乐、特种、教育、服务机器人于一体的权威咨询、资讯综合传媒,面向机器人应用的设计、采购、维护用户以及学习者,提供机器人厂商、产品、技术、应用、新闻、会展会议、在线采购、技术支持和https://www.robot-china.com/
3.机器人51CTO.COM机器人 914内容 关注 涵盖机器人相关研究热点、技术难点、工具平台与应用场景。 文章博文 共914 条 想成为营销高手?AI 带你飞 本文将从营销人的视角出发,深入剖析聊天机器人如何助力企业实现营销目标,提升品牌影响力。 2024-12-02 08:00:00 营销聊天机器人AIhttps://www.51cto.com/robot
4.整理目前可用的N个QQ机器人平台高效率 QQ 机器人框架 / High-performance bot framework for QQ 测评:免费开源,可以写出自己的机器人框架同父异母产品 1、小栗子机器人 官网:https://www.xiaolz.cn/ 测评:目前免费、论坛活跃,刚出来的时候我就用了,但是由于处于高速发展时期更新过度频繁,换平台了,不做评论 https://www.qfya.com/81.html
5.中亦科技:截至目前公司没有智能客服和智能机器人服务平台每经AI快讯,有投资者在投资者互动平台提问:请问公司有智能客服和智能机器人服务平台吗? 中亦科技(301208.SZ)11月28日在投资者互动平台表示,公司是一家IT基础架构全栈式、全周期的“服务+产品”提供商,主要为客户的数据中心,提供IT基础架构层从架构设计、运行维护到自动化、智能化运维的全流程服务。同时,在IT应用https://finance.eastmoney.com/a/202311282916654667.html
6.ABB发布目前市场上最精确的中型机器人用轨道运动平台IRBT 2005是目前市面上唯一能同时实现高速度和高精度的机器人轨道运动平台,循环时间可缩短50%,为客户提供最高应用灵活性。 ABB近日隆重发布智能化的紧凑型IRBT 2005中型机器人轨道运动平台(MTM)。IRBT 2005由1米长的标准模块组成,支持客户自行扩展导轨长度和行程,满足机器人和传输应用需求。 http://robot-abb.gongboshi.com/news/index.php?itemid=7340
7.AI中台——智能聊天机器人平台的架构与应用AI&大模型王东随着“中台”战略的提出,目前宜信中台建设在思想理念及架构设计上都已经取得了很多成果。宜信是如何借助中台化的思想打造“AI 中台”及相关的智能产品呢?宜信科技中心 AI 中台团队负责人王东老师分享了宜信 AI 中台的具体实施路径,并重点介绍了 AI 中台的智能产品——智能聊天机器人平台,包括智能聊天机器人平台的背景理https://www.infoq.cn/article/5_2QekZHvBj88q859P2U
8.基于云平台的多机器人远程实时控制系统设计AET摘要: 目前由于机载设备的容量和处理能力有限,机器人完成复杂任务的能力受到限制。随着无线网络技术的快速发展,远程控制机器人成为了可能。以云平台为基础,设计了一种具有海量处理能力的多机器人远程实时控制系统,通过机载摄像头实时捕获画面并通过无线网络传给搭建在云平台上的后台处理系统,后台处理系统按照设定的规则对http://www.chinaaet.com/article/3000008031
9.学院简介三、机器人学院目前具有先进的工业机器人应用开发平台。 1.七大系列机器人工作站实训平台 (1)焊接机器人工作站 (2)变位机焊接机器人工作站 (3)机床上下料机器人工作站 (4)冲床上下料机器人工作站 (5)打磨机器人工作站 (6)码垛机器人工作站 (7)多方位视觉检测机器人工作站 https://www.lit.edu.cn/jqrxy/xygk/xyjj.htm
10.第二届中国(佛山)智能机器人博新闻中心7月8日-10日,世界机器人大赛总决赛暨第二届中国(佛山)智能机器人博览会在佛山潭洲国际会展中心盛大举行。本届博览会由中国电子学会主办,佛山中德工业服务区(三龙湾)管理委员会协办,活动涵盖全球智能机器人前沿技术与产业峰会、中国(佛山)智能机器人博览会、世界机器人大赛总决赛、招商推介等板块。 http://sino-german.foshan.gov.cn/xwzx/zdzt/36_1112711/
11.淘宝客服机器人服务数据功能怎么查看?一些平台考核或平台功能相关的数据,可能存在缺失或者口径不一致的问题,因此淘宝平台上线了机器人数据看板,目前主要提供全自动机器人通过平台能力转人工数据和满意度相关数据。 淘宝天猫商家使用的机器人后台,除了提供配置功能外,通常还会提供一些数据。 但是一些平台考核或平台功能相关的数据,可能存在缺失或者口径不一致的问题https://m.maijia.com/article/539391
12.MEME币?MEME链上交易安全风险和防范措施交易平台区块链智能合约:机器人利用智能合约确保交易的透明和安全,减少了人为干预和欺诈的可能性。 去中心化:尽管机器人可能是中心化的,但实际交易在去中心化的环境中进行,提高了交易的安全性和透明度。 4、扩展生态系统 多功能平台:Telegram 机器人不仅限于交易,还可以扩展至资产管理、借贷、质押等金融服务,提供一站式的金融解决https://www.jb51.net/blockchain/937766.html
13.智东西早报:苹果音箱HomePod推迟至明年上市本月底全国分批启用新2、谷歌开放聊天机器人分析平台Chatbase 据媒体报道,谷歌正式开发聊天机器人分析平台Chatbase。据悉,Chatbase平台云服务能够向开发者提供给更简便分析和优化机器人的工具,例如开发者根据分析仪表板来分析聊天机器人与用户的对话数据,包括活跃用户、对话数、用户用户粘性等。此外,该平台可提供各类跨平台的数据对比,包括语音和https://zhidx.com/p/100248.html