WAIC | 上海人形机器人创新中心 | 最新演讲 | 详细整理

前言

笔者看了7月4号的人形机器人与具身智能发展论坛的直播,并在7月5日到了上海WAIC展会现场参观。这次大会的举办很有意义,听并看了各家的最新成果,拍了很多照片视频,部分演讲也录屏了在重复观看学习

稍后会相继整理创立穹彻智能的上交卢策吾老师、创立银河通用的北大王鹤老师、宇树CEO王兴兴、哥伦比亚博士生胡宇航、卡内基梅隆智能控制实验室的博士生孙逸凡在此次论坛上的最新公开演讲。并会分享这次WAIC展会上的一些新鲜见闻。欢迎持续关注我的专栏

如果想直接观看演讲原视频,也可以联系我发送,但是我边看边录的,可能会有点模糊。这篇整理学习笔记图也截于此,若模糊望见谅


演讲纪要

1. 演讲思路清晰、技术路线介绍详细易懂

2. 从本体平台、具身智能、数据集、训练场进行介绍

3. 今年的青龙以旋转执行器作为主驱动单元,明年会发布用直线执行器的"snack"人形机器人。每年发布一款公版机,以生肖为版本号

4. 代号是"青龙"人形机器人平台,"朱雀"具身大脑,"玄武"具身小脑、"白虎"数据集、"麒麟"训练场

5. 值得一提的是,通过在强化学习行走的过程中,引入传统控制的思想,使迁移成功率达到100%

6. 2024年,会在上海打造100个人形训练场。2027年,在各个城市、各个场景打造1000个训练场,构建1PB数据集(每周生产5TB+)

上海人形创新中心

2024年5月,上海的国家级人形机器人创新中心揭牌。

上海打造人形机器人底座,关键词——开源。软硬件全开源。开源网站

之前的关键技术,包括GitHub、ROS、Hugging Face都是国外学者组织的开源社区,而中国想打造人形机器人的开源社区

机器人参数、开发时间:

类似ROS每年发布一版,中国的人形机器人也会每年发布一个公版机,以十二生肖为版本序号,体现中国特色:

演讲顺序:

本体平台

100人+,150天+,生态企业50+

本体包括:行走与驱动系统、操纵与作业系统、感知与控制系统

总体硬件

总体设计:

构型设计:

行走与驱动系统

电池电源方面,人形机器人与常规设备不同,存在循环交变、稳态爆发、反电动势巨大的特点。青龙人形搭载了具有能量回收系统和输出稳压管理的电源系统,以支持整机3-4h强功耗续航:

关节模组:

操纵与作业系统

系统设计:

感知与控制系统

具身智能

感知、规划、决策、控制。包括“朱雀”具身大脑、“玄武”具身小脑

  • 朱雀大脑:以多模态大模型为核心的机器人指挥调度中心。以文字、图像为输入,输出语音交互、任务决策信息
  • 玄武小脑:具体任务执行模型,包括轨迹规划模块和运动控制器。
    • 轨迹规划器:由端到端的模仿学习驱动的,视觉作为输入,以人类作业作为模仿对象,输出期望路径
    • 运动控制器:以环境信息、机器人状态信息输入,输出关节扭矩,完成控制目标。有两条技术路线。其一是基于强化学习的智能运动控制方法,其二是基于全身动力学模型的预测控制方法
  • 遥操作:在朱雀大脑和轨迹规划系统发育尚不完全的情况下,还会利用遥操作系统作为输入,控制机器人完成任务。也可用来收集数据,去发育朱雀大脑和轨迹规划系统

具身大脑

现场演示demo:
——人:你看桌面有什么?
——机器人:桌面有2个面包、3个水果
——人:桌面有点乱,你能帮我清理一下么?
——机器人:好的,正在为您整理桌面。我将把面包和水果分类摆放(它先将面包都放到桌面右边,水果放到桌面左边,再分别抓到篮子中)

具身小脑

三条路径:传统的控制理论(可解释性强)、模仿学习(训练难度低)、强化学习(智能体有较强的鲁棒性)。结合这三条路径有点,打造小脑模型

首先收集大量人体数据,包括人体运动协调数据和人类作业数据,以此为基础,打造行为策略和行为标准。然后,利用控制理论、强化学习两条路径,打造运动控制器。三条路径相互支撑。三个月内完成算法开发、部署、迭代

数据

创新中心采用2类数据采集方式:

  • 全身运动捕捉系统:对高精度手部数据、全身数据进行采集。可以训练机器人完成走跑跳、抓拿放等多种技能
  • 视觉捕捉系统:针对灵巧专用、精细作业,通过视觉捕捉系统完成毫米级的手部动作采集

通过采集丰富数据训练大小脑:

打通人形机器人数据采集、评估清洗、训练一体的全流程体系。提供解决方案、行业可参考的设计理念:

提供标准数据采集工具和基于数字孪生系统完成的评估/二次标注方法:

3年内100台采集设备,完成1PB数据集采集:

提供预训练模型、微调和测评服务,帮助各个企业加速发展:

人形机器人数据是目前整个行业最大的痛点,只由创新中心来做这件事很艰巨,希望通过生态、联盟单位,一起加速开源数据集的建立

训练场

人形机器人一个难点是获得高质量数据难、场景应用难

训练场:搭建场景模拟产线、工艺流水线的规模化数据,检测评估基地。其实也就是数据生产、收集基地

特斯拉训练场。谷歌RT1的开源数据集,在17个月中只收集到13w条高质量数据

训练场难度分级:

是

 训练场架构:

算-学:用模仿学习、强化学习,做单臂、双臂、全身运动的训练;用:工业产线、服务。模拟应用

训练数据产生步骤:

分为3个阶段

  • 第1阶段:基于aloha,打造单臂单技能学习、作业对象与环境的泛化能力
  • 第2阶段:基于前面的6自由度协作臂,将这套技术路线迁移到青龙人形机器人的上肢上,做多技能的学习和训练,实现多技能的模仿学习
  • 第3阶段:未来会做大规模人类视频,产生低成本、规模化数据集的工作

训练场构建方式:

  • 搭建数据管理的平台系统,打造操作端、机器端云网服务器。
  • 建设实时标定系统、控制系统、数据采集系统、数据反馈系统
  • 通过数字孪生,生成合成式数据
  • 通过异构人形机器人,打造真实、生成式数据

2024年,会在上海打造100家人形机器人训练场。2027年,在各个城市、各个场景打造1000个训练场:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/41304.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

算法系列--分治排序|归并排序|逆序对的求解

一.基本概念与实现 归并排序(mergeSort)也是基于分治思想的一种排序方式,思路如下: 分解:根据中间下标mid将数组分解为两部分解决:不断执行上述分解过程,当分解到只有一个元素时,停止分解,此时就是有序的合并:合并两个有序的子区间,所有子区间合并的结果就是原问题的解 归并…

第一节 网络安全概述

一.网络空间安全 网络空间:一个由信息基础设施组成相互依赖的网络。 ---- 海陆空天(大海、陆 地、天空、航天) 通信保密阶段 ---- 计算机安全 ----- 信息系统安全 ----- 网络空间安全 计算机安全:开始秉持着“严于律己&#x…

C语言 指针和数组—指针数组及其在字符串处理中的应用

目录 问题的提出 问题的解决 回头看——指针、数组及其他类型的混合 指针数组与指向数组的指针 字符串的排序 问题的提出 问题的解决 回头看——指针、数组及其他类型的混合  基本数据类型  int 、 long 、 char 、 short 、 float 、 double……  数组是一种从…

设计模式之模版方法

模版方法介绍 模版方法(Template Method)模式是一种行为型设计模式,它定义了一个操作(模板方法)的基本组合与控制流程,将一些步骤(抽象方法)推迟到子类中,使得子类可以在…

【UE5.1】Chaos物理系统基础——03 炸开几何体集

目录 步骤 一、通过径向向量将几何体集炸开 二、优化炸开效果——让破裂的碎块自然下落 三、优化炸开效果——让碎块旋转起来 四、优化炸开效果——让碎块旋转的越来越慢 步骤 一、通过径向向量将几何体集炸开 1. 打开上一篇中(【UE5.1】Chaos物理系统基础—…

Spring IOC基于XML和注解管理Bean

IoC 是 Inversion of Control 的简写,译为“ 控制反转 ”,它不是一门技术,而是一种设计思想,是一个重要的面向对象编程法则,能够指导我们如何设计出 松耦合、更优良的程序。 Spring 通过 IoC 容器来管理所有 Java 对象…

如何从 Windows 11/10/8.1/8/7 恢复已删除的视频

意外删除了视频或格式化了 SD 卡/硬盘?没有备份已删除的视频?别担心,我们有解决方案来恢复 Windows 11、10 中已删除的视频并处理这种糟糕的情况。 但在了解如何恢复已删除的视频和视频恢复应用程序之前,请知道 Windows 会为您提…

ARMv8寄存器详解

文章目录 一、ARMv8寄存器介绍二、通用寄存器三、 PSTAE寄存器四、特殊寄存器五、系统寄存器 一、ARMv8寄存器介绍 本文我来给大家介绍一下ARMv8的寄存器部分,ARMv8中有34个寄存器,包括31个通用寄存器、一个栈指针寄存器SP(X31),一个程序计数器寄存器PC…

Transformer前置知识:Seq2Seq模型

Seq2Seq model Seq2Seq(Sequence to Sequence)模型是一类用于将一个序列转换为另一个序列的深度学习模型,广泛应用于自然语言处理(NLP)任务,如机器翻译、文本摘要、对话生成等。Seq2Seq模型由编码器&#…

JavaEE初阶-网络原理1

文章目录 前言一、UDP报头二、UDP校验和2.1 CRC2.2 md5 前言 学习一个网络协议,最主要就是学习的报文格式,对于UDP来说,应用层数据到达UDP之后,会给应用层数据报前面加上UDP报头。 UDP数据报UDP包头载荷 一、UDP报头 如上图UDP的…

Emacs之解决:java-mode占用C-c C-c问题(一百四十六)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒…

C++语言相关的常见面试题目(二)

1.vector底层实现原理 以下是 std::vector 的一般底层实现原理: 内存分配:当创建一个 std::vector 对象时,会分配一块初始大小的连续内存空间来存储元素。这个大小通常会随着 push_back() 操作而动态增加。 容量和大小:std::vec…

element-plus 的form表单组件之el-radio(单选按钮组件)

单选按钮组件适用于同一组类型的选项只能互斥选择的场景,就是支持单选。单选组件包含以下3个组件 组件名作用el-radio-group单选组组件,子元素可以是el-radio或el-radio-button,v-mode绑定单选组的响应式属性el-radio单选组件,la…

阶段三:项目开发---搭建项目前后端系统基础架构:任务9:导入空管基础数据

任务描述 本阶段任务是导入项目的基础数据,包括空管基础数据和离线的实时飞行数据(已经脱敏)。 任务指导 本阶段任务需要导入两种数据: 1、在MySQL中导入空管基础数据 kongguan.sql空管基础数据表说明: 1告警信息…

OpenCV直方图计算函数calcHist的使用

操作系统:ubuntu22.04OpenCV版本:OpenCV4.9IDE:Visual Studio Code编程语言:C11 功能描述 图像的直方图是一种统计表示方法,用于展示图像中不同像素强度(通常是灰度值或色彩强度)出现的频率分布。具体来说…

cs231n作业1——SVM

参考文章:cs231n assignment1——SVM SVM 训练阶段,我们的目的是为了得到合适的 𝑊 和 𝑏 ,为实现这一目的,我们需要引进损失函数,然后再通过梯度下降来训练模型。 def svm_loss_naive(W, …

【Qt】Qt概述

目录 一. 什么是Qt 二. Qt的优势 三. Qt的应用场景 四. Qt行业发展方向 一. 什么是Qt Qt是一个跨平台的C图形用户界面应用程序框架,为应用程序开发者提供了建立艺术级图形界面所需的所有功能。 Qt是完全面向对象的,很容易扩展,同时Qt为开发…

从打印到监测:纳米生物墨水助力3D生物打印与组织监测平台?

从打印到监测:纳米生物墨水助力3D生物打印与组织监测平台? 在 3D 组织工程中,纳米生物墨水是将纳米材料与 ECM 水凝胶结合,以提高其打印性和功能性的重要策略。纳米生物墨水可以增强水凝胶的机械性能、导电性、生物活性&#xff…

汽车报价资讯app小程序模板源码

蓝色实用的汽车报价,汽车新闻资讯,最新上市汽车资讯类小程序前端模板。包含:选车、资讯列表、榜单、我的主页、报价详情、资讯详情、询底价、登录、注册、车贷,油耗、意见反馈、关于我们等等。这是一款非常全的汽车报价小程序模板…

Ubuntu 20版本安装Redis教程,以及登陆

第一步 切换到root用户,使用su命令,进行切换。 输入: su - 第二步 使用apt命令来搜索redis的软件包,输入命令:apt search redis 第三步 选择需要的redis版本进行安装,本次选择默认版本,redis5.…