HumanoidBench——模拟仿人机器人算法有未来

概述

论文地址:https://arxiv.org/pdf/2403.10506
仿人机器人具有类似人类的外形,有望在各种环境和任务中为人类提供支持。然而,昂贵且易碎的硬件是这项研究面临的挑战。因此,本研究开发了使用先进模拟技术的 HumanoidBench。该基准利用仿人机器人评估不同算法的性能,其中包括各种任务,如灵巧的双手和复杂的全身操纵。研究结果表明,最先进的强化学习算法在许多任务上都很吃力,而分层学习算法在行走和触摸物体等基本动作上表现更好。HumanoidBench 是机器人界应对仿人机器人所面临挑战的重要工具,为算法和想法的快速验证提供了平台。

介绍

仿人机器人有望无缝融入我们的日常生活。然而,它们的控制装置是为特定任务手动设计的,而新任务则需要大量的工程设计工作。为了解决这个问题,我们开发了一个名为 HumanoidBench 的基准,以促进仿人机器人的学习。这涉及一系列挑战,包括复杂的控制、身体协调和长期任务。该平台为测试机器人学习算法提供了一个安全、廉价的环境,并包含与人类日常任务相关的各种任务。HumanoidBench 可以轻松纳入各种仿人机器人和末端执行器、15 项全身操纵任务和 12 项运动任务。这使得最先进的 RL 算法能够控制仿人机器人的复杂动态,并为未来的研究提供了一个方向。

相关研究

随着标准化模拟基准的出现,深度强化学习(RL)正在迅速发展。然而,现有的机器人操作模拟环境主要关注静态、短期技能,并不涉及复杂操作。相比之下,已经提出的基准则侧重于各种长期操作。不过,大多数基准都是针对特定任务设计的,而且很多都使用了简化模型。这就需要基于真实硬件的综合基准。

模拟环境

主要机器人代理是一个拥有两只灵巧影子手2 的 Unitree H1 人形机器人。该机器人通过 MuJoCo 进行模拟。模拟环境支持一系列观察,包括机器人状态、物体状态、视觉观察和全身触觉感应。人形机器人还可通过位置控制进行控制。

HumanoidBench

要执行与人类类似的任务,机器人必须能够理解其所处的环境并采取适当的行动。然而,出于成本和安全考虑,在现实世界中测试机器人是很困难的。因此,模拟环境是学习和控制机器人的重要工具。

HumanoidBench 包括 27 项任务,具有高维运动空间(多达 61 个执行器)。运动任务包括行走和跑步等基本动作。操纵任务则包括推、拉、举和抓物体等高级任务。

基准测试的目的是评估现代算法能够在多大程度上完成这些任务。机器人需要观察环境状态,并据此选择适当的行动。通过奖励功能,机器人可以学习执行任务的最佳策略。

例如,在行走任务中,机器人需要在保持前进速度的同时不摔倒。在这类任务中,优化平衡和步态非常重要。另一方面,在操纵任务中,机器人需要精确地操纵物体。这就需要了解物体的位置和方向,并进行适当的力控制。

HumanoidBench 的目标是通过这些任务促进机器人学习和控制领域的进步。利用模拟环境,研究人员可以安全地进行实验,评估机器人在许多不同场景中的性能。这将有助于开发更好的控制算法和学习方法,从而促进仿人机器人未来在现实世界中的应用。

试验

对强化学习(RL)算法的性能进行了评估,以确定仿人机器人在学习任务中面临的挑战。为此使用了四种主要的强化学习方法,包括 DreamerV3、TD-MPC2、SAC 和 PPO。结果显示,基线算法在许多任务中都低于成功阈值。

特别是,当前的 RL 算法在处理高维动作空间和复杂任务时非常吃力。仿人机器人在执行需要灵巧双手和复杂身体协调的任务时尤其困难。除此之外,操纵任务也特别具有挑战性,而且奖励往往较低。

一个常见的失败是,仿人基准难以学习机器人在高栏、门和障碍等任务中的预期行为。这是因为很难找到适合复杂行为的策略。

为应对这些挑战,正在考虑采用一种分层的 RL 方法。训练低级技能并通过高级规划策略将其结合起来,可以促进任务的解决。不过,目前的算法仍有改进的余地。

结论

该研究引入了一个名为 HumanoidBench 的高维仿人机器人控制基准。该基准提供了一个全面的仿人环境,包括从玩具到实际应用的各种运动和操纵任务。论文作者希望它能挑战此类复杂任务,促进仿人机器人全身算法的开发。

在未来的研究中,研究不同传感模式之间的相互作用非常重要。此外,还将考虑将更逼真的物体和环境与现实世界的多样性和高质量的渲染结合起来。此外,还将重点研究在难以收集实物演示的环境中引导学习的其他手段。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/43831.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GTK是如何加密WLAN组播和广播数据的?

1. References WLAN 4-Way Handshake如何生成GTK?_tk bigtk gtk igtk-CSDN博客 2. 概述 在Wi-Fi网络中,单播、组播和广播帧的加密算法是由AP决定的。其中组播帧和广播帧的加密使用GTK密钥,其PTK的密钥结构如下图所示: GTK的组成…

2024 Q3 NAND闪存价格|企业级依然猛涨,消费级放缓

在企业领域持续投资于服务器基础设施,特别是在人工智能应用的推动下,企业级SSD需求增加的同时,消费电子市场却依旧疲软。加之NAND供应商在2024年下半年积极扩大生产,预计到2024年第三季度,NAND闪存供应充足率将上升至2…

“郑商企航”暑期社会实践赴美丽美艳直播基地开展调研

马常旭文化传媒网讯(记者张明辉报道)导读:2024 年 7 月 3 日,商学院暑期社会实践团“郑商企航”在河南省郑州市新密市岳村镇美丽美艳直播基地,展开了一场意义非凡的考察活动,团队成员深度调研了直播基地的产…

【系统架构设计】计算机组成与体系结构(二)

计算机组成与体系结构 计算机系统组成存储器系统前言主存储器存储器存储数量(计算) 辅助存储器(以磁盘为例)Cache存储器 流水线 计算机系统组成 存储器系统 前言 存储器用来存放程序和数据的部件,是一个记忆装置&am…

【自动驾驶/机器人面试C++八股精选】专栏介绍

目录 一、自动驾驶和机器人技术发展前景二、C在自动驾驶和机器人领域的地位三、专栏介绍四、订阅需知 一、自动驾驶和机器人技术发展前景 随着人工智能、机器学习、传感器技术和计算能力的进步,自动驾驶和机器人的技术水平不断提升,使得它们更加智能、可…

fatal error: napi.h: No such file or directory

使用Cmake-js构建基于node-addon-api的C扩展 基于node-addon官方的eample改造测试:https://github.com/nodejs/node-addon-examples Cmake-js的github给了一个例子,但是是基于NAN的,而不是node-addon-api:https://github.com/cma…

如何压缩视频大小不改变画质,视频太大怎么压缩变小

在现代生活中,视频已经成为我们记录生活、分享快乐的重要工具。但随之而来的问题就是视频文件体积过大,不仅占用大量存储空间,还难以在社交平台上快速分享。别担心,下面我就来教大家几种简单有效的方法,让视频文件轻松…

回溯算法-以医院信息管理系统为例

1.回溯算法介绍 1.来源 回溯算法也叫试探法,它是一种系统地搜索问题的解的方法。 用回溯算法解决问题的一般步骤: 1、 针对所给问题,定义问题的解空间,它至少包含问题的一个(最优)解。 2 、确定易于搜…

移除元素的讲解,看这篇就够了!

一:题目 博主本文将用指向来形象的表示下标位的移动。 二:思路 1:两个整形,一个start,一个end,在一开始都 0,即这里都指向第一个元素。 2:在查到val之前,查一个&…

Jackson与FastJson时间Date转换问题

今天在开发Excel导出时发现一个Date类型的属性导出的不对,因为导出时将Vo装换成了Json, Vo类Date字段也添加了DateTimeFormat(pattern "yyyy-MM-dd"),JsonFormat(timezone "GMT8", pattern "yyyy-MM-dd"),那么这是为什么呢&#…

渲染农场怎么用更省钱?渲染100邀请码1a12

现在越来越多的设计师开始使用渲染农场,其中收费是个大问题,怎么用渲染农场才能更省钱呢?今天我们就来看下吧。 1、明确渲染方式 要根据不同情况选择合理的渲染方式,比如渲染农场就适合大场景渲染和紧急出图情况,其他…

前端JS特效第26波:jQuery日期时间选择器插件

jQuery日期时间选择器插件&#xff0c;先来看看效果&#xff1a; 部分核心的代码如下&#xff1a; <!DOCTYPE html> <html> <head lang"zh-CN"> <meta charset"UTF-8"> <title>jQuery日期时间选择器插件 - PHP中文网</t…

MySQL手注之布尔型盲注详解

布尔型盲注简介 基于布尔型SQL盲注即在SQL注入过程中&#xff0c;应用程序仅仅返回True&#xff08;页面&#xff09;和False&#xff08;页面&#xff09;。 这时&#xff0c;我们无法根据应用程序的返回页面得到我们需要的数据库信息。但是可以通过构造逻辑判断&#xff08;…

WSL2编译使用6.6版本内核

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、有什么变化二、下载6.6内核三、开始编译1.安装环境2.开始编译 四、使用1.杀死虚拟机2.防止内核文件3.修改配置文件 总结 前言 最近出了一件不大不小的事&a…

品牌文化五大维度,构建品牌竞争力的秘诀!

品牌文化对于企业的发展和成功至关重要。 品牌文化不仅是企业和消费者之间的纽带&#xff0c;也是企业内部员工的凝聚力。 在当今竞争激烈的市场环境中&#xff0c;建立一个有活力和影响力的品牌文化是每个企业都需要认真思考和实践的事情。 品牌文化的五大维度包括价值观、…

前端面试题31(TCP与UDP区别)

TCP (Transmission Control Protocol) 和 UDP (User Datagram Protocol) 是两种在网络通信中常用的传输层协议&#xff0c;它们在多个方面存在显著差异&#xff0c;主要体现在以下几个方面&#xff1a; 连接方式&#xff1a; TCP 是面向连接的协议。在数据传输开始之前&#xf…

数字身份管理发展趋势:IAM 和数据安全相结合

数据安全和IAM作为网络安全领域中不同的学科而存在。然而&#xff0c;随着越来越多的组织利用云服务&#xff0c;情况发生了显著的转变。许多公司现在将重要的安全控制(例如管理存储、应用程序和网络的控制)委托给他们选择的云服务提供商(CSP)。 图&#xff1a;用户与云服务商职…

oracle(表空间分类、表空间操作、默认表空间)

文章目录 oracle数据库默认表空间列表表空间是什么&#xff1f;表空间的分类1.永久性表空间&#xff1a;2.临时性表空间&#xff1a;3.撤销表空间&#xff1a; 表空间的作用Oracle 系统自动建立的表空间默认表空间1&#xff0e;SYSTEM 表空间2&#xff0e;SYSAUX表空间3&#x…

01:简易的电动车防盗报警器

简易的电动车防盗报警器 1、震动传感器模块的使用2、使用震动传感器模块控制继电器开关3、433M无线发射接收模块的使用 需要材料&#xff1a; 1、51单片机 2、震动传感器模块 3、继电器模块 4、高功率喇叭 5、433M无线发射接收模块 6、弱干杜邦线 1、震动传感器模块的使用 接好…

u盘电脑格式化恢复,这里有3种简单有效的方法和视频教程!

我们今天将探讨如何在电脑格式化后恢复U盘数据。数据丢失是一个常见问题&#xff0c;尤其是当我们需要快速清理U盘或不慎执行了格式化操作时。在本文将分享几种简单而有效的方法&#xff0c;帮助您从格式化后的U盘中恢复数据。此外&#xff0c;我们还提供了相关的视频教程&…