感知算法、规划地图……波士顿动力揭秘Atlas机器人跑酷背后的技术

来源:机器之心,编辑:nhyilin

仅用于学术分享,版权属于原作者

几天前,波士顿动力公司放出了双足人形机器人 Atlas 的最新酷炫视频。这次,Atlas 展示了它的最新技能「跑酷」。

在一系列倾斜胶合板还有木箱垒成的阶梯以及平衡木的场景挑战中,Atlas 如履平地,表现堪称完美。

其实三年前,波士顿动力就曾发布过 Atlas 跑酷的视频。不过当时,Atlas 跑起来显得更僵硬,步伐也稍显沉重。

早期 Atlas 跨越障碍的视频。

短短几年时间,从硬件和外观层面与先前没有太大区别的 Atlas 在运动方式上有了显著提升,平衡感也显然更好。

波士顿动力在背后进行了哪些技术改进和创新呢?机器人需要具备哪些条件才能像人一样奔跑、跳跃和跨越障碍呢?

波士顿动力高级机器人工程师、Atlas 感知软件开发负责人 Pat Marion 为大家详尽地解读了 Atlas 跑酷背后的技术。

跑酷认知能力

机器人感知算法的目的是将相机和雷达等传感器中的数据转换为对决策制定和规划形体动作有益的东西。虽然 Atlas 使用集成 IMU、联合位置和力传感器来控制自身的肢体动作,并通过感知地面来保持平衡,但它需要利用感知来识别和导航以下动图 1 中的间隙和窄梁等障碍。


深度相机拍摄的 Atlas 机器人的点云旋转视图。

Atlas 使用 TOF 深度相机以每秒 15 帧的速度生成环境的点云,点云是测距的大规模集合。Atlas 的感知软件使用一种名为多平面分割的算法从点云中提取平面。多平面分割算法的输入馈入到一个映射系统中,该系统为 Atlas 通过相机看到的各种不同对象构建模型。

下图 2 显示了 Atlas 的视觉「所见」以及如何使用这种视觉感知来规划行为。左上角是深度相机拍摄的红外图像。主图像中的白点形成点云。橙色轮廓标记了检测到的跑酷障碍物的矩形面,随着时间的推移从传感器观察结果中对其进行跟踪。然后将这些检测到的对象用于规划特定行为。例如,绿色的脚步代表下一步要跳到哪里。

具有感知输出的 Atlas 渲染。

为了执行扩展的跑酷行为,波士顿动力的研发团队为机器人提供了一张高级地图,其中包括研发人员希望它去的地方以及沿途它应该做的动作。该地图与真实路线的几何形状不完全匹配,而是一个包含障碍模板和注释动作的近似描述。Atlas 使用这些稀疏信息来导航,并使用实时感知数据来填充细节。

例如,Atlas 知道要寻找要跳的盒子,如果盒子向侧面移动 0.5 米,Atlas 会找到它的新位置并跳到那里。但如果盒子被移得太远,那么系统将找不到它并停下来。

波士顿动力机器人跑酷视觉「看到」和规划的信息。

这是一个 3D 可视化动画,主动跟踪的物体以绿色绘制,并在脱离机器人感知传感器的视野时从绿色淡化为紫色。跟踪系统持续估计物体姿态,导航系统利用地图上的信息来规划与这些物体相关的绿色足迹。

Atlas 行为库

Atlas 在跑酷中所做的每个动作都源自使用轨迹优化提前创建的模板。通过创建这些模板库允许研究者向库中添加新的轨迹,从而可以不断为机器人添加新的功能。给定感知计划目标,机器人从库中选择与给定目标尽可能匹配的行为。

通过离线设计进行轨迹优化,工程师能够提前以交互方式探索机器人能力的极限,并减少机器人的相关计算量。例如,由于驱动等物理限制,机器人如何精确协调其四肢以启动和进行后空翻,这些细节可能对机器人的成功产生重大影响。

利用离线优化,研究者可以在设计时捕获这种类似的重要约束,并使用单个通用控制器在线调节机器人。

上图机器人行为是使用离线轨迹优化设计的复杂行为,同时在线控制器将模板动作变成现实。

模型预测控制

在确定了机器人前面的箱子、坡道或障碍物,并计划了一系列操作以越过它们后,剩下的挑战就是机器人如何可靠地执行计划所需的所有细节。

Atlas 控制器被称为模型预测控制器(model-predictive controller, MPC),该控制器使用机器人动力学模型来预测机器人未来的动作。控制器的工作原理是通过优化来计算机器人当前要做的最优事情,从而随着时间的推移产生最佳动作。正如前文所述,行为库中的每个模板会向控制器提供什么解决方案是最佳的选择。

控制器会调整机器人的力、姿势和行为时间等细节,以应对环境、脚滑或其他实时因素带来的影响。拥有一个能够显著偏离模板动作的控制器可以简化行为创建过程,这意味着不用逐个匹配机器人遇到的每一个细节。例如,机器人从 52 厘米高的平台上跳下和从 40 厘米高的平台上跳下并没有什么不同,MPC 会解决细节问题。

以第一视角显示了 Atlas 感知和规划的路径。蓝色箭头为 MPC 预测的机器人在整个移动过程中的质心和动量。

MPC 的预测特性还允许 Atlas 跨越行为边界来查看后续动作。例如,知道跳跃之后是后空翻,控制器可以自动创建从一个动作到另一个动作的平滑过渡。这再次简化了机器人行为创建问题,因为我们不需要提前考虑所有可能的行为序列。当然,MPC 预测也存在局限性,例如,机器人尝试从快进慢跑动作过渡到后空翻是行不通的。一般来说,必须在控制器复杂性和行为库大小之间取得平衡。

Atlas 展示了接近于人类的跑酷能力,对于波士顿动力来说如何在 Atlas 上创建和控制广泛的动力学行为有了深刻的了解。更重要的是,它为设计一个可扩展的软件系统创造了机会,该软件系统将与团队一起成长。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483973.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

BGP协议

概述 BGP是目前“唯一”的EGP协议,用于AS之间传递路由信息,目前版本为4 为什么需要BGP? 不同AS自治系统的管理部门不同,路由策略不同AS之间的路由不强调最优路径,更强调路由控制和路由策略 IGP与BGP对比 IGP关注如…

Science Robotics:新型多足机器人可自行组装,零件损坏时也能继续运动

来源:DeepTech深科技在自然环境中,群体昆虫(如蜜蜂、蚂蚁、白蚁等)、鱼类和鸟类等动物可以通过合作来完成生物个体难以或不可能完成的任务。受到这些集群行为的启发,许多研究人员研究了自组装或可重构的模块化群机器人…

NAT与DHCP协议

DHCP概述 DHCP产生的原因 大型网络中静态配置IP地址容易出现地址冲突 定义 DHCP:动态主机配置协议,用于主机自动获得IP地址、子网掩码、网关地址、DNS服务器地址,租用期等相关信息。采用C/S模式。DHCP给运行服务器软件、且位置固定的计算机…

OpenGL基础入门及准备

一、计算机图像学相关概念 1.1 计算机图形学,是一种使用数学算法将二维或三维图形转化为计算机显示器所能显示的二维栅格形式的科学。 1.2 屏幕像素组成的网格即称为栅格。 1.3 计算机图形学研究 Modeling:构造场景的三维模型,建模&#…

哈佛商业评论:什么是颠覆性创新?

来源:点滴科技资讯什么是颠覆性创新?在引入该理论 20 年后,我们重新审视了它所解释的和未解释的。本文发表于哈佛商业评论(2015 年 12 月) 作者:克莱顿 M.克里斯滕森, 迈克尔E雷诺,和…

定长掩码地址划分与VLSM子网划分

定长掩码地址划分 案例 若某个公司得到一个C类网络地址210.33.15.0,假如所有子网的掩码都一样,该如何划分子网? 步骤一:确定子网个数 7个子网,其中4个局域网,3个广域网 步骤2:确定每个子网所需…

OpenGL之几何、投影、裁剪、视口变换以及全局变换与局部变换

一、变换的概念 1.1 图形流水线 1.2 变换(Transformation) 变换主要分为四个步骤,主要就是在Vertex operations阶段操作顶点信息,会在流水线中依次进行。 几何变换投影变换裁剪视口变换 三维模型到二维图形的主要变换过程&am…

WinForm中DataGridView的TextBoxColumm换行

一、内容超过显示宽度自动换行: 在需要自动换行的列中设置 二、换行符换行: 一开始在需要换行的文本添加"\r\n"并不能直接换行,DGV直接把\r\n显示出来了,后换成 System.Environment.NewLine 解决问题转载于:https://www…

刷脸背后,卷积神经网络的数学原理原来是这样的

来源:深度学习这件小事计算机视觉技术在日常生活中有着非常普遍的应用:发朋友圈之前自动修图、网上购物时刷脸支付……在这一系列成功的应用背后,卷积神经网络功不可没。本文将介绍卷积神经网络背后的数学原理。在自动驾驶、医疗以及零售这些…

OpenGL之坐标系以及单位

1.1 OpenGL中默认的坐标系为右手坐标系,默认视点位置为原点,原点正好投影在投影窗口的中心,也正好投影在视口的中心。 1.2 在OpenGL中无绝对单位,只有相对的大小,相对于视锥体的大小来设定物体的大小。 1.3 通过估算…

人工智能设计芯片,比你想象的更大胆

来源:ZDNet作者:Tiernan Ray编译:科技行者AI(人工智能)技术正在越来越多地被应用于半导体设计之中,这种做法的优势之一是,人工智能技术会尝试人类想都不敢想的设计方案。例如,对边际…

OpenGL之相关库介绍及基本语法、The OpenGL Machine

1.1 OpenGL Library核心库 包括115个函数,前缀为 :gl,主要在gl.h、openGL32.lib,openGL32.dll中; 1.2 OpenGL utility library 实用程序库 包含43个函数,前缀:glu;主要为核心库的…

JavaWeb从开发环境搭建,到第一个servlet程序(图文)

## 开学到今天,已经是第三周了~ 然而这门课的教材还没发~ 滋滋滋 表示很“蓝瘦”~~~ Java Web开发环境搭建 1、 下载安装Tomcat 官网地址:http://tomcat.apache.org/ 选择Tomcat 8 -- (如图所示) --选择 zip 文件 --下载后,将压缩包中的…

远望智库未来产业研究院与资本实验室联合发布《2021全球区块链应用市场报告》...

来源:远望智库预见未来从以比特币为代表的区块链1.0时代;到以智能合约为媒介,以金融应用为核心的区块链2.0时代;再到区块链应用于政务服务和更广泛的各行业,并开始推动信息互联网向价值互联网靠拢,短短10余…

因特网的硬件组成

终端系统 主机、服务器、PDA 通信介质 有线介质:双绞线、同轴电缆、光纤无线介质:无线电波、卫星 中间设备 路由器、交换机等 路由器 路由器的产生 由思科公司创始人伯塞克发明 路由器的特性和作用 存储转发机制连接异构的网络 交换机 交换机的…

OpenGL之光照明模型、Phong光照模型与Blinn-Phong光照模型

1.1 光照效果 通过光照,能反映模型的空间几何形态,通过光照明模型,计算模型表面任一点被光照后投射到观察者眼中的光亮度的大小。光照的计算就是计算投射到观察者眼中的光,这部分光与物体与光源的位置、物体与视点、物体表面的材质…

谈人工智能:深度学习对老牌AI

来源:李晓榕科学网博客链接地址:http://blog.sciencenet.cn/blog-687793-1300748.html学:学生,教:教师,李:李晓榕李:三代人工智能都各有所本、各有所倚,也就各有所偏&…

OpenGL之Phong光照模型和Blinn-Phong光照模型的局限性、OpenGL光照参数设置与光照模式

一、相关概念 1.1 Phong、Blinn-Phong光照模型是一种简单光照模型,它仅考虑了光源直接照射的效果,没有考虑非直接光照的效果。如下直接光照与间接光照。 1.2 上述模型在考虑间接光照(环境光)时,采用的是一个常数来表…

OpenGL之图形流水线中的光照计算、明暗处理

1.1 光照计算发生在图形流水线的Vertex Operations中,只计算每个顶点的颜色,而三角形内部的点的颜色在Fragment Operations阶段通计算,这样效率高,因为像素的数量远远大于顶点的数量。 1.2 计算三角形内每个像素的颜色的过程&am…

教学5层网络体系结构——分层之后数据的发送和接收

协议分层后数据发送过程 发送方层层封装 接收方层层解封装 唯一加尾部的是数据链路层 思考 发送方某层封装完如何知道该交给哪个下层封装? 应用层选择传输层由应用程序决定,传输层选择网络层由固定的搭配,例如因特网只有IP协议&#x…