“抓取再吸取的连续操作学习”研究工作发表于IEEE Trans. on Robotics:仿人手的柔性抓取,超人手的指背吸取!

长期以来,抓取一直被认为是机器人操作中一项重要而实际的任务。然而,实现对不同物体的稳健和有效的抓取具有挑战性,因为它涉及夹具设计、感知、控制和学习等。最近基于学习的方法在抓取各种新物体方面表现出优异的性能。然而,这些方法要么通常仅限于一种单一的抓取模式,要么需要更多的末端执行器来抓取各种物体。此外,末端手的设计和学习方法通常是单独开发的,这可能无法充分探索多模态抓取能力。

Hybrid Robotic Grasping With a Soft Multimodal Gripper and a Deep Multistage Learning Scheme | IEEE Journals & Magazine | IEEE Xplore

近期清华大学计算机系孙富春教授团队在IEEE Transactions on Robotics发表的工作,提出了多模式软体手,实现自主多级混合的机器人抓取。软抓手具有三种抓取模式(即包络、吸取和包络_然后_吸取),既可以处理不同形状的物体,也可以同时抓取多个物体。我们提出了一种与多模态夹持器相结合的新型混合抓取方法,以优化抓取动作的数量。我们评估了不同场景下的 DRL 框架(即,两种抓握类型的对象比例不同)。与单一抓取模式相比,所提出的算法被证明可以减少抓取动作的数量(即提高抓取效率,模拟中的最大值为 161.0%,真实世界实验中的最大值为 153.5%)。
在这里插入图片描述

一.抓手的设计

如图所示,这种夹持器设计成对称的,四个手指围绕垂直轴(重力方向)均匀分布,每个手指由软室、卡纸层、力传感器和吸盘组成[见 图 2(a)]。每个手指的弯曲都可以通过伺服驱动的肌腱拖动来实现。我们可以通过使用具有不同腿部角度的扭力弹簧来调整夹持器开口的限制尺寸。此外,安装在指尖背面的真空吸盘用于产生吸力。所有的空气通道都是独立的,尽管它们共享一个真空源,保证了稳定的吸力。此外,每个指尖都配备了一个压阻式压力传感器来获取接触力,还配备了一个姿态传感器来获取手指的姿势信息。这样的设计确保了精确的控制,并允许 SMG 以混合方式抓取多个异构对象。
在这里插入图片描述

我们通过参考 3-D 模型构建了 SMG 的原型,如图 2(d)-(f) 所示。我们使用两种类型的硅橡胶制造了手指的软致动器:较软的 Ecoflex 0050 和较硬的 Nasil 4230。我们使用柔性钓鱼线作为 U 形肌腱来驱动四个手指并实现不同模式的弯曲变形。此外,我们将由 18 层纸和弹簧钢片组成的卡纸层逐层堆叠在一起。然后,我们将它们塞入软室内,以实现有效的可变刚度,从而提高多模式抓取性能。增加腔室中的气压主要使手指变硬,而不会产生太大的弯曲变形。

二. 学习策略

抓取过程涉及物体检测、抓取选择和机器人(夹具)控制。由于 SMG 的可变结构和可变形特性,很难开发一个精确的模型来捕捉它的所有特征。此外,由于其高主动/被动自由度和约束,SMG 的规划和控制也并非微不足道。寻找一种策略来最小化抓取动作的数量本质上是一个顺序学习问题,其中 SMG 与不确定的抓取环境相互作用,其动作可能会影响未来的情况。因此,在这项工作中,我们使用强化学习来生成保证最佳抓取效率的多模态抓取动作。

如图所示:(a) Clor 和深度高度图是通过深度相机捕获的RGB-D 图像的投影变换生成的。高度图的边缘是根据机器人工作空间的边界预定义的。然后使用 Mask R-CNN 获得掩码。最后,我们得到深度掩码。(b) 三个深度 Q 网络将一个或两个对象的深度高度图(即局部属性)与所有对象的深度高度图(即全局属性)连接起来作为输入,并输出三个 Q 值矩阵。© 执行使 Q 值最大化的动作。对于包络动作,通过弯曲四指对目标对象进行包络抓取。对于吸取动作,一个吸盘对目标对象执行吸取。enveloping_then_sucking 动作是对两个目标对象分别和顺序执行的包络和吸取的组合。
在这里插入图片描述

三种抓取动作:包络、吸取和包络_然后_吸取。如图所示:(a) 夹具的包围和吸取姿势。为了包络目标物体,必须首先确定包络方向αe、包络旋转角度γe和夹持器张开距离d。然后进行预包络过程,包括绕 z 轴旋转角度 γe 和手指的弯曲位移以实现包络开口距离 d。最后,夹持器接近目标物体,进一步弯曲位移施加到手指以实现包围动作。对于吸取,必须首先导出吸取方位αs和吸取旋转角γs。然后执行预吸过程,包括手指的弯曲位移,然后绕z轴旋转角度γs,然后绕框架G的x轴旋转角度θs。最后,吸盘2 接近目标位置并执行吸取动作。 (b) 3D 抓取环境中三个动作中的每一个所涉及的过程。enveloping_then_sucking 动作是 enveloping 动作和 sucking 动作的组合。
在这里插入图片描述

三.结果

在本节中,我们使用一组实验评估 SMG 的性能以及我们提出的方法的有效性。首先,我们介绍训练数据集。其次,我们验证了我们的 SMG 的多模态抓取能力,并展示了我们的方法确保无碰撞抓取的能力。然后,我们训练我们的 DRL 算法并测试其适应基于模拟环境的多模态抓取的能力。最后,我们的混合抓取框架的准确性和效率在真实世界和模拟实验中得到了验证。通过混合抓取明显不同的物体来说明抓取效率,例如,更适合吸取的扁平物体和更适合包裹的圆形物体。

这些实验的目的阐明如下:

1)证明我们设计的软抓手在抓取不同种类的物体时具有良好的适应性和灵活性。

2)评估我们提出的算法的性能及其实现多模式自主抓取的能力。

3)研究两种物体的不同比例对抓取效率的影响,并验证我们的多模态抓取模式优于单一抓取模式。

  1. 用于训练和测试的数据集。我们的数据集涵盖 13 个对象类别,每个类别包含一个或多个子类型。模拟数据集是从一组 3-D 模拟模型生成的,这些模型随机分为训练集和测试集。我们使用模拟器 CoppeliaSim 为模拟中使用的每个子类型创建五种不同大小的对象。真实的数据集是从生活场景中收集的。
    在这里插入图片描述

  2. 多模态抓手的抓取演示。(a) 包络圆形物体。(b) 吸取平面物体。© Enveloping_then_sucking 两类对象。
    在这里插入图片描述

  3. 模拟和现实场景中四种情况的吸取方向优化。图像右上角的快照是每个状态的颜色高度图。包络和吸取的目标对象分别由红色和绿色矩形包围,它们是最小面积的边界框。
    在这里插入图片描述

  4. 训练表现。(a) 在培训步骤中掌握三种行动的效率。当系统选择正确的动作时,抓取效率显着提高(即,策略分别对适合包围和吸取的对象执行包围和吸取动作,并最大化完全成功的 enveloping_then_sucking 动作)。(b) 三种类型的动作在训练步骤的成功动作中的分布。enveloping_then_sucking 动作有两个成功标准(即拾取两个物体的完全成功动作和仅拾取一个物体的半成功动作)。完全成功的 enveloping_then_sucking 动作的比例在训练步骤中显着增加,有助于抓取效率的最大化。
    在这里插入图片描述

  5. 多模态抓取策略在模拟和真实测试中的表现。(a)–© 11 种不同比例的适合包封的物体的三种动作分布。每个比例对应一组包含 200 个动作并重复 3 次的实验。图 (d) 和 (e) 显示了三种动作在总实验中的分布,其中包含 11 组子实验(11 × 200 个动作)并重复 3 次。(f) 适合包封的不同比例物体的成功率和抓取效率。
    在这里插入图片描述

  6. 性能评估

为了评估我们训练的混合抓取模型的性能,我们在两种类型物体的不同比例的场景中测试了该方法,以测量抓取率和抓取效率。
在这里插入图片描述

五.总结

在这项工作中,我们开发了一个基于学习的机器人混合抓取框架,包括抓手设计、抓取建模、基于模拟的训练和模拟到真实的转移。我们的目标是尽量减少抓取动作的数量,以优化抓取效率。我们设计了一个包含四个手指的 SMG,每个指尖的背面都有一个真空杯。它具有多模态抓取能力,具有包覆、吸取和包覆再吸取三种抓取模式,使抓取器能够处理异质物体并同时抓取多个物体。所提出的混合抓取学习方法可以实现多阶段自主抓取,可用于充分探索 SMG 的能力。

我们在仿真环境使用 DRL 训练了我们的学习模型。我们在模拟和现实中测试了经过训练的模型。结果表明,三个执行动作的分布对工作空间中两类对象的比例敏感。执行的包裹和吸吮动作的数量分别与 Pe(即适合包裹和吸吮的物体比例)呈正相关和负相关。然而,enveloping_then_sucking 动作的执行次数只有在 Pe 接近 50% 时才会增加,并且在 Pe=50% 时达到最大值。我们的方法在模拟中获得了 93% 的平均成功率和 161% 的最大抓取效率,在真实机器人实验中达到了 88% 的平均成功率和 154% 的最大抓取效率。这表明我们的混合抓取模型优于传统的单一抓取模式方法,后者的抓取效率低于 100%。此外,我们的 DRL 策略能够处理新物体,并且可以可靠地从模拟转移到现实世界。该代码可在 https://github.com/fukangl/SMG-multimodal-grasping 获得。

未来的工作包括实施所提出的方法以在杂乱的环境中抓住指定的目标;例如,优化场景中的抓取动作,其中目标对象被具有不同特征的非目标对象包围并且不允许过头抓取。我们也有兴趣减小 SMG 的尺寸,以实现精细的操作和抓取任务,例如组装、表面处理和整形等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/241808.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++11特性篇】新的类功能解读:新增加的[移动构造函数/移动赋值运算符重载]

前言 大家好吖,欢迎来到 YY 滴C系列 ,热烈欢迎! 本章主要内容面向接触过C的老铁 主要内容含: 欢迎订阅 YY滴C专栏!更多干货持续更新!以下是传送门! YY的《C》专栏YY的《C11》专栏YY的《Linux》…

使用 Elasticsearch 检测抄袭 (二)

我在在之前的文章 “使用 Elasticsearch 检测抄袭 (一)” 介绍了如何检文章抄袭。这个在许多的实际使用中非常有意义。我在 CSDN 上的文章也经常被人引用或者抄袭。有的人甚至也不用指明出处。这对文章的作者来说是很不公平的。文章介绍的内容针对很多的…

Github 2023-12-24 开源项目日报 Top10

根据Github Trendings的统计,今日(2023-12-24统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Python项目5Jupyter Notebook项目2C项目1C项目1Go项目1Java项目1JavaScript项目1Ruby项目1 Serverless Frame…

双向长短期记忆网络(Bi-LSTM)-多输入回归预测

目录 一、程序及算法内容介绍: 基本内容: 亮点与优势: 二、实际运行效果: 三、部分代码展示: 四、完整代码下载: 一、程序及算法内容介绍: 基本内容: 本代码基于Matlab平台编…

vscode配置用户代码片段

1.左下角打开设置 2.新建全局代码片段 3.输入名字,名字随意不过最好语意化 4.创建模版 这里的模版为vue2常用代码片段,稍后会持续更新。 {"Print to console": {"prefix": "v2", //页面使用时名称"body":…

LeNet网络分析与demo实例

参考自 up主的b站链接:霹雳吧啦Wz的个人空间-霹雳吧啦Wz个人主页-哔哩哔哩视频这位大佬的博客 Fun_机器学习,pytorch图像分类,工具箱-CSDN博客 网络分析: 最好是把这个图像和代码对着来看然后进行分析的时候比较快 # 使用torch.nn包来构建神经网络. im…

Go 泛型之类型参数

Go 泛型之类型参数 文章目录 Go 泛型之类型参数一、Go 的泛型与其他主流编程语言的泛型差异二、返回切片中值最大的元素三、类型参数(type parameters)四、泛型函数3.1 泛型函数的结构3.2 调用泛型函数3.3 泛型函数实例化(instantiation&…

WARNING: HADOOP_SECURE_DN_USER has been replaced by HDFS_DATANODE_SECURE_USER.

Hadoop启动时警告,但不影响使用,强迫症的我还是决定寻找解决办法 WARNING: HADOOP_SECURE_DN_USER has been replaced by HDFS_DATANODE_SECURE_USER. Using value of HADOOP_SECURE_DN_USER.原因是Hadoop安装配置于root用户下,对文件需要进…

案例144:基于微信小程序的自修室预约系统

文末获取源码 开发语言:Java 框架:SSM JDK版本:JDK1.8 数据库:mysql 5.7 开发软件:eclipse/myeclipse/idea Maven包:Maven3.5.4 小程序框架:uniapp 小程序开发软件:HBuilder X 小程序…

Spring中的上下文工具你写的可能有bug

文章目录 前言功能第一种:ApplicationContext第二种方式:ApplicationContextAware第三种:BeanFactoryPostProcessor 源码第一种第二种第三种 前言 本篇是针对如何写一个比较好的spring工具的一个探讨。 功能 下面三种方式,你觉…

Odoo16 实用功能之Form视图详解(表单视图)

目录 1、什么是Form视图 2、Form视图的结构 3、源码示例 1、什么是Form视图 Form视图是用于查看和编辑数据库记录的界面。每个数据库模型在Odoo中都有一个Form视图,用于显示该模型的数据。Form视图提供了一个可编辑的界面,允许用户查看和修改数据库记…

[python]用python实现对arxml文件的操作

目录 关键词平台说明一、背景二、方法2.1 库2.2 code 关键词 python、excel、DBC、openpyxl 平台说明 项目Valuepython版本3.6 一、背景 有时候需要批量处理arxml文件(ARXML 文件符合 AUTOSAR 4.0 标准),但是工作量太大,阔以考虑用python。 二、方…

最新版 JESD79-5B,2022年,JEDEC 内存SDRAM规范

本标准定义了DDR5 SDRAM规范,包括特性、功能、交流和直流特性、封装以及球/信号分配。本标准旨在为x4、x8和x16 DDR5 SDRAM设备定义符合JEDEC标准的8 Gb至32 Gb的最低要求。该标准是基于DDR4标准(JESD79-4)和DDR、DDR2、DDR3和LPDDR4标准的一…

智能优化算法应用:基于金枪鱼群算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于金枪鱼群算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于金枪鱼群算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.金枪鱼群算法4.实验参数设定5.算法结果6.…

1856_emacs_calc使用介绍与故事

Grey 全部学习内容汇总: GitHub - GreyZhang/g_org: my learning trip for org-mode 1856_emacs_calc使用介绍与故事 calc是emacs内置的一个计算器,可以提供多种计算表达方式并且可以支持org-mode中的表格功能。 主题由来介绍 我是因为想要了解org-…

采草(动态规划)

先说说我的思路吧 下面是部分聊天记录 赤坂 龍之介 2023/12/22 11:06:04 就像我之前说的那样,我把每一个药草的价值除以时间,得出了新的价值评估标准:采摘这个药草时,每分钟的价值 赤坂 龍之介 2023/12/22 11:07:00 然后排…

2023年小型计算机视觉总结

在过去的十年中,出现了许多涉及计算机视觉(CV)的项目,无论是小型的概念验证项目还是更大规模的生产应用。应用计算机视觉的方法是相当标准化的: 1、定义问题(分类、检测、跟踪、分割)、输入数据(图片的大小和类型、视野)和类别(正是我们想要的) 2、注释…

Python算法例27 对称数

1. 问题描述 对称数是一个旋转180后(倒过来)看起来与原数相同的数,找到所有长度为n的对称数。 2. 问题示例 给出n2,返回["11","69","88&#x…

详解Vue3中的基础路由和动态路由

本文主要介绍Vue3中的基础路由和动态路由。 目录 一、基础路由二、动态路由 Vue3中的路由使用的是Vue Router库,它是一个官方提供的用于实现应用程序导航的工具。Vue Router在Vue.js的核心库上提供了路由的功能,使得我们可以在单页应用中实现页面的切换、…

QT编写应用的界面自适应分辨率的解决方案

博主在工作机上完成QT软件开发(控件大小与字体大小比例正常),部署到客户机后,发现控件大小与字体大小比例失调,具体表现为控件装不下字体,即字体显示不全,推测是软件不能自适应分辨率导致的。 文…