深度学习 autoencoder_笔记:李淼博士-基于模仿学习的机器人抓取与操控

说明:本文是Techbeat平台上李淼博士的讲座:“基于模仿学习的机器人抓取与操控”的总结笔记。

原视频

TechBeat - 让AI大有可为​www.techbeat.net

视频介绍

近四十年来,研究人员对机器人抓取的研究逐渐深入,涉及如机械臂设计、接触力学、机械臂运动学、物体抓取动力学等多个维度。尽管在学术界取得了长足的进步,但是将这些理论知识运用到工业届和现实应用中仍然存在不小的困难。在本次演讲中,首先将从以物体为中心的角度总结机器人抓取面临的主要挑战,以此来阐述实验室算法与工业应用之间的障碍。

然后,李淼博士将介绍库柏特科技最近的工作进展:开发一个统一的、基于学习的系统来展示各种机器人抓取的过程的系统。基于模仿学习,很多工业机器人抓取任务可以被快速部署、优化并适应各种场景。此外,他将通过一些实际案例来说明如何构建一个稳定的、可以抓取超过10万个不同的对象的物流拣选系统。

笔记

1.传统基于物理模型的方法:

可以分成手的动力学模型、物体的动力学模型,但是手的模型中的摩擦力是无法测量的,这部分无法建模。同时物体的重力和惯性模型也是无法测量的,只有提前对物体建模才行,无法适应于所有问题,同时还有一些外界干扰力

3b64de15de57685d626498772445a4ad.png

2.经典抓取方法

一般抓取的时候先将物体模型存入database中,在进行抓取的时候,首先对物体进行识别(object recognition),看它是可以归属为database中的哪一类,然后通过姿态检测(pose estimation)确定物体姿态,从而在匹配数据库中的最优抓取点(grasp selection)。

56730337cd06d58d3b9be77667a37452.png

2.1场景分割

将不同物体在场景中分割出来,区分出是不同的物体。

2.2目标检测与表示

对物体进行表示,是通过深度图?还是polyhedron?还是通过语义的方式?同时,怎么去对物体进行识别?

f9d69809d5f8ffa5761a2f115e0f8365.png

2.3抓取

传统方法中,有基于搜索的抓取方法,也有基于优化的抓取方法。搜索的类似工作可以参考find antipodal point on irregular object,然后再进行抓取质量评估。优化方法要对物体外形进行隐式建模,如果建模成point cloud这种离散点,就没办法进行穷尽搜索优化,然后找到所有的约束,再通过优化抓取较为简单的物体,同时耗时极长。

a5bf0baef13a6714994cb45f699cd12e.png

2.4抓取执行

抓取执行需要是一个序列化的过程,如何确定动作序列也是问题

fafaf07806cf4e5dfc60cac2ec1ad6b7.png

2.5经典方法的问题

08584fcb3cbee852e032f44301897220.png

3.新方法

3.1如何解决老问题

仿真解决标签和验证问题,更多的传感器反馈包括视觉及触觉,深度学习则对这些传感器信息进行建模。

1c00a6eaab389da97a8e6206019b5a79.png

3.2场景分割

3e2dc3675cd712889faf379db73bb9ef.png

3.3物体表示识别

传统方法中,点云有限制,而如今可以使用点云补全技术。

f822dcf8a8f1afa329d19b27d5a9bc2e.png

3.4抓取规划

基于仿真数据确定抓取policy

a7c00f4d130350ce3a0ba9f7436a2316.png

知道很多的3D形状,可以通过物理引擎仿真,来在仿真模型中生成多个抓取点,然后通过物理引擎判断是否抓取成功,最后生成抓取成功的policy或者net。但是需要确定物理引擎是否足够好,policy是否具有泛化能力?其实基于深度学习的算法和以往的方法本质都是基于搜索的方法,只不过深度学习可以融合多模态进行了一个特征提取,建议所有人看一些autoencoder decoder的内容。

de1eda491416feb9ee038f8f163332aa.png

3.5运动执行

第一个14年的论文,就是典型的基于数据的学习,只关注已知的传感器信息,如触觉、物体外形。然后采集大量的数据,通过高斯混合模型拟合找到最合适的抓取位置。

22c622ae88418db5edc8a714a06b3605.png

第二篇论文:非常有挑战性的工作,根据实时反馈,调整抓取策略,形成closed loop。

f03394a3589260a04d89ea226ac683c1.png

第三篇 谷歌端到端

ad95fbf77457bbb61e1cc002eca7d6c2.png

4.未来方向

5912b1f1bef6537392dc75bf4215e899.png

5.From Lab to production

问题

从哪获取train data,无限的testing data如何保证都可以work,deep learning部分的运行时间?nice result需要根据客户确定准确率,可能需要99.9999%

问题总结:

1.deeplearning的一个的概率性的方法,而工业要求确定性。

2.数据在工业上十分贵。

3.工业要求成功率极高,可能需要99.9999%。

4.工业上有很多conner case。

5.工业上的1ms十分重要,实时性问题。

6.风险问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/551760.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux临时挂载别的文件目录_linux基础05:linux系统目录有哪些?命令行界面如何切换目录?...

我们安装好linux系统后,linux系统也会像windows系统一样,自动生成很多的文件和目录,这些目录都包含了不同的含义。下面,我们就来介绍一下这些目录都代表着什么?以及,在命令行界面,我们如何在不同…

抽象方法可以有方法体_什么方法可以祛斑?祛斑的方法有哪些?

现在是一个看脸的时代,可能不那么准确,但是也说明了人们对于美好脸蛋的追求。完美的脸蛋必定是光滑白皙没有瑕疵的,而有了色斑就会损害整个人的颜值。祛斑的方法有哪些?若是您正深受长斑的烦恼,小编专门寻找了一些简单有效的祛斑…

炫界 (978) -(建工发现应用克隆漏)_除了DMA,这些漏损点检测与漏损区域识别技术你知道么?...

漏损问题在给水管网中是普遍存在且难以避免的。据《2018年城市供水统计年鉴》显示,载入年鉴的各城市在2017年的管网漏损总量超过60亿m3,平均漏损率为14.56%,这与“水十条”明确规定的控漏目标相比仍存有差距。与此同时,居高不下的…

go语言 mysql卡死_一次mysql死锁的排查过程-Go语言中文社区

一次mysql死锁的排查过程一、背景17号晚上要吃饭了,看旁边的妹子和佐哥还在调代码,就问了下什么问题啊,还在弄,妹子说,在测试环境测试给用户并发发送卡券时,出现了死锁,但看代码没有死锁&#x…

怎么格式化电脑_U盘格式化后数据能恢复吗?人人都能学会的恢复方法!

获取专业数据恢复软件:专注硬盘U盘误删文件数据恢复软件免费下载​dl-next.aunbox.cn数据恢复官网:嗨格式数据恢复大师官网 - 专业U盘/电脑/硬盘数据恢复软件_免费下载​huifu.hgs.cnU盘格式化后数据能恢复吗?U盘在我们生活中算是比较常用的数…

java 运算符_详解Java表达式与运算符

课程导言【变量的赋值与计算都离不开表达式,表达式的运算依赖于变量、常量和运算符。本节课讨论Java的表达式的构成、常量的定义、运算符的分类及应用。通过本课的学习你将掌握运用表达式和运算符完成变量赋值、条件判断、数学运算、逻辑运算等功能操作】在讲述课程…

将你一张表的值覆盖_精准度可达亚米级,山东“北斗一张网”向社会免费开放...

齐鲁晚报齐鲁壹点记者张阿凤通讯员苏彬8月21日,山东省北斗卫星导航定位基准站网(以下简称“北斗一张网”)推广应用座谈会在济南举行。“北斗一张网”自2019年8月建成后,现已免费向社会提供实时、动态、高精度的卫星导航定位基础服务,在自然资…

okhttp 工具类_日语学习工具推荐,小白必备!

有很多同学问我,有没有好用的日语学习工具?当然有啦~这些学习工具大概分为辞典类、翻译类、日语知识类等等。今天呢,在自身使用的工具里挑选了下面8个学习工具网站,适合各个学习阶段,从日语初级到精通,它们…

des和aes相比较有哪些特点_栓流气力输送相比较传统的高速气力输送方式而言,有哪些优势?...

南京翔瑞粉体:“气力输送”是指运用物料载体压缩空气(或气体),将散装物料从一处输送到另一处的输送系统,与传统的输送机械相比,气力输送系统在输送过程中不易出现沾染粉尘、受潮、污损等现象,并…

32位java虚拟机_微软Java虚拟机-Microsoft VM32位下载V5.0.3805.0安装版-MicrosoftJavaVirtualMachine西西软件下载...

Microsoft VM32位是一款微软Java虚拟机(Microsoft Java Virtual Machine),为IE浏览器提供Java支持。Microsoft VM for Java 是在由Microsoft开发类别 Servers Shareware 软件。安装在WinNT上之前必须打有 NT4 Service Pack 3 以上。安装检测检查是否已安装 Microsof…

iframe src 传参数_剧本杀测评|本友投稿——蜀山传(非剧透)

点击蓝字关注“我爱剧本杀”以下内容不会剧透请放心阅读本友投稿——《蜀山传》前言:这一次的“本友测评”真的是早早早早早鸟测评了,更加难得的是,这一次是曾经制作发行过《夜来香》的发行团队小本买卖和作者紧张齐聚南宁并亲自带本&#xf…

gnss单频软件接收机应用与编程_GNSS/GPS RTK定位 (手机,无人车定位,无人驾驶,因子图优化)...

Global navigation satellite system (GNSS)是手机或者无人车定位中的关键一个部分。GNSS是当前主要的可以提供绝对定位信息的一种信息来源。无人车的基于地图匹配定位的这一个部分中,GNSS经常用来提供初始化。就目前来看,GNSS的定位方式主要包括单点定位…

windows系统改装为linux系统_Linux怎么克隆系统?备份系统跟Windows系统有区别吗?...

请关注本头条号,每天坚持更新原创干货技术文章。如需学习视频,请在微信搜索公众号“智传网优”直接开始自助视频学习1. 前言本文主要讲解在Linux系统中怎么克隆系统镜像、克隆分区、整盘克隆。它跟Windows系统有何区别?您可能想要克隆Linux分…

c++ hough变换代码_hough变换原理以及实现(转载)

原理链接如下:陌归:霍夫(Hough)变换之直线检测代码链接:Ganso:Fundamentals——从车道线检测谈到霍夫变换同样是一篇讲解原理的番外,这一篇主要讲解CV中常用的霍夫变换的数学原理。霍夫变换的由…

java filter url匹配规则_java过滤器filter使用

一:filter:过滤器,拦截servlet的请求和响应。1、1 package jd.com.filter;23 import javax.servlet.*;4 import java.io.IOException;56 public classMyFilter implements Filter {7 Override8 public voiddestroy() {910 }1112 Override13 public voidi…

怎么对document.write写出来的内容调整对齐方式_干不过写PPT的?麦肯锡老阿姨教你4招...

PPT是我真正花过10,000小时以上的技能,毕竟在麦肯锡呆了7年。麦肯锡PPT重视内容与逻辑,我改行做营销后又开始注意视觉效果。怎么干过我们这些画PPT的?:)从内容到形式,我来讲讲4步流程,有助于提高效率。/ 01…

iphone查看删除的短信_苹果删除的短信

苹果删除的短信怎么恢复?大家在使用手机的时候,有些没用的短信就习惯清除了,但是有时候比较重要的短信很可能也会误删,后期想要找确又找不到,那么苹果删除的短信能恢复吗?怎么恢复呢?下面就来详细介绍一下。苹果删除的短信怎么…

vscode代码运行时间工具_代码编辑器横评:为什么 VS Code 能拔得头筹

2015 年 4 月 29 日的 Build 大会上,微软发布了 Visual Studio Code 第一个预览版本。短短四年时间里,VS Code 高速成长。根据 2019 年 2 月的 PYPL Top IDE index 的排名,VS Code 的涨势迅猛,在所有编辑器与 IDE 中排名第六&…

ie浏览器网页版进入_Win10系统中IE和edge浏览器无法打开网页如何解决

Win10系统中IE和edge浏览器无法打开网页如何解决最近有Win10系统用户们反馈最新Win10系统中的IE和edge浏览器都无法上网,打不开网页,而第三方浏览器却可以,遇到这样的情况该如何解决呢?引起IE和edge浏览器无法打开网页的可能原因&#xff0c…

cad插件_CAD素材与插件合集

CAD素材与插件合集CAD字体包下载链接:https://pan.baidu.com/s/16Wq4boqm254qJNJG5fD5EA提取码:h28nCAD经典模式下载链接:https://pan.baidu.com/s/18U6vSetQxg6bCNJDElZtFA提取码:wlje电气符号下载链接:https://pan.b…