机器人视觉三维成像技术全解析

2531f19867fd7194dad53feed182d271.png

来源:卢荣胜,史艳琼,胡海兵. 机器人视觉三维成像技术综述[J]

链接:

http://www.opticsjournal.net/Articles/Abstract/lop/57/4/040001.cshtml

原题:机器人视觉三维成像技术综述

摘要

本文针对智能制造领域机器人视觉感知中的三维视觉成像技术进行综述,系统地总结了一些有代表性的机器人视觉成像方法的特点和实际应用中的局限性,内容涉及飞行时间三维成像、点线扫描三维成像、色散共焦成像、结构光投影三维成像、光学偏折成像、单目与多目立体视觉三维成像和光场成像等。绘制了各种视觉成像的图谱,并探讨了机器人手眼系统最佳三维成像方法。

在工业4.0时代,国家智能制造高速发展,传统的编程来执行某一动作的机器人已经难以满足现今的自动化需求。在很多应用场景下,需要为工业机器人安装一双眼睛,即机器人视觉成像感知系统,使机器人具备识别、分析、处理等更高级的功能,可以正确对目标场景的状态进行判断与分析,做到灵活地自行解决发生的问题。

88a4564b9e13dc201d12e9e49c170f25.png

一、机器视觉系统组成

典型的机器视觉系统可以分为:图像采集部分、图像处理部分和运动控制部分。基于PC的视觉系统具体由如图1所示的几部分组成:

362e48312a0412f8410f212a54865ae6.png

881923b383c23289ef4ad48fde89870e.png

图1  机器视觉系统组成

①工业相机与工业镜头——这部分属于成像器件,通常的视觉系统都是由一套或者多套这样的成像系统组成,如果有多路相机,可能由图像卡切换来获取图像数据,也可能由同步控制同时获取多相机通道的数据。根据应用的需要相机可能是输出标准的单色视频(RS-170/CCIR)、复合信号(Y/C)、RGB信号,也可能是非标准的逐行扫描信号、线扫描信号、高分辨率信号等。

②光源——作为辅助成像器件,对成像质量的好坏往往能起到至关重要的作用,各种形状的LED灯、高频荧光灯、光纤卤素灯等都容易得到。

③传感器——通常以光纤开关、接近开关等的形式出现,用以判断被测对象的位置和状态,告知图像传感器进行正确的采集。

④图像采集卡——通常以插入卡的形式安装在PC中,图像采集卡的主要工作是把相机输出的图像输送给电脑主机。它将来自相机的模拟或数字信号转换成一定格式的图像数据流,同时它可以控制相机的一些参数,比如触发信号,曝光/积分时间,快门速度等。图像采集卡通常有不同的硬件结构以针对不同类型的相机,同时也有不同的总线形式,比如PCI、PCI64、Compact PCI,PC104,ISA等。

⑤PC平台——电脑是一个PC式视觉系统的核心,在这里完成图像数据的处理和绝大部分的控制逻辑,对于检测类型的应用,通常都需要较高频率的CPU,这样可以减少处理的时间。同时,为了减少工业现场电磁、振动、灰尘、温度等的干扰,必须选择工业级的电脑。

⑥视觉处理软件——机器视觉软件用来完成输入的图像数据的处理,然后通过一定的运算得出结果,这个输出的结果可能是PASS/FAIL信号、坐标位置、字符串等。常见的机器视觉软件以C/C++图像库,ActiveX控件,图形式编程环境等形式出现,可以是专用功能的(比如仅仅用于LCD检测,BGA检测,模版对准等),也可以是通用目的的(包括定位、测量、条码/字符识别、斑点检测等)。

⑦控制单元(包含I/O、运动控制、电平转化单元等)——一旦视觉软件完成图像分析(除非仅用于监控),紧接着需要和外部单元进行通信以完成对生产过程的控制。简单的控制可以直接利用部分图像采集卡自带的I/O,相对复杂的逻辑/运动控制则必须依靠附加可编程逻辑控制单元/运动控制卡来实现必要的动作。

二、机器人视觉成像的结构形式

机器人视觉系统的主要功能是模拟人眼视觉成像与人脑智能判断和决策功能,采用图像传感技术获取目标对象的信息,通过对图像信息提取、处理并理解,最终用于机器人系统对目标实施测量、检测、识别与定位等任务,或用于机械人自身的伺服控制。

在工业应用领域,最具有代表性的机器人视觉系统就是机器人手眼系统。根据成像单元安装方式不同,机器人手眼系统分为两大类:固定成像眼看手系统(Eye-to-Hand)与随动成像眼在手系统(Eye-in-Hand, or Hand-eye),如下图2所示。

002c2a089f1b05972520639da22c1e14.png

图2   两种机器人手眼系统的结构形式

a)眼在手机器人系统,(b)眼看手机器人系统

有些应用场合,为了更好地发挥机器人手眼系统的性能,充分利用固定成像眼看手系统全局视场和随动成像眼在手系统局部视场高分辨率和高精度的性能,可采用两者混合协同模式,如用固定成像眼看手系统负责机器人的定位,使用随动成像眼在手系统负责机器人的定向;或者利用固定成像眼看手系统估计机器人相对目标的方位,利用随动成像眼在手系统负责目标姿态的高精度估计等,如图3所示。

58b77f1628985ac5c6e44fb07d2f8c3c.png

图 3   机器人协同视觉系统原理图

三、机器人视觉三维成像方法

3D视觉成像可分为光学和非光学成像方法。目前应用最多的还是光学方法,其包括:飞行时间法、激光扫描法、激光投影成像、立体视觉成像等。

飞行时间3D成像

飞行时间(TOF)相机每个像素利用光飞行的时间差来获取物体的深度。目前已经有飞行时间面阵相机商业化产品,如Mesa Imaging AG SR-4000, PMD Technologies Cam Cube 3.0,微软Kinect V2等。

TOF成像可用于大视野、远距离、低精度、低成本的3D图像采集,其特点是:检测速度快、视野范围较大、工作距离远、价格便宜,但精度低,易受环境光的干扰。例如Camcueb3.0具有可靠的深度精度(<3mm @ 4m),每个像素对应一个3D数据。

扫描3D成像

扫描3D成像方法可分为扫描测距、主动三角法、色散共焦法。扫描测距是利用一条准直光束通过1D测距扫描整个目标表面实现3D测量的。主动三角法是基于三角测量原理,利用准直光束、一条或多条平面光束扫描目标表面完成3D成像,如图4所示。色散共焦通过分析反射光束的光谱,获得对应光谱光的聚集位置, 如图5所示。

9cfea5203263c80a485ea5b623a131a3.png

图 4   线结构光扫描三维点云生成示意图

fff61b28738e32fe6c39076e096d7c34.png

图 5   色散共焦扫描三维成像示意图

扫描3D成像的最大优点是测量精度高。其中色散共焦法还有其它方法难以比拟的优点,如非常适合测量透明物体、高反与光滑表面的物体。但缺点是速度慢、效率低;用于机械手臂末端时,可实现高精度3D测量,但不适合机械手臂实时3D引导与定位,因此应用场合有限。另外主动三角扫描在测量复杂结构面形时容易产生遮挡,需要通过合理规划末端路径与姿态来解决。

结构光投影3D成像

结构光投影三维成像目前是机器人3D视觉感知的主要方式。结构光成像系统是由若干个投影仪和相机组成,常用的结构形式有:单投影仪-单相机、单投影仪-双相机、单投影仪-多相机、单相机-双投影仪和单相机-多投影仪等。结构光投影三维成像的基本工作原理是:投影仪向目标物体投射特定的结构光照明图案,由相机摄取被目标调制后的图像,再通过图像处理和视觉模型求出目标物体的三维信息。

根据结构光投影次数划分,结构光投影三维成像可以分成单次投影3D和多次投影3D方法。单次投影3D主要采用空间复用编码和频率复用编码形式实现。由于单次投影曝光和成像时间短,抗振动性能好,适合运动物体的3D成像,如机器人实时运动引导,手眼机器人对生产线上连续运动产品进行抓取等操作。但是深度垂直方向上的空间分辨率受到目标视场、镜头倍率和相机像素等因素的影响,大视场情况下不容易提升。

多次投影3D具有较高空间分辨率,能有效地解决表面斜率阶跃变化和空洞等问题。不足之处在于:

1)对于连续相移投影方法,3D重构的精度容易受到投影仪、相机的非线性和环境变化的影响;

2)抗振动性能差,不合适测量连续运动的物体;

3)在Eye-in-Hand视觉导引系统中,机械臂不易在连续运动时进行3D成像和引导;

4)实时性差,不过随着投影仪投射频率和CCD/CMOS图像传感器采集速度的提高,多次投影方法实时3D成像的性能也在逐步改进。

对于粗糙表面,结构光可以直接投射到物体表面进行视觉成像;但对于大反射率光滑表面和镜面物体3D成像,结构光投影不能直接投射到被成像表面,需要借助镜面偏折法。

偏折法对于复杂面型的测量,通常需要借助多次投影方法,因此具有多次投影方法相同的缺点。另外偏折法对曲率变化大的表面测量有一定的难度,因为条纹偏折后反射角的变化率是被测表面曲率变化率的2倍,因此对被测物体表面的曲率变化比较敏感,很容易产生遮挡难题。

立体视觉3D成像

立体视觉字面意思是用一只眼睛或两只眼睛感知三维结构,一般情况下是指从不同的视点获取两幅或多幅图像重构目标物体3D结构或深度信息,如图6所示。

272348a61e6f319a1755eb0ad14a1791.png

图6  立体视觉三维成像示意图

立体视觉可分为被动和主动两种形式。被动视觉成像只依赖相机接收到的由目标场景产生的光辐射信息,该辐射信息通过2D图像像素灰度值进行度量。被动视觉常用于特定条件下的3D成像场合,如室内、目标场景光辐射动态范围不大和无遮挡;场景表面非光滑,且纹理清晰,容易通过立体匹配寻找匹配点;或者像大多数工业零部件,几何规则明显,控制点比较容易确定等。

主动立体视觉是利用光调制(如编码结构光、激光调制等)照射目标场景,对目标场景表面的点进行编码标记,然后对获取的场景图像进行解码,以便可靠地求得图像之间的匹配点,再通过三角法求解场景的3D结构。主动立体视觉的优点是抗干扰性能强、对环境要求不高(如通过带通滤波消除环境光干扰),3D测量精度、重复性和可靠性高;缺点是对于结构复杂的场景容易产生遮挡问题。

基于结构光测量技术和3D物体识别技术开发的机器人3D视觉引导系统,可对较大测量深度范围内散乱堆放的零件进行全自由的定位和拾取。相比传统的2D视觉定位方式只能对固定深度零件进行识别且只能获取零件的部分自由度的位置信息,具有更高的应用柔性和更大的检测范围。可为机床上下料、零件分拣、码垛堆叠等工业问题提供有效的自动化解决方案。

机器视觉3D引导系统框架

cc031bec501980797e3343d3790fe747.png

3D重建和识别技术

通过自主开发的3D扫描仪可获准确并且快速地获取场景的点云图像,通过3D识别算法,可实现在对点云图中的多种目标物体进行识别和位姿估计。

e5c984364c1438bc477fbc1285a6d64f.png

3D重建和识别效率

4bc96fcb078dd4311139ef9ccf89bbed.png

多种材质识别效果测试 

得益于健壮的重建算法和识别算法,可对不同材质的零件进行稳定的重建和识别,即便是反光比较严重的铝材料及黑色零件都能获得较好的重建和识别效果,可适用于广泛的工业场景。

30590ccd5b16b160df5656d6e530368b.png

机器人路径规划

并不是获得零件的位姿信息后就能马上进行零件的拾取,这仅仅只是第一步,要成功拾取零件还需要完成以下几件事:

b0ce18a577d77b3659add85c46fb9169.png

自主开发的机器人轨迹规划算法,可轻松完成上述工作,保证机器人拾取零件过程稳定可靠。

快速切换拾取对象

只需要四个简单的操作即可实现拾取对象的快速切换,无需进行复杂的工装、产线的调整。

4ed20de0f1e509a8fa7edbe605004fcb.png

四、性能比较

1、类似于飞行时间相机、光场相机这类的相机,可以归类为单相机3D成像范围,它们体积小,实时性好,适合随动成像眼在手系统执行3D测量、定位和实时引导。但是,飞行时间相机、光场相机短期内还难以用来构建普通的随动成像眼在手系统,主要原因如下:

1)飞行时间相机空间分辨率和3D精度低,不适合高精度测量、定位与引导。

2)对于光场相机,目前商业化的工业级产品只有为数不多的几家,如德国Raytrix,虽然性能较好,空间分率和精度适中,但价格贵,使用成本太高。

dcefbe2d288311cf538ad277ca45d4ad.png

图 7  随动成像眼在手系统机器人3D视觉成像优选方案

2、结构光投影3D系统,精度和成本适中,有相当好的应用市场前景。它由若干个相机-投影仪组成的,如果把投影仪当作一个逆向的相机,可以认为该系统是一个双目或多目3D三角测量系统。

3、被动立体视觉3D成像,目前在工业领域也得到较好应用,但应用场合有限。因为单目立体视觉实现有难度,双目和多目立体视觉要求目标物体纹理或几何特征清晰。

4、结构光投影3D、双目立体视觉3D都存在下列缺点:体积较大,容易产生遮挡。针对这个问题虽然可以增加投影仪或相机覆盖被遮挡的区域,但会增加成像系统的体积,减少在Eye-in-Hand系统中应用的灵活性。

五、总结

虽然光学3D视觉成像测量方法种类繁多,但能够安装在工业机器人上,组成一种合适的随动成像眼在手系统,对位置变动的目标执行3D成像测量、引导机器人手臂准确定位和实施精准操作的方法有限。因为从工业应用的角度来说,我们更关心的是3D视觉传感器的精度、速度、体积与重量。

鉴于机器人末端能够承受的端载荷有限,允许传感器占用的空间有限,传感器在满足成像精度的条件下,重量越轻体积越小也就越实用。所以,对于随动成像眼在手系统,最佳3D成像方法是采用被动单目(单相机)3D成像方法,这样不仅体积小、重量轻,也解决了双目和多目多视图遮挡难题。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

87a5208f4feb73309b529fe25ec97fd1.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482792.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

4.1.3数据报与虚电路

4.1.3数据报与虚电路 文章目录4.1.3数据报与虚电路1.三种数据交换方式比较总结2.数据报方式&虚电路方式3.几种传输单元名词解析4.数据报5.虚电路数据报&虚电路 对比总结1.三种数据交换方式比较总结 2.数据报方式&虚电路方式 3.几种传输单元名词解析 4.数据报 5.虚电…

MIT物理学家观察超冷原子形成量子龙卷风晶体

来源&#xff1a;诸平科学网博客链接地址&#xff1a;https://blog.sciencenet.cn/blog-212210-1319857.htmlJust like the formation of weather patterns on Earth, here a spinning fluid of quantum particles breaks up into a crystal formed from swirling, tornado-lik…

4.2路由算法与路由协议概述

4.2路由算法与路由协议概述 文章目录4.2路由算法与路由协议概述1.路由算法2.路由算法的分类3.分层次的路由选择协议1.路由算法 2.路由算法的分类 3.分层次的路由选择协议

北大200页元宇宙报告!六大板块,看20家巨头的元宇宙布局 | 智东西内参

来源 北京大学汇丰商学院 安信证券作者&#xff1a;魏炜 等原标题&#xff1a;《元宇宙2022——蓄积的力量》如何看待元宇宙这一新事物&#xff1f;有人说元宇宙是未来互联网的发展目标&#xff0c;是人类信息技术的另一场革命&#xff0c;也有人说元宇宙概念只是“割韭菜”的套…

4.3.1 IP数据报格式

4.3.1 IP数据报格式 文章目录4.3.1 IP数据报格式1.TCP/IP协议栈2.IP数据报格式1.TCP/IP协议栈 2.IP数据报格式

人工智能可以发现数据中隐藏的物理规律

来源&#xff1a;ScienceAI编辑&#xff1a;萝卜皮神户大学和大阪大学的研究人员成功开发了人工智能技术&#xff0c;可以从常规观测数据中提取隐藏的运动方程&#xff0c;并创建一个遵循物理定律的模型。这项技术可以让研究人员发现现象背后隐藏的运动方程&#xff0c;而这些方…

4.3.2 IP数据报分片

4.3.2 IP数据报分片 文章目录4.3.2 IP数据报分片1.最大传输单元2.IP数据报格式3.IP数据报分片例题4.IP数据报格式1.最大传输单元 2.IP数据报格式 3.IP数据报分片例题 4.IP数据报格式

Nature:AI 引导人类直觉,帮助发现数学定理

来源&#xff1a;集智俱乐部作者&#xff1a;Alex Davies, Petar Veličković, Lars Buesing等译者&#xff1a;赵雨亭 审校&#xff1a;潘佳栋 编辑&#xff1a;邓一雪导语我们通常认为&#xff0c;数学家的世界充满了直觉和想象力&#xff0c;他们发现模型、提出猜想、证明定…

4.3.3 IPv4地址

4.3.3 IPv4地址 文章目录4.3.3 IPv4地址1.ip地址2. IP编址的历史阶段2.分类的IP地址3.互联网中的IP地址4.分类的ip地址5.特殊ip地址6.私有ip地址7.分类的ip地址1.ip地址 2. IP编址的历史阶段 2.分类的IP地址 3.互联网中的IP地址 4.分类的ip地址 5.特殊ip地址 6.私有ip地址 7.分…

8大趋势已现,未来传感器将彻底改变你的生活!

来源&#xff1a;传感器专家网 现代信息技术发展到2022年&#xff0c;传感器的重要性越来越高&#xff0c;物联网、元宇宙、人工智能、自动驾驶……无不离不开传感器。2022年&#xff0c;传感器更伴随着这些技术的发展&#xff0c;进一步改变我们的生活&#xff0c;同时传感器本…

error LNK2038: 检测到“RuntimeLibrary”的不匹配项: 值“MDd_DynamicDebug”不匹配值“MD_DynamicRelease”...

1.错误提示与原因分析 或者是提示&#xff1a;error LNK2038: 检测到“_ITERATOR_DEBUG_LEVEL”的不匹配项: 值“0”不匹配值“2。 此类问题出现的根本原因就是&#xff0c;你引用的lib库的debug或release版本&#xff0c;与本工程的dubug或release版本不符合。这类问题在引用文…

4.3.4 网络地址转换NAT

4.3.4 网络地址转换NAT 文章目录4.3.4 网络地址转换NAT1.私有ip地址2. 网络地址转换nat1.私有ip地址 2. 网络地址转换nat

day-17 包与模块

包 logging 模块 logging 配置字典 hashlib 模块 openpyxl 模块 深浅拷贝 一 模块 1.0.1 模块回顾 模块 # 三种来源1.内置的2.第三方的3.自定义的 # 四种表示形式1.py文件(******)2.共享库3.文件夹(一系列模块的结合体)(******)4.C编译的连接到python内置的 1.0.2 模块与包 # 研…

Jeff Dean长文展望:2021年之后,机器学习领域的五大潜力趋势

来源&#xff1a;机器之心报编辑&#xff1a;杜伟、蛋酱2021 年之后&#xff0c;机器学习将会对哪些领域产生前所未有的影响&#xff1f;在过去的数年&#xff0c;见证了机器学习&#xff08;ML&#xff09;和计算机科学领域的许多变化。按照这种长弧形的进步模式&#xff0c;人…

4.3.5子网划分和子网掩码

4.3.5子网划分和子网掩码 文章目录4.3.5子网划分和子网掩码1.子网划分2.使用子网时分组的转发1.子网划分 2.使用子网时分组的转发 相关链接-计算机网络&#xff08;4.10&#xff09;网络层- 使用子网时分组的转发

专享!解读抖音企业蓝V认证的详细流程是怎样的

抖音现在是国内非常火的短视频软件&#xff0c;随着用户量的与日俱增&#xff0c;很多商家抓住了商机&#xff0c;开始在抖音宣传自己的商品。而抖音蓝V认证则是快速提升企业品牌知名度的一种渠道&#xff0c;但很多朋友不知道怎么申请蓝V认证&#xff0c;今天就给大家讲解一下…

深度学习的可解释性!

来源&#xff1a;智源社区 作者&#xff1a;知源月旦一、深度学习的可解释性研究概述随着深度学习模型在人们日常生活中的许多场景下扮演着越来越重要的角色&#xff0c;模型的「可解释性」成为了决定用户是否能够「信任」这些模型的关键因素&#xff08;尤其是当我们需要机器为…

4.3.6无分类编址CIDR(构成超网)

4.3.6无分类编址CIDR ps&#xff1a;无类别域间路由&#xff08;Classless Inter-Domain Routing、CIDR&#xff09; 文章目录4.3.6无分类编址CIDR1.无分类编址CIDR2.构成超网3.最长前缀匹配1.无分类编址CIDR 2.构成超网 3.最长前缀匹配

生命真的源于宇宙吗?多名宇航员身体,都曾发生“不可逆”的变化

来源&#xff1a;科学的乐园宇航员是世界上最伟大的职业之一&#xff0c;他们为人类的宇宙探索付出了很多。同时宇航员也是世界上最难的职业&#xff0c;要先成为出色的飞行员&#xff0c;满足一定时间的飞行&#xff0c;经过严格的训练和筛选&#xff0c;才有可能成为宇航员。…

4.3.7 ARP协议

4.3.7 ARP协议 文章目录4.3.7 ARP协议发送数据的过程ARP协议发送数据的过程 路由器、交换机、集线器的区别 网络中一张图片是怎么被传输的-被拆分的身份证 1号给3号发&#xff0c;&#xff08;同一局域网&#xff0c;arp请求得到mac地址&#xff09; ps&#xff1a;交换机是…