在移动机器人领域,2018年最大的技术进展莫过于VSLAM技术在该领域的应用突破了,它将让移动机器人自主行驶有更广阔的空间。
目前市面上移动机器人自主行驶都是以激光雷达导航为主,双目视觉只是作为辅助使用,原因是现阶段视觉导航存在太多的问题。
如今,上海诠视传感技术有限公司(以下简称:诠视科技)在VSLAM应用技术上取得了重大的进展,把双目摄像头、RGB摄像头、TOF摄像头等视觉传感器进行深度融合,辅之以AI的边缘计算,让机器视觉变得更加的智能。
诠视传感CEO林琼说:“有了诠视的RobotVision模组之后,移动机器人在行驶过程中,可实现定位、避障、导航、空间测量、物体识别等功能,解决了如前面的通道,机器人是否可以通过?或前面的物体和人,距离机器人还有多远等问题?通过对人的识别,当人与机器人同时行走在一条通道上,机器人可以更好进行自主避障。”
更重要的是诠视科技把几个传感器进行集成后,对机器人企业而言是大大降低了投入成本和开发时间。
机器人的视觉系统不是简单去采购几个镜头和传感器产品进行组装就可以实现,机器视觉是一个非常复杂、严密的系统工程。现在有一家企业把最令人头疼的事情做好了,对其它企业而言,就没必要再重复做投入,直接拿过来用最省事。
1号机器人网记者:2018年机器人领域最大的进展就是VSLAM技术在该领域的应用突破,可否谈谈诠视VSLAM系统方案有哪些亮点?
林琼:
在移动机器人领域,目前是以激光雷达为主的导航方案,因为二维激光雷达可实时更新位置信息,本身运算成本比较低,对平台的要求不高,所以比较容易上手,因此,现阶段很多机器人企业都是采用激光雷达导航为主的方案。而VSLAM有着局限性,它受光线的影响很大,因此,过去几年制约着它的发展。
我们现在的方案是通过多传感器的融合弥补VSLAM先天性的不足(接下来的问题会详细谈到)。在多传感器的弥补下,VSLAM从空间可以获取更加丰富的信息,这是二维激光雷达所不能比拟的。
比如机器人如何避障问题?二维激光雷达只能获取一条线上的信息,而VSLAM可以获取更加立体的信息,这就是VSLAM区别于激光导航的优势所在。
1号机器人网记者:你们的双目视觉主要在VR/AR和移动机器人等领域应用,它在VR/AR领域可以充当什么?它解决了哪些问题?
林琼:VR/AR是我们两大应用之一,VSLAM在VR/AR领域已经被证明是唯一有效的技术。
VSLAM在VR/AR领域可以对自己位置和姿态进行追踪,比如在VR虚拟世界,你向前走了多少米?向左边看,看到的物体离你有多少距离?等等这些数据都是可以清晰的呈现出来。
过去VR世界呈现的是3个自由度,即3DOF,只能实现角度变化的呈现, 无法实现平移的检出,在VR世界里是没有移动感,你也不知道你看到的物体离你有多近?所以它具备一定的沉浸感,但不是深度的沉浸感。
VR想要达到深度的沉浸感需要具备6个自由度的感知能力,即6DOF,用户能感知上下左右前后的移动和相应转角的变化,甚至你能知道你看到的物体离你有多远?以及你往左边看,这个转角是多少度?左边眼睛所看到的物体离你有多近?等等这些信息都是可以呈现出来。
AR也是一样,比如桌子上有一个虚拟的杯子,我要把这颗珠子放进去,那你就要知道这个杯子的具体位置,你才能瞄准把珠子放进去,VSLAM的作用就是把杯子具体位置确定下来,知道了它的具体位置,你才能把珠子放进去。
所以在VR/AR领域,VSLAM可以讲是解决了人与环境的最基本的交互问题。
1号机器人网记者:在国内移动机器人领域,目前主流的导航方案都是以激光雷达为主,现阶段视觉导航问题不少,在移动机器人领域,你们可以提供怎样的VSLAM解决方案?
林琼:我们提供的是以视觉导航为主的多传感器融合方案,它对空间特征的提取更加的丰富,还具备物体识别的能力。
比如它可以识别这是桌子或椅子,还可以识别人脸、人体、人形,这样当人走过来的时候,它就可以有不同的交互方式,知道如何进行避让。
在移动机器人领域,我们以边缘计算平台为基础,算法为核心,再进行多传感器的融合,让机器人自主行驶更加有保障。
移动机器人搭载我们的双目RobotVision产品后,在行走的过程中,可以对前面的空间进行测量,反馈给机器人做出相应的判断,这是过去的激光导航所不具备的能力。
我们在一个端设备上集成了TOF摄像头、RGB摄像头、双目摄像头、IMU乃至激光雷达等,实现了多传感器融合的一站式解决方案。
如果机器人企业自己去做的话,需要采购多台设备进行数据的融合,投入将是巨大的,而我们把多个传感器集成于一个设备上,大大节省了机器人企业的投入和开发周期。
1号机器人网记者:看你们的官网,诠视双目视觉产品的单价还是太高了,单价高阻碍推行,你们认为2019年内产品降价的空间存不存在?
林琼:当然存在。我们现在单价高是因为把双目摄像头、TOF摄像头、RGB摄像头集成到一起,所以整体单价就高。那也好过机器人企业自己去买这些设备,如果把所有的产品都汇集,产品价格将会更高。
我们现在预售价399美元/个,是一个整体方案,包含软件技术支持、硬件设备支持等,是一整套的服务。如果机器人企业自己去买一个摄像头,那单价是低很多,但是也是需要采购多种传感器进行融合,而且在算法上的投入将是巨大的。
最重要的是,我们团队有在这个领域深耕了10年的技术积累,机器人企业自己去做会面临很高的技术门槛。
1号机器人网记者:如果我们撇开价格不谈,你认为未来视觉导航是否会替代激光雷达导航?你们对视觉与激光未来的发展如何判断?
林琼:我认为两者一定会融合;因为不管是视觉导航还是激光导航,各自都有短板,当然,融合还要看使用场景。
视觉导航的短板是受光线的影响很大,视觉对环境的依赖性非常强;二维激光导航的短板是信息过于简单,完全依赖光线的反射,会存在信息偏差,在复杂场景下存在定位失效等问题。
所以对移动机器人而言,要进行自主行走光靠一个传感器是不行的,必须是多传感器的融合解决方案。因为我们是做视觉导航的,站在我们的角度来看,强调是以视觉为主的多传感器融合方案,视觉所获取的信息比二维激光要更加丰富,除非用多线激光雷达方案,但价格会更加昂贵,所以未来一两年多模态融合的视觉导航将会逐渐凸显优势。
1号机器人网记者:从技术的角度去看,你认为未来三年双目视觉的技术发展方向会是怎样?
林琼:双目视觉的发展历史非常的长,它的弱点是精度不够高,目前双目视觉最佳的探测距离是10米,在低速机器人领域,这个距离已经足够了。那未来的方向就是提高精度。
现在大家统一的做法就是双目视觉+结构光的方案,这也是未来三年的技术发展方向,也是目前提高精度的最佳方案。
1号机器人网记者:纵观国内,现在技术的发展都非常的快,按照目前的技术发展速度,你认为双目视觉最终的方案是怎样?
林琼:我认为机器视觉最终的方案一定是超越人眼,比如子弹从你眼前飞过,你是看不见子弹的轨迹,但是机器视觉可以,它可以重放,镜头慢到你可以清晰的看到子弹从你眼前飞过。
而且未来所有的智能硬件产品都可以具备眼睛的功能,比如自动加油机,当汽车开过来的时候,它可以知道汽车离自己还有多少米等等。当所有的智能硬件产品都具备眼睛的功能时,整个社会都将会是翻天覆地的变化。
1号机器人网记者:最后一个问题,你们判断双目视觉会在哪些领域率先爆发应用?以及你们下一步的战略如何布局?
林琼:从目前的应用场景去分析,我们认为双目视觉会在VR/AR和移动机器人等领域率先爆发应用。在VR/AR领域,VSLAM已被证明是唯一有效的技术;在移动机器人领域,VSLAM多传感器融合的方案基本上可以解决室内80%左右的机器人自主行走问题。
我们现在的公司战略就是在这两条路线上去深耕,并做垂直的整合,我们不但输出核心技术,未来还会参与制作VR/AR眼镜或机器人整体解决方案。