行业报告|3D感知技术快速发展,打造“机器之眼”,助推各行业加速升级!

原创 | 文 BFT机器人 

图片

01

3D视觉感知全栈式平台,硬核实力蓄势待发

1.1 3D视觉感知为“机器之眼”,未来市场空间广阔

3D视觉感知技术充分弥补了2D成像技术的以上不足,可获取空间几何尺寸信息。

过去数十年2D成像技术蓬勃发展,分辨率从几十万像素发展到现在的上亿像素,色彩还原更真实,逆光环境下也能通过HDR技术提升图像质量。

然而,2D图像仅能够提供纹理无法提供实现更精准识别、追踪等功能所需的空间形貌、几何尺寸、位姿等信息。

3D视觉的本质是将光源发射到物体再反射回来,根据图像传感器拍摄的画面计算每个图像的变形量或者根据反射回来的时间计算出距离,形成深度图和点云图,再经算法重现1:1还原的3D模型。有了这些信息作为基础,应用场景会大大增多,性能也会大幅提升。

图片

3D视觉感知技术逐步在消费级、工业级等领域应用,经历了以下几个阶段:

(1)技术启蒙期:3D视觉感知技术最早应用于工业领域,主要用于工业设备与零部件的高精度三维测量以及物体、材料的微小形变测量等,代表产品如德国高慕公司(GOM)的ATOS系列三维扫描仪等,用于工业级的设备通常成本高、体积大、功耗高,该阶段应用普及缓慢。

(2)技术起步期:随着底层元器件、核心算法等的快速发展,3D视觉感知技术不再拘泥于工业领域,逐步向消费领域推广,如微软2010年发布的Kincect、英特尔2013年发布的RealSense、奥比2015年发布的Astra,该阶段国内外共振助力3D视觉感知发展。

(3)技术发展期:前两个阶段发布的产品大多聚焦在三维建模、人机交互等领域,随着3D视觉感知技术的进一步迭代与优化,也逐渐向对成本、功耗、体积等要求更加严格的应用领域拓展,比如智能手机、移动支付、AIoT等。

(4)技术爆发期:随着底层元器件和核心算法的不断更迭,3D视觉感知技术逐步人工智能化,消费级应用产品也不断向高端化发展,如2020年苹果在iphone 12pro上搭建了基于dToF技术的Lidar扫描仪,谷歌于2020年在凤凰城推出无人驾驶租车服务等,3D视觉感知进入快速增长时期。

图片

2025年全球3D成像和传感市场规模达150亿美元,市场空间广阔。随着2D成像逐步向3D视觉感知升级,3D视觉感知市场处于规模快速增长的爆发前期,3D成像和传感市场受到传感器、发射器、光学元件、模块技术发展和研发工作推动,目前3D成像和感知朝着多样化、智能化方向发展,未来将各领域共同放量。

根据法国市场研究与战略咨询公司Yole发布的全球3D成像和传感市场研究报告,2019年全球3D视觉感知市场规模为50亿美元,且市场规模将快速发展,预计在2025年达到150亿美元,2019-2025年CAGR约为20%。

3D视觉赛道千亿市场多领域开花,消费电子和汽车领域增速领衔。根据法国市场研究与战略咨询公司Yole发布的全球3D成像和传感市场研究报告显示,3D视觉感知市场主要由消费电子、工业、医疗、汽车及消费电子领域组成,到2025年其细分板块占3D感知市场的比分别为54%、11%、2%、8%和25%,消费电子和汽车的增速较高。

未来随着像素内混合堆叠(in-pixel hybrid stacking)、激光雷达光源由近红外光(NIR)慢慢移动到短波红外线(SWIR)等技术的发展与渗透,将会有越来越多新兴产业进入3D视觉感知市场,比如3D打印设备、人形机器人、虚拟现实混合等,值得期待。

图片

1.2 深耕3D视觉感知,以技术为核心打造全栈式平台

3D视觉感知经过近十年的不断探索、研发及应用,已形成完善的产业化链条。其中,上游主要是3D传感器硬件供应商,主要由深度引擎芯片、光学成像模组、激光投影模组以及其他电子器件、结构件等构成,公司自主研发生产专用感光芯片和传感器模组。

中游是3D视觉感知方案供应商,主要是基于深度引擎算法结合应用进行各类3D视觉传感器的方案设计,其中部分3D视觉感知方案商已具备完整的3D视觉感知方案的能力,如苹果、微软、英特尔、华为、奥比中光等。

下游主要是应用算法供应商,如图像分割/增强优化算法、和VSLAM算法等;应用终端则有消费电子、生物识别等领域。

图片

(1)双目:类似于人眼,通过两个摄像头同时拍摄一个物体,然后利用计算机算法计算两个摄像头之间的视差(两个摄像头同时拍摄同一个物体时,物体在两个图像上的位置是有差异的),从而获取物体的深度信息。双目比较依赖于自然光,且无法处理无纹理的物体。

(2)结构光:通过投射仪主动发射一束光源(通常是红外光束),通过光学元件形成一束带有条纹编码的光,打到物体上反射回来的光由于物体的形状不同导致带编码光束产生不同的变形,通过分析这种畸变的大小和形状可以获取物体的深度信息。结构光适用于近距离,随着距离变远精度和分辨率都会变差,且容易收到环境光的干扰。

(3)ToF:相机通过打出一束光(通常是红外线光束)到目标物体上,这束光经物体反射回来,相机的光电二极管阵列接收反射光,并测量光的时间飞行(ToF)从而获取物体的距离信息。测量时间飞行的方式有两种,一种是dToF即直接计算光束飞行的时间(发射与接收到的时间),一种是iToF即间接测量光束飞行的时间,iToF是通过计算前后发出的两束光的相位差来得到光飞行的时间。ToF的分辨率不高,但是对光有抗干扰能力。

(4)Lidar:目前激光雷达的测距方法ToF、相干法和三角法等,其中三角法较为常用,是指一束光发射至物体表面,激光在物体表面发生反射和折射,在另一角度利用透镜对反射激光汇聚成像,光斑成像在CCD位置传感器上。当被测物体沿激光方向发生移动时,位置传感器上的光斑将产生移动,其位移大小对应被测物体的移动距离,以此来计算物体距离。

(5)工业三维测量:通过特定光源将有光学编码的图案投射到被测物体上,通过分析物体表面变形的光学图案,利用相机标定等方法获得特定光源和相机的位姿关系,采用三角测量法获得物体表面的空间三维信息,最终获得待测物体表面的点云数据。

图片

不同应用领域或场景对3D视觉的测量范围、测量精度、尺寸和功耗等性能要求均不同。其中结构光、iToF、双目、dToF、Lidar主要是运用于消费级应用场景的技术,其中结构光和双目的分辨率较高,更多适用于手机前置和机器人等领域。

ToF技术的抗干扰性和视角较宽,但分辨率较低,更多用于手机后置、扫地机器人等对分辨率要求没有那么高的领域。


工业三维测量则是专用于工业领域,适用于高精度工业测量、材料和结构的测量,其分辨率和测量精度都极高。

图片

1.3 芯片到算法全线技术打造消费级应用设备,产品性能一流

3D视觉传感器的深度引擎芯片具备更快更精确的计算能力,公司具备定制化生产能力。3D视觉传感器主要由结构件外壳、激光投影/RGB成像/感光芯片的IR成像等模组、衍射光学元件、感光芯片、深度引擎芯片等组成,深度引擎芯片具备更快的计算效率以及更精确的计算能力,是实现3D视觉传感器由实验室走向量产、产品化的核心。

图片

在消费级具备全线系统设计、芯片设计、光学设计、软件开发和量产的能力。消费级3D视觉感知技术先进性体现在以下几个方面:

(1)系统设计能力:公司依托从底层到上层技术的全栈式布局,在系统设计时可以更好地进行深入优化与融合,使得系统设计更加合理。


(2)芯片设计能力:公司的芯片团队具备数字及模拟芯片的研发实力,目前已成功完成四代深度引擎芯片、两款iToF感光芯片、两款dToF感光芯片的开发。

(3)算法研发上布局了深度引擎和消费场景多种算法。

(4)公司可以依据客户要求提供定制化光学产品。

(5)二次软件开发包SDK使得客户二次开发更为便利。

(6)量产组装能力。

图片

1.4 工业级3D视觉感知技术先进,国产替代进行时

3D视觉感知在工业领域主要应用于三维扫描、微小形变测量、弯管角度测量分析、工业机器人的定位与导航等方面。

三维测量一直是工业领域不可或缺的技术环节,通过使用高精度相机、光纤光栅等设备,可以实现对物体在力学载荷下的形变、应变、三维形态、曲率等参数的测量,细致、精确、快速获取,结合全局自动拼接技术,可以实现几十米超大工件的快速高精度测量。

02

原有下游稳固,新兴科技应用场景助推发展

2.1 引领服务机器人3D视觉感知市场,人形机器人再续航

机器人视觉相比工业视觉对深度引擎芯片、3D建模算法、分辨率和集成度的要求更高。

机器人视觉和机器视觉都属于计算机视觉,机器视觉通常用于工业,工业视觉的核心是以光学设备+控制系统+执行机构,代替人眼来完成生产制造中的识别、测量、定位、检测等工作,场景单一,对集成度、算力要求较低。

而机器人视觉则需要将机器人对运动场景、物体位置、物体形状实时计算,场景非常复杂,因此对于应用算法、分辨率和物体建模的要求较高,且机器人的体积较小,视觉传感器需要高度集。

图片

预计2027年我国机器视觉市场(包含2D平面图像和3D视觉)预计达560亿,其中3D视觉市场规模接近160亿元。

依据《2023机器视觉产业发展蓝皮书》显示,预计到2026年服务机器人产量有望达27万台,CGAR超27%。

目前来看,更多服务机器人配备2-4台传感器,其中以3D视觉传感器为主。预计未来几年,单台服务机器人搭载的传感器数量有望提升,传感器需求的复合增速超30%。

到2026年传感器需求量有望接近80万台,其中3D视觉传感器占比接近80%,未来市场空间广阔。

图片

多家厂商推出的人形机器人采用了3D视觉感知方案,人形机器人市场空间巨大。

今年以来,以GPT为代表的大模型快速发展,催生了人工智能产业新浪潮,具身智能机器人将成为人工智能终极形态。视觉能力各类智能终端的“眼睛”,是智能终端人机交互中不可或缺的关键一环,尤其是人形机器人,要更加“像人”和“仿生”,视觉感知不可或缺。

目前已有多家厂商在人形机器人上采用了3D视觉感知方案,如小米的CyberOne全尺寸人形机器人和CyberDog2、宇树科技的H1等。公司3D视觉感知技术是为人工智能提供三维视觉能力的关键共性技术,也是科技创新领域的前沿技术之一。

图片

图片

2.2 3D打印应用场景加速推广,千亿赛道蓄势待发

我国3D打印行业整体处于成长期,与国外仍有一定的差距。

我国3D打印行业整体起步较晚,起源于20世纪90年代,以清华大学等高校的研究力量为主。

1994年国内首台自主知识产权的工业级3D打印设备研制成功,1998年卢秉恒团队研制出国内首台光固化快速成型机,3D打印行业持续产生新的突破。

随后2012年中国工程院开始对3D打印行业进行市场调研,2013年中国3D打印技术产业联盟成立,标志着国家层面开始重视。

2017年至今,国家出台多项政策,支持国内3D产业发展,新企业不断进入,行业发展进入增速较快的阶段。

图片

据预测,2026年我国3D打印行业规模可达1101.9亿元,行业进入高增速时期。

3D打印是实施制造强国战略的主攻方向之一,被视为引领新一轮科技革命和产业变革的核心技术之一,3D打印具有零技能制造、设计空间无限、减少废弃副产品等优点,目前已经在军工、医疗、教育、服饰、模具等领域尝试应用。

据预测,2021年3D打印的市场规模为265亿,预计2026年行业规模可达千亿,复合增长率接近26.79%,当前行业已经进入高速发展期。

图片

2.3 智能座舱渗透率提升,千亿市场前景广阔

汽车从被动驾驶转向主动交互,智能座舱是必经之路。据IDC统计,2023年1季度渗透率已达88.8%。

近年来,汽车已经从简单的交通工具逐渐向智能终端转变,汽车的座舱涉及理解和塑造人与车辆之间的交互,尤其是交互领域中的感觉、感知、信息交换和决策等内容,传统的行车更多的是被动过程,未来随着驾驶技术更加先进,驾驶人员将有更多的时间选择来做驾驶之外的任务,智能座舱则相当于主动式的驾驶过程。智能座舱通常包括操控系统、娱乐系统、通信系统、交互系统和智能感知系统。

图片

中国智能座舱为千亿赛道,硬件端对深度摄像头等3D视觉传感器需求高。

据ICVTank统计,2022年中国智能座舱市场规模739亿元,预计2025年可达1030亿元,多家企业纷纷入场,行业进入高速发展阶段。

智能座舱为交互开辟了新的途径,主动式的引入了智能座舱概念,因此,越来越多的传感器被整合到车辆中,参考理想的L9,智能座舱中包含1个激光雷达、1个高精度毫米波雷达、4个环视摄像头、7个外部感知摄像头、1个内部驾驶员监控摄像头等传感器,其中智能座舱的视觉上采用3D视觉传感将会把人机交互体验推向更完美的状态。

图片

2.4 工业测量领域技术持续完善,下游覆盖行业丰富

预计2026年我国工业视觉市场规模可达543亿元,应用领域广阔。

3D视觉感知在工业领域主要应用于三维扫描、微小形变测量、弯管角度测量分析、工业机器人的定位与导航等方面。

通过使用高精度相机、光纤光栅等设备,可以实现对物体在力学载荷下的形变、应变、三维形态、曲率等参数的测量。

可应用于多种行业:汽车工业、航空航天工业、数码家电、文保文创及医学等。据甲子光年智库测算,2021年工业视觉市场规模为178亿,预计2026年可达543亿,市场规模持续放量。

图片

2.5 3D视觉感知助力AIOT和生物识别

(1)智慧生活系列:公司针对智慧零售、智慧农牧、智慧交通提出了3D视觉感知方案。

针对智慧零售,公司3D感知技术助力零售行业打造线上线下一体化的商业模式,实现消费市场提速升级,为传统零售店提供人体3D扫描、商品扫描识别等功能。

针对智慧农牧,公司提出了基于图像视频技术的猪只盘点、背膘测量等产品,解决猪场科学管理难题、提升管理效率、提高经济效益。


针对智慧交通,公司自研3D视觉感知技术赋能交通行业,实现交通客流统计分析智能化处理,形成高效、全面及3D数据为中心的智能交通决策系统,以推动智慧交通发展。

图片

(2)消费电子系列:针对家庭娱乐,公司结合人体骨架识别、AR抠图、人脸识别、物体识别等核心算法,打造“3D+AR”平台,覆盖亲子教育、家庭健身、互动娱乐、家庭看护等应用场景,目前公司家庭娱乐业务已覆盖全国多个省市。

为手机前置提供3D结构光解决方案,已为OPPO旗舰手机FindX定制开发超百万台3D视觉传感器;为手机后置提供iToF解决方案为魅族旗舰手机17Pro、18Pro定制开发ToF解决方案。

(3)生物识别:主要是刷脸支付、3D刷脸门锁、身份核验等解决方案。3D刷脸支付解决方案已在全国数百座城市普及,覆盖超市、药店、便利店等线下场景。

3D刷脸门锁门禁助力实现真3D智能门锁规模化量产,并在办公楼、商场、医院等多个场景广泛使用门禁产品。

提供于人脸识别的金融级KYC验证服务,通过身份信息录入、人脸活体检测、等可快速核验人员信息、分配人员权限等,可广泛应用于政府、医院、人才公寓、校园、产业园区等重要场所。

来源 | 国盛证券

排版 | 居居手

审核 | 柒柒

版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/58068.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

flume系列之:记录一次消费大量Debezium数据,数据包含dml语句比较大,造成数据堆积在channel的解决方法

flume系列之:记录一次消费大量Debezium数据,数据包含dml语句比较大,造成数据堆积在channel的解决方法 一、背景二、相关技术博客三、flume层面解决方法四、debezium数据采集层面解决方法一、背景 Debezium采集了大量的数据,数据包含DMl语句,数据本身比较大。flume消费了大…

Mybatis insert返回主键id

个人公众号🐕已经开通了,欢迎关注! 面试宝典公众号:源1024 第一种方式:添加selectKey标签属性 useGeneratedKeys设置为 true ,表示如果插入的表id以自增列为主键,则允许 JDBC 支持自动生成主键…

Python 操作 Redis 数据库介绍

Redis 作为常用的 NoSql 数据库,主要用于缓存数据,提高数据读取效率,那在 Python 中应该如果连接和操作 Redis 呢?今天就为大概简单介绍下,在 Python 中操作 Redis 常用命令。 安装 redis 首先还是需要先安装 redis …

mysql 基本操作2

目录 Update 将小白龙的数学成绩跟新为 80 分 将总成绩后三名的数学成绩30分 Delete 删除沙悟净的成绩 删除倒数第一名的成绩 Truncate 聚合函数 count 查看员工表里面的人数 查看男女员工的个数 查看男员工占所有员工个数的比例 sum 计算所有员工的工资和 计算各…

-9501 MAL系统没有配置或者服务器不是企业版(dm8达梦数据库)

dm8达梦数据库 -9501 MAL系统没有配置或者服务器不是企业版) 环境介绍1 环境检查2 问题原因 环境介绍 搭建主备集群时,遇到报错-9501 MAL系统没有配置或者服务器不是企业版 1 环境检查 检查dmmal.ini配置文件权限正确 dmdba:dinstall,内容正…

ChatGPT Prompting开发实战(一)

一、关于ChatGPT Prompting概述 当我们使用ChatGPT或者调用OpenAI的API时,就是在使用prompt进行交互,用户在对话过程中输入的一切信息都是prompt(提示词),当然工业级的prompt与人们通常理解的prompt可能不太一样。下面…

03 最长连续序列

最长连续序列 题解 哈希(O(n)) 给定一个未排序的整数数组 nums ,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。 请你设计并实现时间复杂度为 O(n) 的算法解决此问题。 题解 哈希(O(n)) class Solution { public:int long…

Redis 7 第五讲 事务、管道、发布订阅 过渡篇

事务 理论 可以一次执行多个命令,本质是一组命令的集合。一个事务中的所有命令都会序列化,按顺序地串行化执行而不会被其它命令插入,不许加塞 一个队列中,一次性、顺序性、排他性的执行一系列命令 Redis事务 VS 关系型数据库事务 单独的隔离操作Redis的事务仅仅是保证事…

taro.js和nutui实现商品选择页面

1. 首先安装 Taro.js 和 NutUI: npm install -g tarojs/cli npm install taro-ui 2. 创建 Taro 项目并进入项目目录: taro init myapp cd myapp 3. 选用 Taro 模板一并安装依赖: npm install 4. 在页面目录中创建商品选择页: taro cre…

JVM运行时数据区

文章目录 JVM内存结构图1、运行时数据区域JDK 1.7JDK 1.81. 线程栈(虚拟机栈)2. 本地方法栈3. 程序计数器4. 方法区(元空间)5. 堆6、运行时常量池(Runtime Constant Pool)7、直接内存(Direct Me…

云计算——虚拟化中的网络架构与虚拟网络(文末送书)

作者简介:一名云计算网络运维人员、每天分享网络与运维的技术与干货。 公众号:网络豆 座右铭:低头赶路,敬事如仪 个人主页: 网络豆的主页​​​​​ 目录 前期回顾 前言 一.网卡虚拟化 1.网卡虚拟化方法&…

spring websocket demo

一 java依赖 gradle 配置 implementation "org.springframework.boot:spring-boot-starter-websocket" implementation "org.springframework.security:spring-security-messaging" 二 配置WebSocketConfig import org.springframework.beans.factory.a…

基于 vue2 发布 npm包

背景:组件化开发需要,走了一遍发布npm包的过程,采用很简单的模式实现包的发布流程,记录如下。 项目参考:基于vue的时间播放器组件,并发布到npm_timeplay.js_xmy_wh的博客-CSDN博客 1、项目初始化 首先&a…

C语言练习题解析:挑战与突破,开启编程新篇章!(1)

💓博客主页:江池俊的博客⏩收录专栏:C语言刷题专栏👉专栏推荐:✅C语言初阶之路 ✅C语言进阶之路💻代码仓库:江池俊的代码仓库🎉欢迎大家点赞👍评论📝收藏⭐&a…

记录在ubuntu 18.04系统上安装虚拟机的过程

- 下载ubuntu镜像 ubuntu镜像下载地址 我下载的是desktop桌面版,比较好操作。 - 烧录 我用的Mac,使用的是balenaEtcher软件进行磁盘烧录。 balenaEtcher下载地址 如果出现磁盘损坏或者无法再次使用,参考这里解决:进入 - 安…

Vue项目直接报错

最近自己在做一个vue2项目,vue并不熟悉,所以求解!!! 通过命令:vue create app 创建项目,但打开后,浏览器直接报错,意思为:不能在模块外使用import语句(at ho…

多维时序 | MATLAB实现SABO-CNN-GRU-Attention多变量时间序列预测

多维时序 | MATLAB实现SABO-CNN-GRU-Attention多变量时间序列预测 目录 多维时序 | MATLAB实现SABO-CNN-GRU-Attention多变量时间序列预测预测效果基本介绍模型描述程序设计参考资料 预测效果 基本介绍 多维时序 | MATLAB实现SABO-CNN-GRU-Attention多变量时间序列预测。 模型描…

框架分析(5)-Django

框架分析(5)-Django 专栏介绍Django核心概念以及组件讲解模型(Model)视图(View)模板(Template)路由(URLconf)表单(Form)后台管理&…

vue中bus的使用和涉及到的问题

创建一个js文件 import Vue from "Vue" export default new Vue 我们可以直接在要使用的页面中引用使用 import bus from /assets/js/eventBus.js;bus.$emit("info", "123") // 使用bus.$on("info", (val) > { // 接收console.l…

【【萌新的STM32学习20--按键输入实验】】

萌新的STM32学习20–按键输入实验 在了解完蜂鸣器的实验之后我们又进行一个小实验 又是正点原子没有上课讲解的实验 对于这种不平滑的情况我们更多的也会去选择方法进行消除抖动 软件消抖:方法很多,我们例程中使用最简单的延时消抖。检测到按键按下后&…