走出实验室的人形机器人,将复刻ChatGPT之路?

1月7日,在2025年CES电子展现场,黄仁勋不仅展示了他全新的皮衣和采用Blackwell架构的RTX 50系列显卡,更进一步展现了他对于机器人技术领域,特别是人形机器人和通用机器人技术的笃信。黄仁勋认为机器人即将迎来ChatGPT般的突破,有望成为世界上规模最大的技术产业。

我们知道,人形机器人的技术难度和门槛颇高,很多人认为人形机器人从走出实验室到落地之路必然艰辛。但事实上,近两年,随着通用大模型的发展,人形机器人被赋予了强大的泛化能力,吸引了特斯拉、Open AI、英伟达、三星等科技巨头纷纷布局。这些公司的入局不仅加速了人形机器人的技术落地,也推动了其商业化进程。

今天为大家分析的这份报告便对人形机器人的现状、技术市场等进行了分析,深度剖析了构成人形机器人的执行系统、感知系统和控制系统。

2025,人形机器人元年

如今我们谈及人形机器人似乎早习以为常,但是人形机器人真正的发展其实也只是进入21世纪之后的事情。在早期发展阶段,人形机器人的研究主要集中在高校和科研机构。

1963年,NASA造出了一个名为“机动多关节假人”的机器人,能够模拟35种基本人类动作,这也被认为是人形机器人的鼻祖之一。1973年,日本早稻田大学的加藤一郎团队推出了世界上首个全尺寸人形智能机器人WABOT-1,这也启发了诸多的文艺作品和后续研究。

而中国的人形机器人研究最早可能要追溯到1985年,哈尔滨工业大学首次开启二足步行机器人的相关研究,这也标志着国内人形机器人探索的开启。而进入新世纪以来,人形机器人的研究开始高度集成发展。2000年,本田推出了身高一米二、可用双脚流畅直立行走的Asimo。2005年,本田对Asimo进行了升级改造,实现了人形机器人的奔跑,速度达到6km/h。这一时期,人形机器人在运动能力和智能化方面取得了显著进步,但距离商业化应用仍有较大差距。

真正让人形机器人走进普通人视野的,应该是2016年由波士顿动力打造的Atlas,其拥有运动平衡能力震惊世界。同年,540台优必选Alpha机器人亮相央视春晚,这也展示了人形机器人在娱乐领域的应用潜力。而从2021年开始,人形机器人进入了商业化落地的初级阶段。2021年8月,特斯拉在AI Day上首次发布人形机器人Optimus概念,并于2023年末发布Optimus-Gen2,在感知、大脑、运控能力方面有显著提升。此外,国内如小米、华为等,国外的OpenAI、英伟达、三星等巨头也在纷纷入局,全面推动人形机器人的商业化落地。

那么,为什么巨头们会偏爱人形机器人呢?首先,人形意味着能够很好地适应人类设计的工作和生活场景,无需改变现有设施。其次则是人形机器人在交互过程中更容易被人接受,具有更高的情感价值。但是,人形机器人的主要问题集中于成本和技术两个方面的挑战。例如,波士顿动力的Atlas和本田的Asimo成本均达到了百万美元以上,且在软件的适应性、交互能力、运控平衡能力,以及硬件的续航能力、执行器的精度和功率密度等方面仍有待提升。

那么为什么会判定2025年会是人形机器人元年呢?这主要是从技术发展、商业化落地和政策扶持三个角度所作出的判断。首先,伴随过去几年通用大模型的发展,人形机器人被赋予了强大的泛化能力,使之能够适应更多复杂场景,而且非专业人员无需编程即可实现操作,极大地推动了人形机器人的商业化进程。“具身智能”的机器人不再是机械式地完成单一任务,而是能够基于感知到的任务和环境进行自主规划、决策、行动和执行的新个体,语言交互、智能决策、自主学习、多模态感知等能力全面提升。

其次,科技巨头的加速入局为人形机器人的发展注入动力。除了前文介绍的特斯拉外,OpenAI投资了挪威人形机器人公司1X Technologies,并重启机器人团队;英伟达发布了人形机器人大模型Project GR00T,成立通用具身智能体研究部门。巨头开卷,必然会使这个行业成为“风口上的猪”。而且,人形机器人的应用场景也在从工厂逐步扩展到制造业、商业服务,最终有望进入家庭。报告中预估,至2030年全球人形机器人需求有望达200万台,对应市场空间超5700亿元。

最后,政策层面的支持为人形机器人的发展铺平了道路。2023年,工信部发布的《人形机器人创新发展指导意见》提出人形机器人有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,并明确了人形机器人2025年实现量产、2027年深度应用的发展目标。

人形机器人的技术组成

人形机器人的技术难点不仅仅是AI发展水平,还有大量的硬件系统和零部件等。从大的方向来看,人形机器人主要由执行系统、感知系统和控制系统三个部分构成,这部分在报告中占比较高且涉及大量的产业链相关信息,笔者仅对其中关键价值进行阐述,不做过多参数分析。

执行系统

执行系统是人形机器人的运动基础,决定了其运动的灵活性和精度。其关键部件包括电机、丝杠、减速器、灵活手等。

  • 无框力矩电机:主要用于人形机器人的线性关节和旋转关节,提供高精度和高效率的运动控制,是实现复杂动作的关键部件。其能够直接集成到转轴元件上,降低系统惯量,提高运动和稳定时间,增加系统带宽,从而提高整体效率。
  • 减速器:精密减速器主要包括3种类型,RV减速器可以提供稳定的机械支撑,确保机器人在高负载下的精度和稳定性;谐波减速器适用于需要高精度控制的关节,提供精细的运动控制;行星减速器适用于需要较高承载能力的关节,确保机器人的稳定性和可靠性。
  • 丝杠:人形机器人线性执行器的重要组成部分,是将旋转运动变成直线运动的传动附件。根据摩擦特性可分为滑动丝杠、滚动丝杠和静压丝杠三类。其中,行星滚柱式丝杠负载高、寿命长、速度大,更适用于人形机器人场景,只不过其生产工艺难度较大,门槛较高,但相应的未来发展空间也较为广阔。
  • 灵巧手:灵巧手是人形机器人的末端执行器,具备高精度、多功能性和良好的人机交互能力。通过微特电机和多种传动方式的结合,灵巧手能够执行复杂的任务,适应不同的工作场景。其关键技术包括空心杯电机、无刷有齿槽电机、线绳传动、齿轮传动、连杆传动、差速器机构、机械自适应和微型丝杠等,这些技术共同确保了灵巧手的高性能和可靠性。灵巧手在工业制造、医疗领域、服务机器人和特种作业等场景中具有广泛的应用前景。

感知系统

感知系统是人形机器人与环境交互的媒介,其核心就是各类传感器,包括力矩传感器、视觉传感器、触觉传感器和编码器等。

  • 力矩传感器:力矩传感器用于检测机器人关节上的扭矩,将扭力的物理变化转化为精确的电信号,为机械臂提供实时的力和力矩信息,从而协助机械臂完成精细和智能的操作任务。在人形机器人中,在对柔顺控制要求高的手腕和脚踝有望使用六维力矩传感器,而身体的其他关节将使用单维的关节扭矩传感器。相比之下,多维力矩传感器工艺要求高且成本较高,但属于未来的发展趋势。
  • 视觉传感器:视觉感知系统是机器人的“智慧之眼”,赋予机器人观察世界、规划执行的能力,结合当前技术发展的多模态感知能力和AI算法,能够实现环境理解、任务执行、安全和避障等功能,其也是人形机器人实现人机交互的关键。不过,由于不同传感器在不同环境下的检测能力和可靠性受到限制,因此多传感器融合是当前发展的主要趋势,其可以提高目标检测和识别的准确性。
  • 触觉传感器:能够使机器人感知与外界环境接触时的温度、湿度、压力和振动等物理量,以及目标物体材质的软硬程度、物体形状和结构大小等,从而实现对物体的精准定位以及执行各种操作任务。触觉传感器按照原理主要分为电容式、压阻式、压电式、磁敏式、光纤式,其中前三者更为常见,未来主要的发展趋势为大阵列、柔性化、多功能化、多维度、自供电等是触觉传感器的重要发展趋势。
  • 编码器:一种用于运动控制的传感器,利用光电、电磁、电容或电感等感应原理检测物体的机械位置及其变化,并将此信息转换为电信号,再将电信号转换为可传输和存储的信号形式,最后反馈给各种运动控制装置。伴随着工业自动化的发展,编码器未来的国产化占比有望进一步提升。

控制系统

主要是指运动控制系统,其主要充当了人形机器人的“小脑”职责,对机械运动部件的位置、速度、方向等进行实时控制,使其按照预期的运动轨迹和规定的运动参数进行运动。控制系统一般包括控制器、执行器和传感器,其性能直接影响机器人的运动精度、稳定性和响应速度。

控制系统的控制器能够接收操作指令后进行运动轨迹规划,为电机或其他动力和执行装置提供正确的控制信号;执行器和传感器上文已经谈及则不再赘述。一般来讲,控制系统的难点在于通信、算力和软件三个部分。

  • 通信:众多伺服关节需解决高速同步通信难点,走线要求高。
  • 算力:计算复杂度随着自由度的增加而显著增加,算法也需要适应不同工作环境,对控制器的算力要求高。
  • 软件:控制系统需提供实时运行框架满足不同运行周期的算法APP实时计算的要求。

机器人控制系统按照控制方式可分为集中控制、主从控制和分布式控制人形机器人一般采用分布式控制,其通常有数十个关节自由度,而采用分布式控制有利于系统功能的并行执行、缩短响应时间,即每个关节配置一个控制器、胸腔配置总控制器,这也将大幅增加控制器需求。

站在2025年的开端总体来看,人形机器人在过去的几年里有了长足的发展,尤其是大模型等技术的落地为人形机器人商业化链路的构建提供了更好的模板。而伴随各大企业和政策扶持的加码,人形机器人元年的大幕有望展开。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/66085.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

EF Core执行原生SQL语句

目录 EFCore执行非查询原生SQL语句 为什么要写原生SQL语句 执行非查询SQL语句 有SQL注入漏洞 ExecuteSqlInterpolatedAsync 其他方法 执行实体相关查询原生SQL语句 FromSqlInterpolated 局限性 执行任意原生SQL查询语句 什么时候用ADO.NET 执行任意SQL Dapper 总…

Java中网络编程的学习

目录 网络编程概述 网络模型 网络通信三要素: IP 端口号 通信协议 IP地址(Internet Protocol Address) 端口号 网络通信协议 TCP 三次握手 四次挥手 UDP TCP编程 客户端Socket的工作过程包含以下四个基本的步骤: 服务器程序…

HarmonyOS NEXT开发进阶(七):页面跳转

文章目录 一、前言二、页面跳转三、页面返回四、页面返回前增加确认对话框4.1 系统的默认询问框4.2 自定义询问框 五、拓展阅读 一、前言 APP开发过程中,多页面跳转场景十分常见,例如,登录 -> 首页 -> 个人中心。在鸿蒙开发中&#xf…

【Python】第一弹---解锁编程新世界:深入理解计算机基础与Python入门指南

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】【Linux系统编程】【MySQL】【Python】 目录 1、计算机基础概念 1.1、什么是计算机 1.2、什么是编程 1.3、编程语言有哪些 2、Python 背景知识 2.…

LeetCode:131. 分割回文串

跟着carl学算法,本系列博客仅做个人记录,建议大家都去看carl本人的博客,写的真的很好的! 代码随想录 LeetCode:131. 分割回文串 给你一个字符串 s,请你将 s 分割成一些子串,使每个子串都是回文串。返回 s 所…

优化神马关键词排名原理(优化神马搜索引擎关键词排名规则)

优化神马(即百度)关键词排名的原理主要基于搜索引擎的算法和用户体验的考量。以下是一些关键的优化原理: 一、搜索引擎算法 网页重要性评估: 搜索引擎通过复杂的算法评估网页的重要性和权威性,如基于PageRank的评估方…

学习threejs,使用FlyControls相机控制器

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:threejs gis工程师 文章目录 一、🍀前言1.1 ☘️THREE.FlyControls 相机控制…

Vue 3前端与Python(Django)后端接口简单示例

项目 后端(Django)前端(Vue 3) 后端(Django) 创建Django项目和应用: 确保你已经安装了Django。如果没有安装,可以使用以下命令安装: pip install django创建一个新的Dja…

MCP Server开发的入门教程(python和pip)

使用python技术栈开发的简单mcp server 需要安装 MCP server的需要使用python-sdk,python需要 3.10,安装如下 pip install mcpPS: MCP官方使用的是uv包管理工具,我平时使用pip比较多,所以文中以pip为主。因为mcp的一些依赖包版本并不是最新的,所以最好弄一个干净的环境…

Spark vs Flink分布式数据处理框架的全面对比与应用场景解析

1. 引言 1.1 什么是分布式数据处理框架 随着数据量的快速增长,传统的单机处理方式已经无法满足现代数据处理需求。分布式数据处理框架应运而生,它通过将数据分片分布到多台服务器上并行处理,提高了任务的处理速度和效率。 分布式数据处理框…

隐私计算,构建安全的未来数据空间

大数据产业创新服务媒体 ——聚焦数据 改变商业 在医疗领域,不同医院之间需要共享患者数据,以提供更全面准确的诊断和治疗方案。 传统的数据处理方式通常是数据经过转换隐藏重要数据后再进行分析,虽然可以保护数据隐私,但在数据源…

PID控制器 (Proportional-Integral-Derivative Controller) 算法详解及案例分析

PID控制器 (Proportional-Integral-Derivative Controller) 算法详解及案例分析 目录 PID控制器 (Proportional-Integral-Derivative Controller) 算法详解及案例分析1. 引言2. PID控制器的基本概念2.1 PID控制器的定义2.2 PID控制器的核心思想2.3 PID控制器的应用领域3. PID控…

rtthread学习笔记系列(3) -- FINSH模块

文章目录 3. FINSH模块3.1MSH3.1.1初始化3.1.1.1FSymtab段3.1.1.2 宏 3.1.2遍历FINSH命令3.1.3TAB补全实现3.1.3.1 msh_auto_complete3.1.3.2 msh_opt_auto_complete 3.1.4 TAB 子选项自动补全 3.2 SHELL3.2.1 finsh_system_init分配finsh结构体使用内存3.2.2 finsh_thread_ent…

Redis 知识速览

文章目录 1. Redis 简介2. Redis 优缺点3. Redis 高性能4. Redis VM 机制5. Redis 数据类型6. 应用场景7. 持久化8. 过期策略9. 内存相关10. 线程模型11. 事务12. 集群 1. Redis 简介 定义:Redis 是一个用 C 语言编写的高性能非关系型(NoSQL&#xff09…

nginx-lua缓存机制

一. 简述: 缓存是一个大型系统中非常重要的一个组成部分。在硬件层面,大部分的计算机硬件都会用缓存来提高速度,比如CPU会有多级缓存、RAID卡也有读写缓存。在软件层面,我们用的数据库就是一个缓存设计非常好的例子,在…

Java 面试中的高频算法题详解

💖 欢迎来到我的博客! 非常高兴能在这里与您相遇。在这里,您不仅能获得有趣的技术分享,还能感受到轻松愉快的氛围。无论您是编程新手,还是资深开发者,都能在这里找到属于您的知识宝藏,学习和成长…

【Python项目】手写数字识别系统

【Python项目】手写数字识别系统 技术简介:采用Python技术、Django框架、MYSQL数据库等实现。 系统简介:手写数字识别系统主要的功能有手写字识别、手写字管理、修改密码、个人信息和用户管理。 背景: 在当今这个飞速发展的时代,…

Springboot + vue 小区物业管理系统

🥂(❁◡❁)您的点赞👍➕评论📝➕收藏⭐是作者创作的最大动力🤞 💖📕🎉🔥 支持我:点赞👍收藏⭐️留言📝欢迎留言讨论 🔥🔥&…

空指针:HttpSession异常,SpringBoot集成WebSocket

异常可能性: 404 : 请检查拦截器是否将请求拦截WebSocket握手期间HttpSession为空 HttpSession为空 方法一 : 网上参考大量的文档,有说跟前端请求域名有关系的。 反正对我来说,没啥用无法连接。 需使用 localhost&a…