大模型+人形机器人,用AI唤起钢筋铁骨

3e161cedfa3dba0f9553226ce22b9b26.jpeg 《经济参考报》11月8日刊发文章《多方布局人形机器人赛道,智能应用前景广》。文章称,工信部日前印发的《人形机器人创新发展指导意见》,按照谋划三年、展望五年的时间安排,对人形机器人创新发展作了战略部署。

从开发基于人工智能大模型的人形机器人“大脑”,到打造仿人机械臂、灵巧手和腿足,再到发布自主研发的人形机器人产品.以“大模型”为代表的技术爆发加速了人工智能产业的发展。为了抓住这一轮技术变革的浪潮,促进区域以及产业发展,多个一线城市开启了“追逐赛”。以人工智产业发展高地北京为例,《北京市促进通用人工智能创新发展的若干措施(2023-2025年)》的发布是国内首个地方政府紧贴AI大模型产业化发展提出的专项措施。当下正值ChatGPT引发的“千模大战”打响,大模型可能为各行各业带来新的效率革命和体验升级。随着AI第一城北京行动了,上海、深圳、成都等地区都已陆续采取行动,抢占发展的“窗口期”。

人形机器人技术方案包括软件层和硬件层,后者可分为控制模 块、感知模块、运动模块、动力模块、散热总装模块。我们认为软件能力决定机器人产品 力的上限,硬件能力决定机器人的落地程度。目前 ChatGPT 预训练语言模型、PaLM-E 模型等 AI 技术和大模型的发展助力机器人向具身智能逼近,硬件技术方案实际类似搭积木 的过程,核心在于主机厂对成本和性能的权衡。

在今年特斯拉股东大会上,马斯克说到:“人形机器人Optimus对运动和力量的控制以及环境感知方面有显著加强,技术正在快速迭代。预计未来机器人的需求可能会达到100亿,甚至更多。如果以人类和机器人的比例为2:1推算,那么对人形机器人的需求可能会比电动汽车的还大不少。就凭借此寥寥数语,马斯克的信心、热情和投入很快点燃了人形机器人赛道的火焰,并有愈演愈烈的趋势至今。而从实际应用的角度来看,推动整个产业链走向成熟和完善的可能也是特斯拉。

从实际技术的角度来说,特斯拉这种企业做机器人有先天性优势,因为机器人与AI的很多基本原理都是相同的,而且也可以视为电动车的自然延伸,电动车可以视为第一代的四轮机器人。前两年马斯克提出要做机器人时引来不少说他“不务正业”的嘲讽,然而今年年初,理想汽车确定的愿景是成为最优秀的AI和机器人公司,而非全球最大的电动车企业。由此可见梦想也是会传播的。特斯拉的人形机器人Optimus首次亮相是在去年官方的2022 AI Day活动上,并在现场完成了自主行走、转身、停止、挥手问候等动作。Optimus的技术大部分与特斯拉汽车的一致,如机器视觉,以及处理视觉数据、做出行动决策、支持通信交流的“大脑”,还有最重要的与特斯拉汽车一致的芯片,还搭载与特斯拉车辆同源的FSD电脑以及Autopilot相关神经网络技术,预计最终售价不超2万美元,约合14.4万元人民币。

机器人自由度与量产成本为正相关关系,商业化进展较快机器人的共性在于,面向垂直化 场景且匹配了相应的自由度,成本适中能为市场接受。如 EVE 机器人专门用于安防和夜 间巡逻,其腿部为双轮结构,虽无法跨越障碍,但可满足夜间巡逻的基本需求,售价仅 32 万元。而特斯拉 Optimus 则依托汽车产业链优势平衡了机器人自由度与量产成本的矛盾, 能完成行走、上下落体、拿物体等商业化目标明确的动作,而量产后价格仅 2 万美元(目 标),是能完成行走、搬运物体同类机器人产品价格的 1/10。

人形机器人商业化的核心桎梏在于成本,而特斯拉的 FSD 产业 资源优势大概率会为 Optimus 商业化赋能:人形机器人与 FSD 在数据调度、数据处理、 算法模型等关键能力上具有较高共用性,如 Optimus 的硬件生产可共享特斯拉汽车的供应 链;Optimus 软件架构中可应用 FSD 的感知算法、规划控制模型(机器人的规控场景更复 杂),同时机器人涉及室内环境建模,可借鉴 FSD 的 3D 地图构建经验,综上我们认为 FSD 可迁移的成熟的软硬件能力或加速人形机器人商业化落地,具体表现为以下3点:

(1)车端算法迁移:Optimus 搭载特斯拉自研芯片(单芯片算力可达 362TFLOPs),也共享特斯拉汽车自动驾驶软件平台,我们看好特斯拉自身的自动驾驶技术赋能机器人的机器视觉算法、FSD 和 Dojo的数据积累和训练模型加快机器人功能优化,从而实现降本增效。具体而言,算法上,2022 年 AP 团队在原感知算法模型加入了占用网络 Occupancy Network 和矢量地图 Lane Network,进一步提升了感知模型的精度和对 Corner Case 的 覆盖度,Optimus 将会使用和 FSD 同样的 Occupancy Network 来识别可行动区域,或能 生成效果更好的 3D 地图,以弥补特斯拉未使用高精地图和雷达在长尾问题的感知不足。基础设施上,Dojo 超算中心为 FSD 大数据训练的关键,具有高稳定、高并行算力的特征,可提供更高效的数据标注和算法迭代,有望加强机器人的算法优势。

(2)供应链迁移:人形机器人由于硬件超配且关节数目多,量产成本较高,但机器人供 应链与电车供应链有较大重合度,如人形机器人能共用汽车的芯片、电池等,并能够对电 机电器、热管理等做适应性更改再使用。

我们看好 Optimus 与 FSD 供应链接轨、共享特斯拉国产供应链优势,实现规模化降低成本。站在当前时点,我们认为人形机器人已初步突破了软件领域的部分技术桎梏。

22 年 11 月 Open AI 发布 ChatGPT,并计划赋能机器人的零次任务规划、人机交互、视觉辅助、逻辑 判断功能,实现用语言文字控制机器人;23 年 3 月谷歌 PaLM-E 模型推出,融合了 ViT Vision Transformer 的 220 亿参数和 PaLM 的 5400 亿参数能力,集成了可控制机器人视 觉和语言的能力;23 年 5 月英伟达发布多模态具身智能系统 NVIDIA VIMA,标志 AI 能力 的又一显著进步,有望显著提升机器人的智能化水平、人机交互能力、自编译能力。

2023年或为产业化的当打之年:AI、大模型深度赋能机器人感知层和规划层,助力机器人更贴近具身智能。以微软 ChatGPT 预训练语言模型、谷歌 PaLM-E 模型、英伟达多模态具身智能系统 NVIDIA VIMA 为代表的 AI 技术突破,进一步助力机器人突破产品力上限。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/139329.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【CASS精品教程】cass3d 11.0加载超大影像、三维模型、点云数据

CAD2016+CASS11.0(内置3d)下载与安装: 【CASS精品教程】CAD2016+CASS11.0安装教程(附CASS11.0安装包下载)https://geostorm.blog.csdn.net/article/details/132392530 一、cass11.0 3d支持的数据 cass11.0中的3d模块增加了多种数据的支持,主要有: 1. 三维模型 点击…

CSS实现透明度效果的两种方法—— opacity 和 rgba()

在实际开发过程中&#xff0c;为了给用户呈现一些效果&#xff0c;我们需要控制元素的透明度。CSS 提供了 opacity 属性和 rgba() 函数给我们控制透明度&#xff0c;接下来通过一个例子来感受一下两种方法的区别。 <style>.transparentBox {display: inline-block;width…

AI驱动的软件测试,何时可以信赖?

综合编译&#xff5c;TesterHome社区 作者&#xff5c;Yuliya Vasilko&#xff0c;数据工程师 以下为作者观点&#xff1a; 越来越多的组织转向人工智能&#xff08;AI&#xff09;驱动的测试解决方案&#xff0c;以简化质量保证流程并提高软件可靠性。 随着对人工智能的依赖程…

功能案例 -- 拖拽上传文件,生成缩略图

直接看效果 实现代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>拖拽上传文件</title>&l…

低价寄快递寄件微信小程序 实际商用版,对接了低价快递渠道,运营平台赚取差价,支持市面上全部主流快递

盈利模式 快递代下CPS就是用户通过线上的渠道&#xff08;快递小程序&#xff09;&#xff0c;线上下单寄快递来赚取差价&#xff0c;例如你的成本价是5元&#xff0c;你在后台比例设置里面设置 首重利润是1元&#xff0c;续重0.5元&#xff0c;用户下1kg的单页面显示的就是6元…

ElasticSearch知识点

什么是ElasticSearch ElasticSearch: 智能搜索&#xff0c;分布式的搜索引擎&#xff0c;是ELK的一个非常完善的产品&#xff0c;ELK代表的是: E就是ElasticSearch&#xff0c;L就是Logstach&#xff0c;K就是kibana Elasticsearch是一个建立在全文搜索引擎 Apache Lucene基础…

FreeRTOS源码阅读笔记2--list.c

list.c中主要完成列表数据结构的操作&#xff0c;有列表和列表项的初始化、列表的插入和移除。 2.1列表初始化vListInitialise() 2.1.1函数原型 void vListInitialise( List_t * const pxList ) pxList&#xff1a;列表指针&#xff0c;指向要初始化的列表。 2.1.2函数框架…

联系作者方式的教程

首先你应该目前是在付费资源运行效果的展示文章页面&#xff0c;如下所示 然后一直往下滑&#xff0c;滑到这个文章的最下面&#xff0c;就可以看到我的推广名片&#xff0c;最后点击这个名片就可以获取到我的联系方式了~

学习OpenCV(蝴蝶书/C++)相关——2.MacOS下使用LLDB调试cpp程序

文章目录 1. VScode中的调试2. 配置VSCode中C++的调试(以OpenCV为例)2.1 创建适用于C++的.launch文件2.2 常见参数说明2.3 调试OpenCV的.launch文件示例2.3.1 .launch文件demo2.3.2 Debug模式的可执行文件3. 联合task.json文件一起使用3.1 创建tasks.json和launch.json文件3.2 …

安装纯净版Linux后的必备设置

目录 一&#xff1a;网络设置 1&#xff0c;设置yum源 2&#xff0c;配置网络 二&#xff1a;samba服务设置 1&#xff0c;安装samba 2&#xff0c;设置samba 3&#xff0c;windows上挂载 三&#xff1a;安装必备的开发软件 1&#xff0c;GCC安装 2&#xff0c;Pyth…

JLink edu mini 10Pin接口定义

注意&#xff1a;SWD接口在阵脚2&#xff0c;4&#xff1b;而20Pin的SWD接口在阵脚7&#xff0c;9 参考&#xff1a;1 官网资料&#xff1b; 2 【润石RS0104YQ Demo开发板测试分享】J-Link EDU Mini调试5V系统_国产运算放大器_模拟开关_线性稳压器_电平转换器_小逻辑_比较器…

Linux之基本指令操作

1、whoami whoami&#xff1a;查看当前账号是谁 2、who who&#xff1a;查看当前我的系统当中有哪些用户&#xff0c;当前有哪些人登录了我的机器 3、 pwd pwd&#xff1a;查看我当前所处的目录&#xff0c;就好比Windows下的路径 4、ls ls&#xff1a;查看当前目录下的文件信…

Doris:多源数据目录(Multi-Catalog)

目录 1.基本概念 2.基本操作 2.1 查看 Catalog 2.2 新增 Catalog 2.3 切换 Catalog 2.4 删除 Catalog 3.元数据更新 3.1手动刷新 3.2定时刷新 3.3自动刷新 4.JDBC Catalog 4.1 上传mysql驱动包 4.2 创建mysql catalog 4.3. 读取mysql数据 1.基本概念 …

【MySQL】列属性

文章目录 CHAR和VARCHAR插入单行 INSERT INTO插入多行插入分层行 LAST_INSERT_IN()创建表复制 CREAT TABLE AS更新单行 UPDATE...SET更新多行在UPDATES中使用子查询【需着重复习】删除行 DELETE恢复数据库到原始状态 CHAR和VARCHAR CHAR(50)&#xff1a;存储文本占5个字符&…

Vatee万腾科技决策力的未来展望:开创数字化创新的新高度

随着科技不断演进&#xff0c;Vatee万腾的科技决策力在数字化创新领域展现出了强大的潜力和前瞻性。 Vatee万腾的科技决策力被视为数字化创新的引擎&#xff0c;为未来创新注入了新的动力。通过深刻的市场洞察和科学决策&#xff0c;Vatee万腾致力于推动数字化创新走向新的高度…

算法导论6:摊还分析,显式与隐式

P258 摊还分析概念 聚合分析&#xff0c;利用它&#xff0c;我们证明对于n&#xff0c;一个n个操作的序列最坏情况下的花费的总时间为T(n)&#xff0c;因此&#xff0c;在最坏情况下&#xff0c;每个操作的平均代价&#xff08;摊还代价&#xff09;为T(n)/n 举了例子来形容这…

C#中.NET 7.0控制台应用使用LINQtoSQL、LINQtoXML

目录 一、新建控制台应用和数据库连接 二、手动添加System.Data.Linq程序包 三、手动添加System.Data.SqlClient程序包 四、再次操作DataClasses1.dbml 五、示例 1.源码 2.xml文件 默认安装的.NET 7.0控制台应用是不支持使用LINQtoSQL、LINQtoXML的。 默认安装的.NET F…

自动驾驶学习笔记(八)——路线规划

#Apollo开发者# 学习课程的传送门如下&#xff0c;当您也准备学习自动驾驶时&#xff0c;可以和我一同前往&#xff1a; 《自动驾驶新人之旅》免费课程—> 传送门 《Apollo Beta宣讲和线下沙龙》免费报名—>传送门 文章目录 前言 路线规划 路由元素 路径搜索 最优…

【安卓13】谷歌原生桌面launcher3源码修改,修改桌面布局(首屏应用、小部件、导航栏、大屏设备任务栏)

前言 近期接到一个关于谷歌EDLA认证的需求&#xff0c;我负责的是谷歌原生桌面布局的修改&#xff0c;通过研究源码&#xff0c;将涉及到了一些修改思路发出来&#xff0c;大家可以参考一下有没有对你有用的信息。主要修改内容有&#xff1a; 1、搜索栏、底部导航栏未居中 2、…

LangChain应用全解析

一、Langchain基础 1.Langchain简介 (1)替换模型 from langchain.prompts import ChatPromptTemplatechat ChatOpenAI(temperature0) 使用代理ip llm ChatOpenAI(model_name"gpt-3.5-turbo", max_tokens2048, temperature0.5,openai_api_keyapi_key,openai_ap…