科技云报道:造完“大模型”,“具身智能”将引领AI下一个浪潮?

科技云报道原创。

资深机器人专家Eric Jang不久前曾预言:“ChatGPT 曾在一夜之间出现。我认为,有智慧的机器人技术也将如此。”

3月13日深夜,一段人形机器人的视频开始热传。

在视频中,Figure的人形机器人,可以完全与人类流畅对话,理解人类的意图,同时还能理解人的自然语言指令进行抓取和放置,并解释自己为什么这么做。

而其背后,就是OpenAI为其配置的大型语言模型。由于OpenAI模型还支持多模态输入,因此可为Figure提供高级视觉和语言智能。

而Figure本身,成立于2022年。从OpenAI 宣布介入与之合作,到今天它们共同推出一个能够自主对话和决策的机器人,只有13天。

具身智能的发展,显然正在加速。
在这里插入图片描述
具身智能进化速度超越想象

在去年的ITF World 2023半导体大会上,英伟达创始人兼CEO黄仁勋表示,人工智能下一个浪潮将是“具身智能”(Embodied Intelligence),是能理解、推理、并与物理世界互动的智能系统,AI与机器人的融合,具有很好的想象空间。

他还介绍了英伟达的多模态具身智能系统Nvidia-VIMA,能在视觉文本提示的指导下,执行复杂任务、获取概念、理解边界、甚至模拟物理学,标志着AI能力的显著进步。

此外,在特斯拉召开2023年年度股东大会上,马斯克展示了人形机器人Optimus的全新型号,和具身智能机器人几乎划等。

马斯克表示,人形机器人将是今后特斯拉主要的长期价值来源,他也认为,以具身智能机器人为代表的产品有望成为AI的下一浪潮。

1950年,图灵在他的论文——《Computing Machinery and Intelligence》中首次提出了具身智能的概念。

具身智能(Embodied AI)指的是,有身体并支持物理交互的智能体,如智能服务机器人、自动驾驶汽车等,具身智能机器人指的是,像人一样能够与环境交互感知、自助规划、决策、行动、执行任务的机器人。

它包含人工智能领域几乎所有的技术,包括机器视觉、自然语言理解、认知和推理、机器人学、博弈伦理、机器学习等,横跨多个学科方向,是AI的集大成者。

2023年是生成式AI的爆发之年,也被业内人士称为“机器人觉醒之年”。ChatGPT等生成式AI与人形机器人行业结合,开启了具身智能的时代。

今天,在大语言模型的普及和GPT-4等前沿模型的推动下,我们似乎见证了人工智能领域的一个新时代,人机交流也变得前所未有的流畅和无缝。

据2023年5月GGII发布的报告预测,预计到2026年,人形机器人在全球服务机器人市场中的渗透率预计将达到3.5%,市场规模超过20亿美元。

各大科技公司和学术界的顶尖学者也不断涌入这一领域的研究与产品开发当中。

然而,在繁荣热潮的背后,潜在的困境却也如影随形。尽管ChatGPT等模式革命性地变革了AI领域,但它们在理解力、联想力和交互能力等方面,仍然未能完全满足公众的期望。

这促使我们对看似毫无阻碍的进步进行重新评估,同时希望经过不懈努力,人们能攻克实现真正的具身智能所面临的复杂挑战。

当机器人遇上大模型

近年来,国内多家企业发布了自主研发的人形机器人。人形机器人是所有机器人里最复杂的一类,“具身智能”对机器人来说意味着什么?当大模型和机器人相结合,会发生哪些变化?

在“具身智能”的状态下,机器人具备自主学习和计划能力,遇到障碍和困难可以自主反应、快速解决。

目前国内已有200多个大模型,实际上人形机器人是一个载体,当大模型和人形机器人相结合时,机器人可以帮助AI大模型感知物理世界,操作环境上下文;机器人利用多模态感知控制自己的身体,完成复杂的任务。

2023年上半年,以ChatGPT为代表的大语言模型爆炸式“出圈”,大语言模型以及结合视觉等多种传感器的复杂多模态模型的成熟,是实现机器人完成具身智能的关键先决条件。

最为关键的一点是,成熟的“AI大模型”使机器人可以从程序执行导向转向任务目标导向,向通用机器人的发展迈出坚实步伐。

通俗点来说,“大模型”与机器人的融合,让发展已久的机器人能真正地长出“脑子”。

机器人的“云大脑”通过在云、边、端分布式算法、算力和大数据形成机器人智能,通过 5G等无线安全高速网络连接云端大脑和机器人本体:机器人本体在“端”侧完成各种任务。

云端大脑通过人工增强、多模态融合AI和数字生成等先进技术,实现机器人智能地自我学习、不断进化与成长。

AI真正赋能到各行各业、智能机器人走进千家万户的时代正在到来,伴随着技术的突破带来性价比提高,在未来,具身智能渗透率将有望加速提升。

根据高盛预测,在理想状态下,若机器人软硬件在短期内产生重大技术突破,实现具身智能的同时年均降本达到20%,人形机器人全球市场空间 有望在2035年达到1540亿美元,接近2021年智能汽车的市场空间,2025-2035年复合增长率达到94%。

若是在乐观情况下,人形机器人的出货量有望在2035年达到100万台,市场空间2025-2035年复合增长率有望达到59%。

人形机器人的时代正在到来

2023年11月2日,工信部印发《人形机器人创新发展指导意见》(以下简称《意见》)为人形机器人发展指明方向。《意见》中指出,到2025年,人形机器人创新体系初步建立,“大脑、小脑、肢体”等一批关键技术取得突破,确保核心部组件安全有效供给。整机产品达到国际先进水平,并实现批量生产。

2024年1月17日,AI研究实验室Midjourney创始人大卫·霍尔茨(David Holz)在社交媒体的一篇帖子写道:“我们有理由期待,到2040年,地球上将有10亿个人形机器人。到2060年,世界上将会有1000亿人形机器人。”这预示着人形机器人的新时代正在到来。

近年来,具身智能在学术界的关注度持续升温,在CoRL(机器人学习大会)上,具身智能领域的论文数量呈现出快速增长的趋势。

而在2023年初举行的 IROS(智能机器人及系统国际会议)上,具身智能也被作为一个极为重要的议题进行了深入探讨。

在2023年8月18日的世界机器人大会人形机器人技术与产业发展论坛上,2000年图灵奖获得者、中国科学院院士、清华大学交叉信息研究院院长姚期智指出,通用人工智能(AGI)的未来发展需要具备具身实体,与真实物理世界交互以完成各种任务。

只有这样,才能为产业带来更大的价值。

随着中国社会老龄化程度将逐渐加深,劳动力短缺问题日益凸显,同时中国制造业劳动力总量下降,人工成本上升,因此“机器替代人”成为了重要趋势。

目前,全球工业机器人部署量稳定增长,中国已成为世界最大的机器人市场。人形机器人在结构上与人类相似,未来有望覆盖、替换所有原本需要人类劳动力的作业场景。

根据赛迪顾问的报告,尽管目前各家人形机器人仍处于原型机研发的早期阶段,但是其带来的潜在技术变革以及对某些生产生活场景的改变值得高度关注。

人形机器人在制造业、航天探索、生活服务业、高校科研等领域具有较大的发展潜力,预计到2025年,人形机器人将有望实现在制造业场景应用的突破,小批量应用于电子、汽车等生产制造环境。

在中国,智能制造领域将成为人形机器人首个实现大规模应用的领域。人形机器人将围绕工业制造、商用服务和家庭陪伴三大场景,重新定义人工智能时代的工人,把人类从重复性劳动中解放出来。

商用服务场景是人形机器人最快应用的市场,而家庭落地场景则是人形机器人最具潜力的应用市场。

近日,美国科技公司英伟达宣布成立通用具身智能体研究实验室GEAR。

去年以来,包括中国电科21所、智元机器人、科大讯飞、小鹏汽车、傅利叶智能在内的多家国内企业相继发布了自主研发的具身智能机器人,并有多家企业拟在今年实现具身智能的商业化落地。

业界普遍认为,2024年有望成为具身智能商业落地元年。

虚拟世界,与现实世界形成鲜明对比,提供了一个更为精密和可控的环境,使得智能体能够进行更加大胆和创新的行为。

这不仅是对人类智能的延伸,更是一个通用人工智能诞生和发展的舞台,为超越人类智能水平的AI提供了理想的试验场和成长空间。

或许,这也是各大科技公司对具身智能与虚拟世界寄予厚望的深层次原因。

这预示着,一个更加智能、更加互联的未来正向我们走来。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/762280.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【算法】差分算法详解(模板)

类似于数学中的求导和积分之间的关系,差分可以看成前缀和的逆运算。 差分数组: 首先给定一个原数组a:a[1], a[2], a[3],,,,,, a[n]; 然后我们构造一个数组b : b[1] ,b[2] , b[3],,,,,, b[i]; 使得 a[i] b[1] b[2 ] b[3] ,,,…

CAD建筑版2024 安装教程

CAD建筑版是一种专门用于建筑设计和绘图的CAD软件版本。它提供了专业的建筑设计工具和功能,帮助建筑师、设计师和工程师在建筑领域进行快速、准确和高效的设计工作。 CAD建筑版具备建筑相关的库和元素,用户可以方便地使用预定义的建筑符号和元素进行建筑…

网络基础(二)

1、应用层 程序员写的一个个解决我们实际问题, 满足我们日常需求的网络程序, 都是在应用层; 1.1、再谈 "协议" 协议是一种 "约定". socket api的接口, 在读写数据时, 都是按 "字符串" 的方式来发送接收的. 如果我们要传输一些 "…

设计模式学习笔记 - 设计原则与思想总结:2.运用学过的设计原则和思想完善之前性能计数器项目

概述 在 《设计原则 - 10.实战:针对非业务的通用框架开发,如何做需求分析和设计及如何实现一个支持各种统计规则的性能计数器》中,我们讲解了如何对一个性能计数器框架进行分析、设计与实现,并且实践了一些设计原则和设计思想。当…

IP代理技术革新:探索数据采集的新路径

引言: 随着全球化进程不断加深,网络数据采集在企业决策和市场分析中扮演着愈发重要的角色。然而,地域限制和IP封锁等问题常常给数据采集工作带来了巨大挑战。亿牛云代理服务凭借其强大的网络覆盖和真实住宅IP资源,成为解决这些问…

Metasploit Pro 4.22.2-2024021501 (Linux, Windows) - 专业渗透测试框架

Metasploit Pro 4.22.2-2024021501 (Linux, Windows) - 专业渗透测试框架 Rapid7 Penetration testing, Release Feb 15, 2024 请访问原文链接:https://sysin.org/blog/metasploit-pro-4/,查看最新版。原创作品,转载请保留出处。 作者主页…

verilog设计-CDC:单bit脉冲快时钟域到慢时钟域

一、前言 当单bit信号由快时钟域传递给慢时钟域时,快时钟域的异步信号最小可为快时钟信号的一个时钟周期脉冲,快时钟域的单时钟周期脉冲长度小于慢时钟域的时钟周期,很有可能该脉冲信号在慢时钟域的两个时钟上升沿之间,导致该脉冲…

Django数据库查询

聚合查询 分组查询 F与Q查询 默认情况下,用Q包裹的两个条件,用逗号分割也是and关系 choices参数 只要某个字段的可能性是完全可以列举出来的,可以采取choices参数 该gender字段存的还是数字,但是如果数字在上面的元组列举范围内,该怎么获取对应的值,如果不在范围内,会怎…

20240321, 字符串操作,STRING.H,字符串函数的实现

啥意思,这个循环是?每次给P分配一个字节,然后把那个位置写入0?但是0是整数吧?他需要四个字节???这和0地址有什么关系……啊啊啊啊啊 一,字符串操作 1.0 字符数组 补 0…

LeetCode_Java_递归系列(题目+思路+代码)

206.反转链表 给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 示例 1: 输入:head [1,2,3,4,5] 输出:[5,4,3,2,1]以此类推,直到反转结束返回头结点 class Solution {public ListNode rever…

是德科技N9020A信号分析仪

181/2461/8938产品概述: N9020A MXA信号分析仪通过增加针对新一代技术的信号分析和频谱分析能力,具备了中档分析仪的更高性能。它突破了以往分析仪的极限,支持业界更快的信号和频谱分析,实现了速度与性能的更佳优化。 速度 测试速度超过其它…

linux之shell脚本基础

1.构建基础脚本 1.1 创建shell脚本 1.1.1 第一行需要指定使用的shell # 用作注释行.shell并不会处理脚本中的注释行,但是第一行的注释,会告诉shell使用哪个shell来运行脚本. #!/bin/bash 1.1.2 让shell找到你的脚本 直接运行脚本会提示-bash: a.sh: command not found.因…

一套键盘鼠标控制两台电脑 Mouse Without Borders

有两台电脑,一台笔记本一台台式机,拥有各自拥有鼠标和键盘,但总是需要切换,感觉太麻烦,想找个简单的方式,不需要额外操作就能同时操作这两台电脑。无意间发现了一个微软软件Mouse Without Borders&#xff…

算法体系-13 第十三 二叉树的基本算法+二叉树的递归套路

一 完全二叉树的判断 1.1 描述 完全二叉树:他每一层都是满的,即使不满也是最后一层不满,最后一层不满也是从左到右变满的;话句话说就是 完全二叉树从根结点到倒数第二层满足完美二叉树,最后一层可以不完全填充&#x…

MySQL数据库 - 索引

一. 索引的相关知识 1. 索引的概念 是一个排序的列表,存储着索引值和这个值所对应的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应…

【Godot 3.5控件】用TextureProgress制作血条

说明 本文写自2022年11月13日-14日,内容基于Godot3.5。后续可能会进行向4.2版本的转化。 概述 之前基于ProgressBar创建过血条组件。它主要是基于修改StyleBoxFlat,好处是它几乎可以算是矢量的,体积小,所有东西都是样式信息&am…

基于Arduino IDE 野火ESP8266模块WIiFi开发

一、函数介绍 头文件 #include <ESP8266WiFi.h> #include <ESP8266WiFiMulti.h>ESP8266WiFi.h库主要用于连接单个WiFi网络。如果需要连接到多个WiFi网络&#xff0c;例如在需要切换不同网络或者备用网络时&#xff0c;可以使用ESP8266WiFiMulti.h头文件&#xff…

java.lang.String final

关于String不可变的问题&#xff1a;从毕业面试到现在&#xff0c;一个群里讨论的东西&#xff0c;反正码农面试啥都有&#xff0c;这也是我不咋喜欢面试代码&#xff0c;因为对于我而言&#xff0c;我并不喜欢这些面试。知道或不知道基本没啥含氧量&#xff0c;就是看看源代码…

【ZooKeeper】2、安装

本文基于 Apache ZooKeeper Release 3.7.0 版本书写 作于 2022年3月6日 14:22:11 转载请声明 下载zookeeper安装包 wget https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/zookeeper-3.7.0/apache-zookeeper-3.7.0-bin.tar.gz解压 tar -zxvf apache-zookeeper-3.7.0-b…

数据结构从入门到精通——二叉树的实现

二叉树的实现 前言一、二叉树链式结构的实现1.1前置说明1.2二叉树的手动创建 二、二叉树的遍历2.1 前序、中序以及后序遍历二叉树前序遍历二叉树中序遍历二叉树后序遍历2.2 层序遍历练习 三、二叉树的具体代码实现二叉树的节点个数二叉树叶子节点个数二叉树第k层节点个数二叉树…