科技云报道:推进工业新质生产力机器人有望成为AI下一个新引擎?

科技云报道原创。

推进工业新质生产力,机器人有望成为AI下一个“新引擎”?

“人工智能的下一波浪潮是机器人技术,这是一个‘0亿美元市场’,但未来将价值数十亿美元,就像Nvidia刚起步时的GPU加速计算一样……”这是英伟达CEO黄仁勋对加州理工2024届毕业生的劝勉。

这不免让人想起初创公司Figure的人形机器人,其外表和动作都与人类十分相似。它可以与人流畅对话,理解人的意图。当听到工程师“想吃点东西”的口令后,它迟疑了一下,准确地拿起了苹果。它甚至可以解释自己为什么要这样做。

这一人形机器人背后,是OpenAI公司为其配置的大语言模型。多模态技术加持下,它具备高级视觉和语言智能。

随着大模型、机器人制造等技术发展,赋予人工智能“形体”的具身智能(Embodied AI)正逐步走入人工智能舞台中央。

AI技术的集大成者

“具身智能”,字面意思是“具有身体的人工智能”。简言之,具身智能就是让机器人或智能系统像生物一样,通过自己的身体去感知世界、理解世界,并在世界中行动和完成任务的智能技术。一年多来,随着政策、资本、产业、学术界的共同推动,具身智能成为广为人知的热门词汇。

如今,具身智能是人工智能产业发展的重要方向之一。英伟达近期发布人形机器人通用基础模型Project GR00T,希望能让机器人拥有更聪明的“大脑”。由Project GR00T驱动的机器人能够理解自然语言,并通过观察人类行为来模仿人类动作。在特斯拉2023股东大会上,马斯克也向大众展示了人形机器人Optimus的全新型号。这些都是具身智能驶入发展快车道的缩影。

值得一提的是,在大众语境中,具身智能常常会被认知为人形机器人,以此作为其通俗意义的指代称呼。但具身智能不能完全等同于人形机器人,它代表的是一种智能技术,当具身智能走进物理世界、与不同硬件结合时,形成的硬件有可能是机械手臂、四足或六足机器人、轮式机器人,或者人形机器人,因此二者的范畴是不同的,人形机器人只是可能承载具身智能的一个本体。

具身智能强调的是机器能够像人类一样感知和交互的能力,不仅仅局限于思维和计算能力。它涉及多个学科和技术,包括机器人学、计算机视觉、计算机图形学、语音与自然语言处理技术等,这些技术共同作用,使机器能够理解、推理并与物理世界进行有效的互动。换句话说,具身智能的独特意义在于为实体机器人安上“大脑”,让“机器”真正变成“机器人”。

随着AI技术的不断突破,机器人产业或将成为下一个万亿市场。人形机器人是AI最有前景的落地方向之一,未来不仅能将人类从低级和高危行业中解放出来,提升人类生产力水平和工作效率,还可以在工业、商业、家庭、外太空探索等领域具有广阔应用场景。

根据Precedence Research数据,2022年全球人形机器人市场规模约为16.2亿美元,预计到2032年,全球人形机器人的市场规模将增至286.6亿美元,2022-2032年的CAGR高达33.28%市场空间广阔。

当前,阻碍人形机器人商业化量产的原因包括大规模应用场景不足以及存在诸多技术问题亟待解决。

一方面,应用场景直接影响机器人需求的刚性程度,目前人形机器人应用场景仍有待挖掘。

另一方面,人形机器人尚处于功能相对简单、初步智能的形态。其解决路径核心仍是机器人功能和智能化水平提升,支撑机器人从封闭场景走向开放场景,从单一场景进入复杂场景。提升通用化水平是未来人形机器人行业发展的必由之路,必须依靠AI技术的进步和发展,AI技术与机器人的结合,将弥补当前机器人在智能性、易用性、经济性上的短板,有效提升机器人在各个行业的渗透率。

传统的深度学习模型中,机器智能往往局限于特定场景,而在ChatGPT、PaLM为代表的AI多模态大模型的赋能下,机器人可以与真实世界进行多模态交互,从而实现具身智能,并拥有不断进化、跨场景应用的能力。

技术进步与挑战并存

依托大规模数据和强大算力的大模型,为机器理解世界提供了前所未有的能力。它与具身智能的结合,预示着机器人的未来将更加智能化、互动化。

在制造业领域,机器人集成了人工智能、高端制造、新材料等先进技术,被誉为“制造业皇冠顶端的明珠”。而结合大模型的人形机器人,更是新质生产力发展的重要代表。

去年11月,工业和信息化部印发《人形机器人创新发展指导意见》,提出人形机器人集成人工智能、高端制造、新材料等先进技术,发展潜力大、应用前景广,是未来产业的新赛道。

发展具身智能,主要可从三方面发力。

一是仿生机制。具身智能的一个关键目标是使机器能像生物体一样具备感知、决策和运动能力。因此,更深入地研究和模仿复杂的生物机制,如神经系统的运行方式、生物体的自我修复能力等,是实现这一目标的重要途径。

二是基于物理的智能决策能力。智能系统需要更紧密地与其所处的物理形态融合,以便在各种环境中自然、高效地执行任务。这意味着需要发展出更先进的机器人硬件和软件技术,支持智能系统在复杂环境中的运动和操作。

三是自主学习和适应环境。具身智能系统需要具备自主学习和适应环境能力,以便能在复杂多变的环境中执行任务和解决问题。这可以通过强化学习、迁移学习等机器学习技术实现。

然而,难题和挑战也如影随形。

首当其冲的是算力。具身智能需要进行大量计算来支持感知、决策和运动过程。随着任务和环境复杂性的升级,其对算力的需求会不断增加。目前,大模型的参数已经达到万亿级别。这类大模型存在过度消耗数据和算力的问题。没有深度学习时,算力对电力的依赖每20个月翻一番;大模型时代,算力对电力的依赖,每年都要翻10到100倍。可见,算力对电力的消耗呈几何指数增长。

数据安全也不可忽视。具身智能系统需要收集和处理大量数据进行学习优化,这些数据可能包含用户个人隐私信息。除了隐私泄露,具身智能在实践应用中,还可能带来模型中毒、数据窜改、内部威胁、蓄意攻击等数据安全威胁。

随着具身智能技术不断发展,也需要关注其可能带来的伦理和道德问题。例如,如何确保机器人在执行任务时不伤害人类或造成不必要的损失,如何保证机器人行为符合人类道德和价值观等。

具身智能的万里长征

在2024北京智源大会上,针对当下人形机器人赛道参与者众多、创业项目层出不穷的现象,零一万物CEO、创新工场董事长李开复“泼”了一盆冷水,他透露,目前创新工场投资了约6家无人驾驶公司,却并没有投资任何一家具身智能、人形机器人公司。李开复指出,具身智能是物理世界跟AI的结合,一旦大模型接入物理世界,就需要面临包括安全问题、机器问题、机械问题、故障问题在内的各种问题,难度会增加很多倍。

具身智能是重要的,它可以很好地结合大模型多模态能力,而且一旦实现之后就可以产生数据,形成数据飞轮闭环,有很大的想象空间。但具身智能要在短期做好,难度很大,必然要走漫长的道路。

张亚勤从AI安全方面发出了提醒,随着AI能力的不断扩大,AI的安全风险也在扩大,因此现在考虑未来的风险是很重要的。当AGI达到一定能力并被大规模部署,那么可能会有失控的风险。目前AI仍存在可解释性问题,未来机器人数量可能会比人要多,当大模型被用到基础物理设施、金融系统,包括国家安全、军事系统等方面,就可能会有失控的风险。

人工智能的未来就像“薛定谔的猫”,充满不确定性。但可以确定的是,人类不会在各种陷阱面前望而却步、畏首畏尾。面对人工智能带来的陷阱,坚持开放而审慎、包容而敬畏、大胆而自信的心态,我们就能与新技术的更迭保持同频,站在人工智能的肩膀之上抓住机遇,确保AI技术朝着有益于人类福祉的方向发展。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、数博会、国家网安周与全球云计算等大型活动的官方指定传播媒体之一。深入原创报道云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/30468.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JAVAEE之网络原理(2)_传输控制协议(TCP)的连接管理机制,三次握手、四次挥手,及常见面试题

前言 在上一节中,我们简单介绍了 TCP 协议的相关概念和格式,而且还介绍了TCP 协议原理中的 确认应答机制、超时重传机制,在本节中我们将会继续介绍 TCP协议原理中的其他机制。 连接管理机制(安全机制) 在正常情况下&…

lvgl的应用:移植MusicPlayer(基于STM32F407)

目录 概述 1 软硬件环境 1.1 UI开发版本 1.2 MCU开发环境 1.3 注意点 2 GUI Guider开发UI 2.1 使用GUI Guider创建UI 2.2 GUI Guider编译项目和测试 2.2.1 GUI Guider编译项目 2.2.2 编译 2.3 了解GUI Guider生成代码 3 移植项目 3.1 Keil中加载代码 3.2 调用G…

漏洞挖掘 | 记一次src挖掘-小程序敏感信息泄露

权当是一次漏洞挖掘的思路分享 闲言 就现在的一个web漏洞挖掘强度还是非常高的,所以我们不妨把我们的眼光投向一个之前可能未曾涉及到的区域———小程序 是的微信小程序,这玩意的防范能力和过滤能力其实对比web方向是要弱小很多的 进入正题 以下就是…

Javase.抽象类和接口

抽象类和接口 【本节目标】1.抽象类1.1抽象类的概念1.2 抽象类语法1.3 抽象类特性1.4 抽象类的作用 2. 接口2.1 接口的概念2.2 语法规则2.3 接口使用2.4 接口特性2.5 实现多个接口2.6 接口间的继承2.7 接口使用实例2.8Clonable 接口和深拷贝2.9 抽象类和接口的区别 3. Object类…

开源一套Trados Sdlxliff 对比工具

开源一套Trados Sdlxliff 对比工具 在Trados翻译过程中经常对需要进行版本控制和对比,例如对比不同设置下生成的sdlxliff文件,对比不同的机器翻译结果以及对比机器翻译和人工翻译,对比翻译和审校等等。 当然SDL官方也提供了对比工具 https:…

[手机Linux PostmarketOS]二,cpolar实现内外网穿透

要想你的手机linux服务器能够通过外网可以访问到,必须需要借助工具把内网和外网打通,这样才能不管你在哪里都可以访问你的linux服务器,否则你只能在家连接同一的wifi网络才能连接,其实内网穿透工具大同小异,对比的是哪…

GT_BERT文本分类

目录 GT-BERT结束语代码实现整个项目源码(数据集模型) GT-BERT 在为了使 BERT 模型能够得到广泛的应用,在保证模型分类准确率不降低的情况下,减少模型参数规模并降低时间复杂度,提出一种基于半监督生成对抗网络与 BERT 的文本分类模型 GT-BERT。模型的整…

AI学习指南机器学习篇-朴素贝叶斯算法(Naive Bayes)简介

AI学习指南机器学习篇-朴素贝叶斯算法(Naive Bayes)简介 人工智能(AI)的发展正日益改变着我们的生活,而机器学习作为AI的重要分支更是受到了广泛关注。在机器学习领域中,朴素贝叶斯算法(Naive B…

【ajax基础04】form-serialize插件

目录 一:form-serialize插件 作用: 语法格式: 一:form-serialize插件 作用: 快速且大量的收集表单元素的值 例如上图对于多表单元素的情形,单靠通过”选择器获取节点.value”值的形式,获取…

使用 GCD 实现属性的多读单写

使用 Grand Central Dispatch (GCD) 实现多读单写的属性 首先需要确保在多线程环境下的线程安全性。可以使用 GCD 提供的读写锁机制 dispatch_rwlock_t 或者 dispatch_queue_t 来实现这个功能。 Swift版本的实现 怎样创建一个并发队列 ?// 使用 Swift 来实现的首…

Mongodb在UPDATE中使用二进制运算更新字段

学习mongodb,体会mongodb的每一个使用细节,欢迎阅读威赞的文章。这是威赞发布的第75篇mongodb技术文章,欢迎浏览本专栏威赞发布的其他文章。如果您认为我的文章对您有帮助或者解决您的问题,欢迎在文章下面点个赞,或者关…

.net 奇葩问题调试经历之1——在红外相机获取温度时异常

📢欢迎点赞 :👍 收藏 ⭐留言 📝 如有错误敬请指正,赐人玫瑰,手留余香!📢本文作者:由webmote 原创📢作者格言:新的征程,我们面对的不仅仅是技术还有人心,人心不可测,海水不可量,唯有技术,才是深沉黑夜中的一座闪烁的灯塔序言 我们在研发中,经常除了造产品…

Linux中ls -lsa 和ls -lst区别

在Linux中,ls 命令用于列出目录内容。当与不同的选项组合时,它可以以不同的方式显示文件和目录的详细信息。 对于 ls -lsa 和 ls -lst,它们的主要区别在于显示的列和排序方式: ls -lsa: -l: 使用长格式显示文件和目录的详细信息。…

吉时利Keithley2602B数字源表

吉时利Keithley2602B数字源表 2601B、2602B、2604B 系统 Sourcemeter SMU 仪器 2601B、2602B 和 2604B 系统 Sourcemeter SMU 仪器为 40W DC / 200W 脉冲 SMU,支持 10A 脉冲,3A 至 100fA 和 40V 至 100nV DC。它们将精密电源、实际电流源、6 位数字万用…

使用asyncua模块的call_method方法调用OPC UA的Server端方法报错:asyncio.exceptions.TimeoutError

使用asyncua模块的call_method方法调用OPC UA的Server端方法报错:asyncio.exceptions.TimeoutError 报错信息如下: Traceback (most recent call last): asyncio.run(main()) File “D:\miniconda3\envs\py31013\lib\asyncio\runners.py”, line 44, in…

Selenium屏幕截图技巧:实现自动化截屏并按日期时间格式保存图片

在自动化测试过程中,我们经常需要对测试结果进行截图保存,以便于后续的分析和报告。Selenium WebDriver提供了丰富的屏幕截图功能,可以帮助我们轻松实现这一需求。本文将介绍如何使用Selenium WebDriver进行屏幕截图,并按照日期时…

反激开关电源整流桥选型及计算

整流桥的作用就是把输入交流电压整形成直流电压,把正弦波整成馒头波,由于整流管的单向导电 性,在输入电压瞬时值小于滤波电容上电压时整流桥,在这个时候是不导通的,使整流桥的电流变 成2-3ms左右的窄脉冲。为获得所需…

openEuler2203SP1ks自动化安装

需求: 1、legacy启动 2、/boot分区1G,剩余给/ 3、创建root密码和一个普通用户user,密码Hello2024 4、最小化安装(选上development、legacy-unix、security-tools、standard) 5、关闭firewalld、selinux 6、增加安…

企业级-PDF文件下载

作者:fyupeng 技术专栏:☞ https://github.com/fyupeng 项目地址:☞ https://github.com/fyupeng/rpc-netty-framework 留给读者 一、介绍 文件下载在浏览器可以根据响应头设置纯下载和直接打开两种方式。 二、代码 RequestMapping("/…

【数据结构】选择题

在数据结构中,从逻辑上可以把数据结构分为(线性结构和非线性结构) 当输入规模为n时,下列算法渐进复杂性中最低的是() 时间复杂度 某线性表采用顺序存储结构,每个元素占4个存储单元&#xf…