浅述热点方向-具身智能

在这里插入图片描述

具身智能

1. 具身智能(Embodied AI)概述

人工智能、机器学习和计算机视觉的最新研究趋势催生了一个不断增长的研究领域,称为“具身智能”。Facebook 人工智能研究中心 (FAIR) 和英特尔实验室一直在引领嵌入式人工智能领域的新项目。“体现”被定义为“为想法提供有形或可见的形式”。简而言之,“Embodied AI”的意思是“虚拟机器人的人工智能”。更具体地说,嵌入式人工智能是为虚拟机器人解决人工智能问题的领域,虚拟机器人可以在虚拟世界中移动、观看、说话和与其他虚拟机器人交互——然后将这些模拟机器人解决方案转移到现实世界的机器人上。
具身智能的智能体拥有以下自主能力:
👁 看:通过视觉或其他感官感知环境。
​🗣交谈:根据他们的环境进行自然语言对话。
👂聆听:理解场景中任意位置的音频输入并做出反应。
​🕹行动:导航并与环境互动以实现目标。
​🤔推理:考虑并计划其行为的长期后果。
在这里插入图片描述

2. 具身智能动机

过去十年人工智能的许多进步都归功于机器学习和深度学习(例如语义分割、对象检测、图像描述)。机器学习和深度学习之所以取得成功,是因为数据量不断增加(例如 Youtube、Flickr、Facebook)和计算能力(例如 CPU、GPU、TPU)不断增加。然而,这种类型的“互联网数据”(来自互联网的图像、视频和文本)并非来自现实世界的第一人称视角。数据被打乱、随机,来自卫星、自拍照、推特,而这些都不是人类感知世界的方式。然而,机器学习方法正试图将这些数据提供给 NLP、CV 和导航问题。虽然这些领域因“互联网数据”和“互联网人工智能”而取得了很大进展,但它并不是最合适的数据,也不是最合适的方法。机器学习的方法并不符合人类的学习方式。人类通过观察、移动、互动以及与他人交谈来学习。人类从连续的经验中学习,而不是从打乱和随机的经验中学习。具身人工智能的主题是让具身代理(或虚拟机器人)以与人类相同的方式学习。这就是为什么认知科学和心理学专家的见解至关重要。这意味着虚拟机器人应该像人类一样通过观察、移动、说话以及与世界互动来学习。

虽然“实体人工智能”的方法论与“互联网人工智能”不同,但实体人工智能可以从互联网人工智能的许多成功经验中受益。计算机视觉和自然语言处理现在实际上在某些方面效果很好(如果有大量标记数据)。CV 和 NLP 领域的这些进步极大地增加了 Embodied AI 的成功潜力。

此外,现在存在大量逼真的 3D 场景,可以作为 Embodied AI 训练的模拟环境。这些环境包括 SUNCG、Matterport3D、iGibson、Replica、Habitat 和 DART。这些场景比以前的研究模拟器中使用的环境要真实得多。这些数据集的广泛公开可用性极大地增加了嵌入式人工智能的成功潜力。
在这里插入图片描述

3. 具身智能前景与挑战

李飞飞2020年提出了三个人工智能的发展方向

  • 具身智能(Embodied AI)

  • 视觉推理(Visual Reasoning)

  • 场景理解(Scene Understanding)在这里插入图片描述

我们作为人类的认知能力的基础在于我们的大脑在我们体内的物理体现。这种物理连接使我们能够直接与外部世界互动。

与此形成鲜明对比的是,大多数当代人工智能系统纯粹以数字形式存在,缺乏物理存在,也缺乏与我们居住的有形现实的直接联系。

虽然这些无形的或数字的人工智能系统在数字领域展示了非凡的能力,但它们在理解物理世界并与之交互时不可避免地遇到限制。以下是其中一些限制:
缺乏实际存在

数字人工智能系统本质上是代码、算法和数据。虽然他们擅长处理信息和解决数字领域的复杂问题,但他们缺乏有意义的现实世界交互所需的感官输入和物理存在。

环境感知有限

由于缺乏视觉、触觉或声音等感官体验,理解物理世界的复杂性对数字人工智能系统提出了挑战。因此,他们很难有效地应对现实世界的情况。

情境理解

在物理世界中,上下文起着至关重要的作用。然而,主要依赖于数据和算法的数字人工智能系统在掌握上下文方面经常遇到挑战。因此,他们很难理解微妙的细节并根据态势感知做出明智的判断。

数据依赖性

数字人工智能严重依赖历史数据,这会降低其对不可预见情况的适应性。这种以数据为中心的方法可能会限制其在动态和不断变化的现实环境中有效响应的能力。

现在具身智能挑战赛可以提供出现实的挑战:
在这里插入图片描述

4. 前沿研究成果

近期实体人工智能领域的创新进一步凸显了其潜力。以下是一些显着的进步:

OpenAI 的 Neo

OpenAI 推出了 Neo,这是一款人工智能驱动的机器人,将数字智能与物理身体相结合。Neo 在工业任务和家庭辅助方面表现出色,展示了自主性、移动性和轻量级设计,为嵌入式人工智能树立了新标准。

亚马逊的 Alexa Arena

亚马逊的 Alexa Arena是一个具体的人工智能平台,可促进无缝的人机交互。它使用户能够使用自然语言与虚拟机器人进行交流,并协助他们执行各种任务。

该平台专注于开发先进的人工智能模型。它提供了宝贵的资源,包括代码、数据集和场景,以支持人工智能的开发,从而成为推进实体人工智能和人机协作的催化剂。

梅塔的 VC-1

Meta 推出了 VC-1,这是一种人工视觉皮层,其灵感源自人类视觉皮层将视觉转化为行动的能力。VC-1 使用日常任务视频进行训练,在虚拟环境中的 17 项感觉运动任务中表现出色,超越了其前辈。

适应性感觉运动技能协调 (ASC)

Meta为具体的 AI 代理引入了自适应感觉运动技能协调(ASC)方法。这项创新使他们能够适应不断变化的环境,即使是在意外中断的情况下。令人印象深刻的是,ASC 在现实环境中涉及机器人移动和操纵的复杂任务中取得了 98% 的成功率。

麻省理工学院和斯坦福大学的控制理论和机器学习融合

麻省理工学院和斯坦福大学的研究人员设计了一种智能 方法,使无人机和自动驾驶汽车等机器人能够有效地处理具有挑战性的情况。

将控制理论与机器学习相结合,使这些机器人无需单独的指令即可学习如何移动。尽管数据很少,但该方法被证明非常有效,使其成为快速适应至关重要的情况的理想选择。

通过用户反馈来教学机器人

麻省理工学院与合作伙伴合作,简化了机器人教学过程。当机器人遇到故障时,系统会生成反事实解释,例如建议可能导致成功的替代行动。

然后,用户提供有关机器人失败原因的反馈,系统利用该反馈来提高机器人的性能。这种方法显着减少了教授机器人新任务所需的时间和精力,使其成为帮助老年人或残疾人的通用机器人的理想选择。

Reference

https://embodied-ai.org/
https://www.techopedia.com/embodied-ai-bridging-the-gap-between-mind-and-matter
https://medium.com/machinevision/overview-of-embodied-artificial-intelligence-b7f19d18022

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/611715.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024阿里云服务器ECS实例全方位介绍_优缺点大全

阿里云服务器ECS英文全程Elastic Compute Service,云服务器ECS是一种安全可靠、弹性可伸缩的云计算服务,阿里云提供多种云服务器ECS实例规格,如经济型e实例、通用算力型u1、ECS计算型c7、通用型g7、GPU实例等,阿里云服务器网aliyu…

安卓多用户管理之adb指令

前言 有一些与多用户相关的adb 指令可以更好地帮助我们了解和调试安卓多用户相关信息 一、多用户adb指令 查看用户列表   adb shell pm list users 查看用户信息: adb shell dumpsys user 创建新用户   adb shell pm create-user [–profileOf userId] [–mana…

常用服务器管理面板整理汇总

服务器管理面板是用于管理和控制服务器的软件,可以帮助管理员更轻松地进行服务器管理和维护。以下是几种常用的服务器管理面板: 1、宝塔面板【官网直达】 宝塔面板是一款服务器运维管理软件,支持Windows和Linux等操作系统,提供了…

three.js实现渐变墙效果(电子围栏)

three.js实现渐变墙效果&#xff08;电子围栏&#xff09; 图例 步骤 两个平面几何体&#xff0c;添加纹理贴图平移纹理贴图 代码 <template><div class"app"><div ref"canvesRef" class"canvas-wrap"></div></d…

【uniapp】遇到的一些问题

一、小程序中textarea ios样式不生效的方法 默认有内边距&#xff0c;加个disable-default-padding"true" 二、uni-data-picker循环使用&#xff0c;一个改了全局的值 换成了uni自带的picker&#xff0c;下面括号里必须有默认值&#xff0c;为空字符串的时候&…

软件架构之事件驱动架构

一、定义 事件驱动的架构是围绕事件的发布、捕获、处理和存储&#xff08;或持久化&#xff09;而构建的集成模型。 某个应用或服务执行一项操作或经历另一个应用或服务可能想知道的更改时&#xff0c;就会发布一个事件&#xff08;也就是对该操作或更改的记录&#xff09;&am…

STM32 使用 DS18B20 温度传感器实现环境温度监测

为了实现环境温度监测系统&#xff0c;我们可以利用STM32微控制器和DS18B20数字温度传感器。在本文中&#xff0c;我们将介绍如何通过STM32微控制器读取DS18B20传感器的温度数据&#xff0c;并展示一个简单的示例代码。 1. 系统概述 环境温度监测系统旨在使用DS18B20数字温度…

认识Linux指令 “zip/unzip” 指令

01.zip/unzip指令 语法&#xff1a; zip 压缩文件.zip 目录或文件 功能&#xff1a; 将目录或文件压缩成zip格式 常用选项&#xff1a; -r 递归处理&#xff0c;将指定目录下的所有文件和子目录一并处理 举例 将test2目录压缩&#xff1a;zip test2.zip test2/* 解压到…

代码随想录算法训练营第二十七天|39. 组合总和、40.组合总和II、131.分割回文串

39. 组合总和 题目&#xff1a; 给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target &#xff0c;找出 candidates 中可以使数字和为目标数 target 的 所有 不同组合 &#xff0c;并以列表形式返回。你可以按 任意顺序 返回这些组合。 candidates 中的 同一个…

什么是预训练Pre-training—— AIGC必备知识点,您get了吗?

Look&#xff01;&#x1f440;我们的大模型商业化落地产品&#x1f4d6;更多AI资讯请&#x1f449;&#x1f3fe;关注Free三天集训营助教在线为您火热答疑&#x1f469;&#x1f3fc;‍&#x1f3eb; 随着人工智能(AI)不断重塑我们的世界&#xff0c;其发展的一个关键方面已经…

springboot医院信管系统源码和论文

随着信息技术和网络技术的飞速发展&#xff0c;人类已进入全新信息化时代&#xff0c;传统管理技术已无法高效&#xff0c;便捷地管理信息。为了迎合时代需求&#xff0c;优化管理效率&#xff0c;各种各样的管理系统应运而生&#xff0c;各行各业相继进入信息管理时代&#xf…

浙大恩特客户资源管理系统 CrmBasicAction.entcrm任意文件上传

产品介绍 浙大恩特客户资源管理系统是一款针对企业客户资源管理的软件产品。该系统旨在帮助企业高效地管理和利用客户资源&#xff0c;提升销售和市场营销的效果。 漏洞描述 浙大恩特客户资源管理系统 fcrmbasicaction接口存在任意文件上传漏洞。攻击者可通过该漏洞在服务器…

机器学习笔记:时间序列异常检测

1 异常类型 1.1 异常值outlier 给定输入时间序列&#xff0c;异常值是时间戳值其中观测值与该时间序列的期望值不同。 1.2 波动点&#xff08;Change Point&#xff09; 给定输入时间序列&#xff0c;波动点是指在某个时间t&#xff0c;其状态在这个时间序列上表现出与t前后…

京东(天猫淘宝)数据分析工具-鲸参谋系统全功能解析——行业大盘、红蓝海市场、品牌分析、店铺分析、商品分析、竞品监控(区分自营和POP)

作为第三方电商数据平台&#xff0c;鲸参谋电商大数据系统能够为品牌方和商家提供包括行业趋势、热门品牌、店铺分析、单品分析在内的多个层面数据分析&#xff0c;帮助商家做出更加准确的经营决策&#xff0c;提升经营效率&#xff0c;实现精准营销。 下面&#xff0c;我们针…

linux和windows机器下创建共享文件夹

1、安装samba sudo apt-get install samba 2、创建共享文件夹 sudo mkdir /smb sudo chmod 777 /smb/ 3、备份配置 sudo cp /etc/samba/smb.conf /etc/samba/smb.conf.bak 4、修改配置 sudo vim /etc/samba/smb.conf 添加以下信息到文件结尾 [SMB share] #描述信息…

压测必经之路,Jmeter分布式压测教程

01、分布式压测原理 Jemter分布式压测是选择其中一台作为调度机&#xff08;master&#xff09;&#xff0c;其他机器作为执行机&#xff08;slave&#xff09;&#xff1b;当然一台机器也可以既做调度机&#xff0c;也做执行机。 调度机执行脚本的时候&#xff0c;master将会…

Springboot的配置文件详解:从入门到精通,解读配置文件的奇妙世界

目录 1、前言 2、介绍 2.1 Springboot配置文件的作用 2.2 Springboot支持的配置文件类型 2.3 Springboot配置文件的加载顺序 3、YAML配置文件 3.1 YAML基本语法介绍 3.2 YAML中的基本数据类型 3.3 YAML中的复合数据类型 3.4 YAML中的配置属性 3.5 YAML中的多环境配置…

Python虚拟环境轻松配置:Jupyter Notebook中的内核管理指南

问题 在Python开发中&#xff0c;一些人在服务器上使用Jupyter Notebook中进行开发。一般是创建虚拟环境后&#xff0c;向Jupyter notebook中添加虚拟环境中的Kernel&#xff0c;后续新建Notebook中在该Kernel中进行开发&#xff0c;这里记录一下如何创建Python虚拟环境以及添…

【python基础教程】print输出函数和range()函数的正确使用方式

嗨喽&#xff0c;大家好呀~这里是爱看美女的茜茜呐 print()有多个参数&#xff0c;参数个数不固定。 有四个关键字参数&#xff08;sep end file flush&#xff09;&#xff0c;这四个关键字参数都有默认值。 print作用是将objects的内容输出到file中&#xff0c;objects中的…

知名开发者社区Stack Overflow发布《2023 年开发者调查报告》

Stack Overflow成立于2008年&#xff0c;最知名的是它的公共问答平台&#xff0c;每月有超过 1 亿人访问该平台来提问、学习和分享技术知识。是世界上最受欢迎的开发者社区之一。每年都会发布一份关于开发者的调查报告&#xff0c;来了解不断变化的开发人员现状、正在兴起或衰落…