通用人工智能技术(深度学习,大模型,Chatgpt,多模态,强化学习,具身智能)

目录

前言

1.通用人工智能

1.1 生物学分析

1.2具身智能

1.2.1当前的人工智能的局限

1.2.2 具身智能实现的基础

1.2.3 强化学习(决策大模型)

2.结论

往期文章

参考文献


前言

      目前的人工智能实质上只是强人工智能,或者说单个领域的通用人工智能。比方说Chatgpt它属于自然语言处理领域的通用人工智能(语言大模型),

      所谓通用人工智能,简单理解为一种和人类一样能够思考和解决任何问题,甚至在各方面超过人类的智能体。从这个角度讲,想要理解通用人工智能,要先了解人体的各个功能

1.通用人工智能

1.1 生物学分析

理解和决策机构:

大脑:支配高级皮层的活动,如思维、运动、感觉、语言和情感等。

小脑:保持平衡,协调肌肉运动。

感知机构:
耳:听觉      鼻:嗅觉      嘴:味觉      眼:视觉

执行机构:
手臂:用于抓取、握持和搬运物品,用于平衡身体和调整姿势。
手:用于精细的动作,如写字、插针、打字等。
腿:用于站立、行走和奔跑。
足:支撑身体,保持站立稳定,参与步行和奔跑。

基于人体功能假设一个场景:

      我们命令()机器人去苹果园摘苹果,远远的它就闻()到了苹果的香味,走进时又看到了()又大又红的苹果,甚至它还偷偷尝了一个(),在这个场景下,我们用全部感知去认知这个苹果。(而目前的目标检测仅能从视觉上判断一个东西是不是苹果,显然从感知层次,这是不足够的)

      同时在采摘的过程中,它用腿和足行走到果树下面,再用手臂移动到苹果旁边,用进行抓取。(在目前的机器人行业,腿和足的功能用移动机器人实现,手臂的功能用机械臂实现,手的功能用一些末端执行器,像夹手或吸盘等,当然近期人形机器人也是爆点)

      在这整个过程中,感知机构将所获得的信息传回大脑(理解这些信息),再由大脑决定下一步应该做什么(思考),最后由小脑控制四肢(执行机构)落实大脑的决策。

      这就是人在面对一个问题时,身体各个部位所做的事情,同样,对于机器人而言,只有具备这些功能之后,才能具备了成为一个通用人工智能的可能

1.2具身智能

1.2.1当前的人工智能的局限

      今年世界机器人大会2023提到一个概念具身智能,提出这个概念是因为,当前我们所做的基于人工智能的机器人,是先在仿真环境训练模型,再将训练好的模型移植到真实世界中的机器人上,但这存在一个问题,这种训练模式下的机器人,只能解决训练环境中,已经提前模拟过的可能发生的各种问题,对于现实世界发生的没有在训练环境中模拟的情况,它不能解决。举个例子,假设我们在训练环境中,让机器人抓取一个苹果,但没有模拟抓取过程中它遇到障碍物时该如何解决,那么在真实世界中遇到障碍物时同样不知道如何解决。也就是说,机器人真实世界中它并不具备学习能力,它有的仅是在训练环境中学习到的能力,显然这不是我们想要的人工智能

1.2.2 具身智能实现的基础

      而且对于人类个体而言,尽管我们活在信息大爆炸时代,但在获取信息时,我们所学习的存在脑海中的不管是成功的还是失败的经验,都是自己独有的适合自己的,然后我们依靠这些经验,提升自己,逐步从小孩成长到大人。

      而在当前训练智能体时所采取的数据,全部来源于网络,这些数据庞大且混乱(真假难以辨别),就从Chatgpt来看,我们经常能发现它会给出一些错误的答案,这是因为它所学习到的数据并不全是对的的。但Chatgpt有一个优势,它可以和人类互动,去纠正之前错误的知识(真实世界的交互),这也就意味着Chatgpt有了进化的可能,因为它可以和全球几十亿人交流,学习他们的一切,并且能够变成自己的,甚至推陈出新。当然Chatgpt仅能算是语言(嘴和耳)的通用人工智能,扮演大脑的一部分,赋予了智能体理解人类问题以及和人类交流的能力。想要实现真正意义上的通用人工智能,我们还要获得眼,鼻等其他感知机构和现实世界的交互信息

      当前最接近具身智能的应该是数字孪生,之前我们说机器人无法解决真实世界中遇到的在训练环境中没有模拟的情况,但对于数字孪生,它可以利用虚拟环境(训练环境)实现和现实的实时交互,从而具有在真实世界学习的能力。我们还从上面的例子出发,同样我们在训练环境中让机器人抓取一个苹果,同时不设置障碍,和之前不同的是,此时在真实世界中遇到障碍,会将这个障碍信息实时反馈到虚拟环境(训练环境),那么此时机器人就可以快速在虚拟世界(训练环境)中训练,从而在真实世界避开这个障碍物,但这对于通讯的实时性和算力有很高的要求,不过确实可以利用机器人和真实环境交互后所得的信息提升自己。但是同样的,这不是真正的具身智能,因为我们当前的交互主要还是依赖于视觉信息,这中对世界的认知显然是不足够的,所以我们需要更多的大模型,视觉大模型,味觉大模型,嗅觉大模型等这样机器人才具备了和真实世界全方位交互的基础能力。而数字孪生也是具身智能的关键技术

1.2.3 强化学习(决策大模型)

      对于人类而言,小学时候老师教我们1+1=2,每次我们写错时,就给我们打个×,每次看到这个×我们就知道这样做是不对的,久而久之我们就知道1+1=2才是标准答案。这是人类在和现实世界交互后一个思考的过程,那对于机器人而言改如何思考呢?

      前面我们已经论述了具身智能所需要的感知能力,但有了这些感知能力,如何通过和现实的交互不断思考提升自己呢,这里我们引入强化学习概念,举个例子,我们询问Chatgpt一家小公司的发展历史,假设这个公司是2019年成立的,但网上存在错误信息,它不能有效识别,它可能会告诉你这个公司是2015年成立的,此时你回复它,你是不对的,这家公司实际上是2019年成立的,然后当你再次询问它这家公司什么时间成立时,它会告诉你是2019年成立的,此时,我们神奇的发现Chapt有了纠错能力。但过了很久当你再去问它时,它却又告诉你这家公司是2015年成立的,原因在于,它有一个奖励机制,假设你说这个公司成立于2019年,Chatgpt给这个答案加5分,但同时有十个人说成立于2015年,那么2015这个答案就有50分,显然Chatgpt会相信50分的答案,这和三人成虎异曲同工,所以此时我们需要找100个人回答说是2019,就可以保证答案更正为改公司成立于2019年,而在这个过程中,我们又神奇的发现,Chagpt似乎有了思考能力,它权衡了很多人的答案,最终给与出了自己的答案,这就是强化学习在语言模型中的应用Chatgpt先以深度学习基础,构建出一个笼统的答案库,再利用强化学习,不断的和人类交流,进而持续更正它的答案库中的答案。

      同样机器人执行机构运动和真实环境所得到的交互信息,也需要强化学习来思考决策过程,比方说,依然让一个机器人抓一个苹果,这个抓取过程的路线有无数可能,抓取的动作同样有无数可能,但是机器人该如何选择最好的路线和动作呢,我们引入强化学习,每一步都给一个奖励,最后我们用奖励最高的动作集合,作为决策,也就意味着,机器人通过和真实世界的交互,学到了最好的抓取苹果的动作集合。

2.结论

      从上面的论述中我们发现,感知大模型(语言大模型、视觉大模型、嗅觉大模型、味觉大模型)(深度学习),让智能体具有理解真实世界的能力,在这个能力的基础上,决策大模型(强化学习)赋予了智能体思考的能力,而数字孪生让智能体可以在虚拟环境中快速且无损的找到诸多思考下最优的解决方案,最后多模态大融合实现万态归一。

      而数字孪生的这个特点会是通用人工智能超过人类的一个关键,对于人类而言,遇到一个问题,需要花费大量的时间,多次试错,才能找到最优方案,但对于通用人工智能,它可以在虚拟环境中快速的找到最优答案,再应用于真实世界。这其中的差别,比方说,两个人在悬崖下找到了一本修仙秘籍,A苦练万年,多次历经生死大劫,九死一生之后终于得到成仙,而B找到了一个仙境,在个仙境中1亿年相当于外界一天,而且里面的人死后会瞬间复活,所以B在仙境中为了找到可以成为最强仙人的方案,疯狂作死,尝试了无数次之后,终于找到了答案,他在仙境花了365亿年,但在外界仅过了一年。

语言大模型(Chatgpt)(深度学习)和决策大模型(强化学习)的区别

      简单理解,语言大模型解决机器人能听懂什么,这赋予了智能体理解能力,决策大模型(强化学习)赋予机器人思考和决策能力,即如何最优解决一个问题的能力。Chatgpt只是利用深度学习技术,从庞大的数据库中找到一个答案,在这个过程并没有严格意义上的思考,而强化学习是面对一个问题从无到有,思考所有可能的答案,最终找到最优解决方案,显然这才符合人类的思维模式。而某种层面上思考能力是区别人和动物的根本因素

    写在最后:具身智能是通往通用人工智能的大门,而强化学习是通往具身智能的大门。

往期文章

1.具身智能(Embodied AI)_笑傲江湖2023的博客-CSDN博客

参考文献

1.大脑和小脑——规划和执行_规划决策大脑 运动控制小脑-CSDN博客

2.【AGI 通用人工智能】什么是通用人工智能 | What is Artificial General Intelligence_禅与计算机程序设计艺术的博客-CSDN博客 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/105652.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件设计师_面向对象_学习笔记

文章目录 1 面向对象基本概念2 设计模式3 UML4 设计模式4.1 设计模式的基本概念4.2 设计模式的分类4.3 创建型模式 1 面向对象基本概念 2 设计模式 3 UML 4 设计模式 4.1 设计模式的基本概念 模式:通俗的来说就是成功方案的复用。 架构模式从全局看待问题。设计模式…

LiveGBS流媒体平台GB/T28181功能-国标流媒体服务同时兼容内网收流外网收流多网段设备收流

LiveGBS流媒体平台GB/T28181功能-国标流媒体服务同时兼容内网收流外网收流多网段设备收流 1、背景2、设备接入播放2.1、查看通道2.2、直播播放 3、默认收流地址配置4、其它网络设备收流配置5、搭建GB28181视频直播平台 1、背景 服务器部署的时候,可能有多个网卡多个…

JAVA中的垃圾回收

JVM规范说了并不需要必须回收方法区,不具有普遍性,永久代使用的是JVM之外的内存 引用计数:效率要比可达性分析要强,随时发现,随时回收,实现简单,但是可能存在内存泄漏 局部变量表,静态引用变量&…

利达卓越:发挥金融力量,促进团队发展

随着中国经济的快速增长和金融改革的逐步深化,我国金融业取得了令人瞩目的发展。作为经济的重要支柱,我国金融业的规模和实力不断扩大,已经成为全球最大的金融市场之一。利达卓越是一支由管理精英组成的团队,专注于金融行业的投资…

Kafka消费者使用案例

本文代码链接:https://download.csdn.net/download/shangjg03/88422633 1.消费者和消费者群组 在 Kafka 中,消费者通常是消费者群组的一部分,多个消费者群组共同读取同一个主题时,彼此之间互不影响。Kafka 之所以要引入消费者群组…

HTTP 响应头 X-Frame-Options

简介 X-Frame-Options HTTP 响应头用来给浏览器一个指示。该指示的作用为&#xff1a;是否允许页面在 <frame>, </iframe> 或者 <object> 中展现。 网站可以使用此功能&#xff0c;来确保自己网站的内容没有被嵌套到别人的网站中去&#xff0c;也从而避免了…

定制排序小案例

案例&#xff1a;自定义 Book 类&#xff0c;里面包含 name 和 price&#xff0c;按 price 排序(从大到小)。 要求使用两种方式排序 , 有一个 Book[] books 4 本书对象. 使用前面学习过的传递 实现 Comparator 接口匿名内部类&#xff0c;也称为定制排序。 可以按照 price …

【linux】E45: ‘readonly‘ option is set (add ! to override)

vim 编辑文件保存时 E45:设置了“只读”选项&#xff08;添加&#xff01;以覆盖&#xff09; 输入&#xff1a; wq! 提示 "/etc/my.cnf" E212: Cant open file for writing 依然是没有权限&#xff1a; 解决一&#xff1a; 切换用户&#xff1a; su root 解…

黑马店评-04缓存更新策略,保证MySQL数据库中的数据和Redis中缓存的数据一致性

缓存更新策略(数据一致) 更新策略 缓存更新是Redis为了节约内存而设计出来的机制,当我们向Redis插入太多数据时就会导致缓存中的数据过多,所以Redis会对部分数据进行更新即淘汰 低一致性需求(数据长久不发生变化): 使用内存淘汰机制,例如店铺类型信息的查询缓存,因为这部分…

Gitlab CI/CD 入门教程

前言 开发人员常常提到的 CI/CD 是什么&#xff1f; 是用于集成测试的工具&#xff0c;每次提交代码后自动检测、构建和进行单元测试的过程。这一整条流水线式的测试流程我们称之为 pipeline。 入门教程 如何使用 CI/CD? 首先需要确保有可用的 runner&#xff08;如何确保…

Rust初接触

一、什么是Rust Rust 是由 Mozilla 开发的多范式编程语言&#xff0c;专注于性能和安全性。 Rust 以其先进的安全并发能力而闻名&#xff0c; 它的语法类似于 C&#xff0c;但它提供了更快的速度和内存安全性&#xff0c;但不使用垃圾收集器。 Rust 最初是为 Mozilla Firefox …

SpringCloud组件Ribbon的IRule的问题排查

最近很久没有写文章啦&#xff0c;刚好遇到了一个问题&#xff0c;其实问题也挺简单&#xff0c;但是还是得对源码有一定了解才能够发现。 最近在实现一个根据请求流量的标签&#xff0c;将请求转发到对应的节点&#xff0c;其实和俗称的灰度请求有点相似&#xff0c; 实现思…

数据结构与算法-(8)---队列(Queue)

&#x1f308;write in front&#x1f308; &#x1f9f8;大家好&#xff0c;我是Aileen&#x1f9f8;.希望你看完之后&#xff0c;能对你有所帮助&#xff0c;不足请指正&#xff01;共同学习交流. &#x1f194;本文由Aileen_0v0&#x1f9f8; 原创 CSDN首发&#x1f412; 如…

【AI视野·今日Robot 机器人论文速览 第五十三期】Thu, 12 Oct 2023

AI视野今日CS.Robotics 机器人学论文速览 Thu, 12 Oct 2023 Totally 25 papers &#x1f449;上期速览✈更多精彩请移步主页 Daily Robotics Papers Pixel State Value Network for Combined Prediction and Planning in Interactive Environments Authors Sascha Rosbach, St…

eclipse 配置selenium环境

eclipse环境 安装selenium的步骤 配置谷歌浏览器驱动 Selenium安装-如何在Java中安装Selenium chrome驱动下载 eclipse 启动配置java_home&#xff1a; 在eclipse.ini文件中加上一行 1 配置java环境&#xff0c;网上有很多教程 2 下载eclipse&#xff0c;网上有很多教程 ps&…

207、SpringBoot 整合 RabbitMQ 实现消息的发送 与 接收(监听器)

目录 ★ 发送消息★ 创建队列的两种方式代码演示需求1&#xff1a;发送消息1、ContentUtil 先定义常量2、RabbitMQConfig 创建队列的两种方式之一&#xff1a;配置式&#xff1a;问题&#xff1a; 3、MessageService 编写逻辑PublishController 控制器application.properties 配…

思维模型 峰终定律

本系列文章 主要是 分享 思维模型&#xff0c;涉及各个领域&#xff0c;重在提升认知。 1 峰-终定律的应用 1.1 迪士尼游乐园 迪士尼乐园采用了多种策略来创造令人难忘的体验&#xff0c;从而遵循峰终定律的原则。具体如下&#xff1a; 迪士尼乐园的入口设计和服务体验&…

Interlay采用Moonbeam路由流动性,为波卡发展更多流动性

波卡上的首选多链开发平台Moonbeam宣布Interlay现在支持由Carrier赋能的Moonbeam路由流动性。Carrier是一个功能强大的token和NFT跨链桥&#xff0c;支持超过12个网络。Interlay是波卡上的一条平行链&#xff0c;与HydraDX一起通过Wormhole、Moonbeam和Carrier为波卡生态挖掘流…

基于workbench的PTFE矩形密封圈压缩回弹仿真分析

研究背景&#xff1a; 近年来随着工业发展和科技进步&#xff0c;高压容器使用场景逐渐增大&#xff0c;使用环境越发苛刻&#xff0c;如高温、高压以及内部压力的波动&#xff0c;这都对容器端面密封性能的要求更为严格。端面密封所用的密封件必须具备优良的回弹性能和耐化学…

【Vue基础-数字大屏】加载动漫效果

一、需求描述 当网页正在加载而处于空白页面状态时&#xff0c;可以在该页面上显示加载动画提示。 二、步骤代码 1、全局下载npm install -g json-server npm install -g json-server 2、在src目录下新建文件夹mock&#xff0c;新建文件data.json存放模拟数据 {"one&…