让ChatGPT等模型学会自主思考!开创性技术“自主认知”框架

ChatGPT、百度文心一言、Bard等大语言模型展现出了超强的创造能力,加速了生成式AI的应用进程。但AI模型只能基于训练数据执行各种任务,无法像人类一样利用生活知识、过往经验用于复杂的推理和决策。

例如,在玩游戏时,人类可以利用各种线索、常识、经验以及对游戏规则的理解做出最佳决策。而AI只能通过大量训练学习游戏的模式,不具备人性化理解功能。一旦游戏规则或环境发生变化,AI就很难做出正确的选择。

为了解决这些难题,克莱姆森大学AI实验室提出了自主认知技术框(Autonomous Cognitive Entity,简称“ACE”)。通过道德、全局战略、代理模型、执行、认知控制和任务执行6大分层设计,使AI模型可以实现“自主决策”和道德推理的认知架构。

长期以来,让AI模型具备“常识推理”的能力一直是科研界的重中之重。而ACE框架被视为解决这个难题的创新性突破研究。

其实ACE概念与前不久中国科学院自动化研究所和耶鲁大学提出的“思维传播”技术框架类似,都是让大模型学会利用过往经验增强复杂推理能力来处理全新的问题,只不过推理分层更加具体化,并加入了道德规范的限制保证输出内容的安全性。

论文地址:https://arxiv.org/abs/2310.06775
在这里插入图片描述

ACE技术框架得到了业界众多技术大牛的认可。斯坦福大学计算机科学系教授John Etchemendy表示,ACE框架标志着人工智能研究的新范式,其分层抽象和信息反馈的设计对实现人工常识推理大有帮助。

麻省理工AI实验室主任Daniela Rus认为,ACE框架构建了一个集成伦理、认知和计算原理的完整结构,为人工常识推理提供了新的研究方向。

ACE框架的总目标是实现一种既高能又伦理的人工智能系统。其核心创新在于融合了顶层的抽象伦理推理与底层的具体任务实现,构建一个闭环完整的认知体系。

ACE主要由道德、全局战略、代理模型、执行、认知控制和任务执行6大层组成,每一层集中处理不同的功能,高层处理抽象推理,低层负责具体任务执行。

在这里插入图片描述

道德层

最高的道德层确定了整个系统的方向和原则, 其功能是定义一个自治代理的核心价值观和伦理原则,包含3部分。

(1)基本伦理准则:这是直观的道德准则,为系统提供基本遵循。

(2)次要原则:诸如人权义务等提供具体指导。

(3)使命宣言:定义代理的核心目标和意图。

全局战略层

在接收到来自道德层的抽象使命后,全局战略层会结合具体情境,制定实现这些使命的长期计划,包含2部分。

(1)情境融合:吸收环境信息,理解代理面临的具体情境。

(2)战略文件:产出指导性文件,为下层提供行动指南。

在这里插入图片描述

代理模型层

致力于理解一个代理在给定环境下的能力参数、系统结构、限制条件等,构建一个“自我模型”为决策提供依据,包含4部分。

(1)运行参数:通过监测获得的遥测数据。

(2)配置信息:软硬件架构、版本等。

(3)能力范围:可以完成和不能完成的事项。

(4)局限性:只能在特定条件下工作的约束。

执行功能层

执行功能层扮演“项目经理”的角色,将来自高层的战略使命转化为明确的计划路线图。路线图提供所有具体的执行步骤,同时考虑资源分配和风险管理,使战略落地,包含4部分。

(1)定义任务步骤:将战略任务分解为细粒度操作。

(2)设置检查点:定义重要的中间结果以验收进展。

(3)分配资源:优化资源使用以保证计划顺利执行。

(4)评估风险:预测可能的问题并提前规划应对措施。

在这里插入图片描述

认知控制层

认知控制层扮演“任务管理”的角色,会根据当前环境和反馈动态选择和调度合适的任务,包含4部分。
在这里插入图片描述

(1)任务选择:根据优先级、环境等选择下一个任务。

(2)任务切换:在任务间流畅切换以优化订单。

(3)挫折感知:如果任务重复失败会产生主动变更。

(4)内部调节:思考不同选择的利弊。

任务执行层

最后的任务执行层直接与环境交互,执行由认知控制层下达的特定任务。根据任务类型,可以调用API接口、控制机械装置、进行对话等,包含3部分。

(1)数字通信:使用编程语言和接口调用实现数字任务

(2)物理协同:控制机器人和传感器完成物理任务

(3)结果监测:比较结果与预期,发送成功或失败反馈

这种分工明确的多层设计有诸多好处:第一,不同层级可以同时并行工作,提升了效率;第二,分层的封装和信息隐藏增强了系统的安全性和可解释性;

第三,分层使系统可以模块化迭代升级,而不需要全重构;第四,高层可以监控低层的运行, 当Einmal出现偏差可以进行修正,保证系统的可控性。

在这里插入图片描述

此外,ACE框架的另一个创新在于巧妙利用了当前热门的大语言模型,例如,ChatGPT、Bard等。

这些模型通过学习海量文本数据,已经展现了接近人类的语言理解和语言生成能力。ACE框架将语言层面融入每个层级,使语言模型不再单独运行,而是成为支撑整个认知架构的关键组件。

从道德层到任务层,语言模型帮助理解抽象概念,进行策略推理,建立自我模型,甚至最终控制机器人执任务的方式都是语言化的。

这种融合为语言模型提供了明确的上下文和指导,让其生成的输出更加准确,避免了“自说自话”的问题。

这也表明,大语言模型也可以在系统级扮演重要角色,而不仅仅是完成单个语言任务。ACE框架展示了如何更好地利用大语言模型的潜力,将其打造为推动认知发展的核心引擎,为人工常识推理提供动力。

本文素材来源克莱姆森大学论文,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/107421.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python 控制语句

目录 1 选择结构1.1 单分支选择结构1.2 条件表达式详解1.3 条件表达式中,不能有赋值操作符“”1.4 双分支选择结构1.5 三元条件运算符1.6 多分支选择结构1.7 选择结构嵌套 2 循环结构2.1 while循环2.2 for循环和可迭代对象遍历2.3 可迭代对象2.4 range对象2.5 嵌套循…

2023年淘宝天猫双11红包领取活时间什么时候开始领天猫淘宝双十一红包优惠券?

2023年淘宝天猫双11红包领取活动开始与结束时间 2023年10月24日20:00开始领取至11月11日23:59结束; 2023年淘宝天猫双11红包活动使用开始与结束时间 第一波:2023年10月31日20:00开始使用至11月3日23:59 第二波:2023年11月10日20:00开始使用…

【Linux】使用timer_create()创建定时器发送信号并使用sigaction()处理信号

0x00 前言 最后更新时间&#xff1a;2023-10-16 0x01 主要函数及结构体介绍 1.sigaction函数 #include <signal.h> int sigaction(int signum, const struct sigaction *act,struct sigaction *oldact);功能&#xff1a; 用于改变进程接收到特定信号后的行为。 参数…

华为eNSP配置专题-ACL的配置

文章目录 华为eNSP配置专题-ACL的配置1、前置环境1.1、宿主机1.2、eNSP模拟器 2、基本环境搭建2.1、基本终端构成和连接2.2、各终端基本配置2.2.1、PC1和PC2的配置2.2.2、模拟互联网的路由器的配置2.2.3、财务部服务器的配置2.2.4、路由器AR1的配置 2.3、让各网段能够ping通互联…

ESP8266 Node Mcu开发板连接WIFI并上报数据到MQTT服务器——物联网应用开发

一、前言 本文主要介绍关于ESP8266 Node Mcu开发板如何连接WIFI并将本地采集的数据上传到MQTT服务器中。 大家调试可以使用MQTTBox 二、WIFI连接 首先&#xff0c;导入WIFI连接所需的头文件&#xff0c;引入所需库。 #include <ESP8266WiFi.h> 声明字符串常量&#xff0…

Vue项目路由加前缀

Vue项目路由加前缀 vue-cli3.0配置 1&#xff09;静态资源前缀 vue.config.js /module.exports 配置 publicPath&#xff1a;“/前缀” 2&#xff09;路由前缀 route/index.js export default new Router({ base:”/前缀" , }) 参考文章&#xff1a;https://blog.csd…

【00】神经网络之初始化参数

问题描述 #随机初始化权重 w12 np.random.randn(100, 784)/np.sqrt(784) 为什么除以28 回答 这里的代码是初始化一个深度学习模型中的权重矩阵w12。权重矩阵的形状是(100, 784)&#xff0c;这是一个从784个输入节点到100个隐藏节点的全连接层。 除以np.sqrt(784)是权重初始…

Qt QMovie和QLabel配合播放GIF表情包

文章目录 效果演示main函数创建MoviePlayer对象头文件movieplayer.h源文件movieplayer.cpp代码解释在Qt框架中,QMovie是用于处理动画和视频的类。所有源码已在本篇文章公布。 效果演示 main函数创建MoviePlayer对象 #include <QApplication>#include "movie

git pull and git fetch 到底有什么区别?

大家好这里是tony4geek 。 今天给大家介绍git pull and git fetch 有什么区别&#xff1f; 开发过程中大家肯定很多人都用到过git。获取代码有很多的git命令&#xff0c;最长用的命令是pull和fetch。那么问题来了他们之间到底有什么区别&#xff0c;该怎么使用呢&#xff1f;…

scratch身高统计 2023年9月中国电子学会图形化编程 少儿编程 scratch编程等级考试三级真题和答案解析

目录 scratch身高统计 一、题目要求 1、准备工作 2、功能实现 二、案例分析

docker容器内安装项目运行环境(python依赖包+allure)

目录 一、安装自动化项目依赖包1.导出项目依赖库2.上传到远程仓库3.进入jenkins容器内&#xff0c;检查是否安装git4.配置git用户信息5.生成秘钥6.把代码拉取下来7.安装python项目依赖8.运行项目 二、安装allure1.jenkins容器内安装allure&#xff0c;进入/usr/local/2.下载all…

MyBatisPlus的学习项目页面

MyBatisPlus通过扫描实体类&#xff0c;并基于反射获取实体类信息作为数据库表信息 类名驼峰转下划线作为表名 名为id的字段作为主键 变量名驼峰转下划线作为表的字段名 常见注解 TableName&#xff1a;用来指定表名 Tableld&#xff1a;用来指定表中的主键字段信息 Tabl…

修改http_charfinder.py使能在python311环境中运行

需要修改两个函数&#xff0c;第一个是init函数&#xff0c;修改如下&#xff1a; async def init(loop, address, port): # <1> # app web.Application(looploop) # <2> # app.router.add_route(GET, /, home) # <3> app web.Application(…

kong网关从入门到放弃

Kong网关是一个轻量级、快速、灵活的云名称API网关。Kong Gateway位于您的服务应用程序前面&#xff0c;可动态控制、分析和路由请求和响应。KongGateway通过使用灵活、低代码、基于插件的方法来实现您的API流量策略。 https://docs.konghq.com/gateway/latest/#features 架构…

面试题-React(十二):React中不可变数据的力量

一、不可变数据的概念 不可变数据意味着数据一旦创建&#xff0c;就不能被更改。在React中&#xff0c;每次对数据的修改都会返回一个新的数据副本&#xff0c;而不会改变原始数据。这种方式确保了数据的稳定性和一致性。 二、Props中的不可变数据 在React中&#xff0c;组件…

TikTok国际版 使用特网科技Bluestacks模拟器安装方法

特网科技Bluestacks模拟器主机 桌面自带Bluestacks模拟器 TikTok国际版Bluestacks模拟器搜索tiktot 登录google应用商店-安装TikTok 安装过程可能需要3-5分钟不等-配置过低可能会导致安装失败&#xff0c;建议升级更高内存。 安装完成-打开 安装成功APP-我的游戏查看 打开国际版…

rust: function

///file: nestd.rs ///ide: RustRover 233.8264.22 /// /// /// /***自定义函数*/ pub fn function() {println!("called my::nested::function()"); }#[allow(dead_code)] fn private_function() {println!("called my::nested::private_function()"); }/…

一百八十九、ClickHouse——在海豚调度器中执行ClickHouse建库建表语句

一、目的 由于Hive处理好的结果数据要同步到ClickHouse中&#xff0c;因此需要在在海豚调度器中执行ClickHouse的ADS层的建库建表语句 二、执行步骤 &#xff08;一&#xff09;情形一&#xff1a;ClickHouse和海豚在同一服务器上 1、直接在海豚中创建执行SQL文件脚本的工作…

iOS代码混淆-从入门到放弃

​ 目录 1. 什么是iOS代码混淆&#xff1f; 2. iOS自动代码混淆的方法是什么&#xff1f; 3. iOS代码混淆的作用是什么&#xff1f; 4. 怎么样才能做到更好的iOS代码混淆&#xff1f; 总结 参考资料 1. 什么是iOS代码混淆&#xff1f; 代码混淆是指将程序中的方法名、属…

ggplot2 -- geom_linerange 函数的简单使用

brief 需要三个参数确定一个直线&#xff0c;x轴位置&#xff0c;y轴起始位置&#xff0c;y轴结束位置。 有别于一些垂直辅助线&#xff0c;可以实现柱状图&#xff0c;瓷砖图等等。 example 实现柱状图 library(tidyverse)tibble(theta seq(from 0, to 1, by .1),prio…