基础模型的工具学习:综述

23年6月清华、人大、UIUC、纽约大学、北邮和CMU等的论文“Tool Learning with Foundation Models”。

人类拥有创造和利用工具的非凡能力,使他们能够克服物理限制并探索新领域。随着最近强大的基础模型的出现,人工智能系统有可能像人类一样熟练地使用工具。这种范式被称为带有基础模型的工具学习,结合了专业工具和基础模型的优势,以提高解决问题的准确性、效率和自动化。

本文中对工具学习进行了系统的调查和全面的回顾。首先介绍工具学习的背景,包括其认知起源、基础模型的范式转变以及工具和模型的互补作用。回顾现有的工具学习研究,并制定了一个通用的工具学习框架:从理解用户指令开始,模型应该学会将一个复杂的任务分解为多个子任务,通过推理动态调整其规划,并通过选择合适的工具来有效地攻克每个子任务。还讨论如何训练模型以提高工具使用能力并促进工具学习的泛化。

作者对 18 个代表性工具进行了实验,并展示了当前基础模型在巧妙利用工具方面的潜力。最后,讨论了一些需要进一步研究工具学习的开放问题,例如确保工具的安全和可信使用、利用基础模型创建工具以及解决个性化挑战。

相关代码和数据集公开:https://github.com/OpenBMB/BMTools

如图所示:工具学习结合基础模型和专有工具

添加图片注释,不超过 140 字(可选)

人类在工具使用体现的智能水平,分为​​三种模式:辅助工具的使用通常是被动且无意识的(例如,在避雨走廊行走);任意工具的使用需要主动交互(例如驾驶、使用智能手机);自由工具的使用还需要理解并选择适合场景的工具(例如,烹饪新菜肴)。

在这个框架中,工具使用的三种模式呈现出渐进的关系,工具使用的关键认知过程是技术推理,观察使用、选择或制作工具而不是大量实践来学习新的动作。

使用工具的能力深深植根于认知和感知系统中,相比之下,基础模型主要依赖于预训练数据的统计模式,其工具使用能力与人类模型之间仍然存在显着差距。

人类可以感知工具的属性,并为每项任务选择合适的工具。认知工具分类:
(1) 支持认知过程(例如,记录中间推理结果),
(2) 减轻低层认知的负荷,为高级思维释放资源,
(3) 使学习者能够参与能力范围之外的活动,
( 4)允许学习者生成并测试假设(例如医学院学生的模拟诊断)。

如图从接口角度把工具分为三个:基于物理交互、基于GUI和基于程序

添加图片注释,不超过 140 字(可选)

存在许多超越纯自然语言范围的任务。例如,生成演示幻灯片、通过 CAD 应用程序构建 3D 模型以及通过分析团队成员日历来安排会议,这些都是传统AI中尚未定义的复杂任务的示例。幸运的是,LLM强大的泛化能力使用自然语言作为媒介,通过操作工具来完成这些任务。
本质上,工具学习的关键是将复杂的任务分解为子动作,以自然语言的形式将动作token化,并将其转换为特定工具可以理解的可执行指令。语言模型充当“翻译器”,使没有专业技术知识的个人更容易完成复杂的任务。工具学习的潜在应用从自动化客户服务和个人助理到自动驾驶汽车,甚至太空探索。使机器能够以更自然、更细致的方式理解人类语言并与之交互,就可以释放以前不可能的协作和解决问题的新可能性。预计工具学习将有助于通过共享工具促进不同任务的集成。因此,虽然自然语言界面已经实现了语言领域内的统一,但非语言任务带来的挑战需要更先进的方法来利用自然语言和工具学习。利用自然语言的力量,就可以创建能够理解和适应周围复杂且动态的世界的系统,从而为创新和发现开辟新的途径。

旨在简化具体和特定目标的工具,其优点包括:
(1) 减轻记忆:相对较短的上下文来提示 。
(2) 增强专业知识:利用定制算法来满足特定领域任务的需求 。
(3) 更好的可解释性: 理解调用某些工具以及对最终输出的贡献 。
(4)提高稳健性: 工具专门针对其预期用例而设计,与输入扰动无关。

基础模型可以为理解、规划、推理和生成提供坚实的基础,这为工具学习带来了以下几个好处:
(1)提高决策和推理能力。基础模型经过大量数据的训练,使它们能够获取广泛领域的世界知识。如果指导得当,这些知识可以用来在较长的时间范围内进行决策和规划(Huang 等人,2022a)。此外,基础模型表现出了卓越的推理能力(Wei et al., 2022c; Wang et al., 2022a),从而使它们能够推断行动的后果并做出明智的决策。这些推理能力对于需要深入理解因果关系的任务特别有用。
(2)更好的用户体验。受益于基础模型强大的意图理解能力,工具学习可以彻底改变人类与机器交互的方式,并将用户从认知负担中解放出来,使他们能够参与更高阶的思维和决策过程。这反过来又促进了一种无缝且更自然的基于语言的交互范例,彻底改变了传统的图形用户界面 (GUI)。用户只需要提供高层指导和指导,模型就会无缝理解用户的意图,从而提供更加个性化和精确的响应。此外,工具学习有可能使复杂工具的访问民主化。借助基础模型,即使是新手用户也可以轻松快速地开始使用新工具,无论他们以前的经验或技术专业知识如何。这不仅降低了新用户的进入门槛,而且还释放了创新和创造力的大量可能性。然而,应该指出的是,工具使用中的人模协作也会引发伦理问题。

如图是工具学习框架的插图,展示了人类用户和框架的四个核心要素:工具集、控制器、感知器和环境。用户向控制器发送指令,然后控制器做出决策并在环境中执行工具。感知器接收来自环境和用户的反馈,并将其汇总到控制器。

添加图片注释,不超过 140 字(可选)

工具集(Tool Set):可供模型使用的各种工具。
控制器(Controller):基础模型建模,负责接收用户的指令,并根据指令制定可执行的规划并调用工具执行。
感知器(Perceiver):负责接收来自环境和用户的反馈信息,汇总给控制器。
环境(Environment):模型所处的场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/12006.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

实践指南:如何将 SpringBoot 项目无缝部署到 Tomcat 服务器

序言 SpringBoot 是一个用来简化 Spring 应用初始搭建以及开发过程的框架,我们可以通过内置的 Tomcat 容器来轻松地运行我们的应用。但在生产环境中,我们可能需要将应用部署到独立的 Tomcat 服务器上。本文给大家介绍 SpringBoot 项目部署到独立 Tomcat…

三:哈希map day6 哈希表理论基础 ● 242.有效的字母异位词 ● 349. 两个数组的交集 ● 202. 快乐数● 1. 两数之和

今日任务 ● 哈希表理论基础 ● 242.有效的字母异位词 ● 349. 两个数组的交集 ● 202. 快乐数 ● 1. 两数之和 今日任务 242.有效的字母异位词 题目 大型概括:map 的使用 1.题目描述-->思路: 给出两个string s,t; …

Android Update Engine 分析(二十九)如何进行连续多个版本的升级?

本文为洛奇看世界(guyongqiangx)原创,转载请注明出处。 原文链接:https://blog.csdn.net/guyongqiangx/article/details/138849767 0. 背景 关于如何连续进行多个版本升级,这是一个很常见的需求,也是 OTA 讨论群里试不试就会讨论的一个话题。 例如,昨天一个小伙伴在群里…

a-auto-complete 请求后端数据做模糊查询,解决下拉框选择选不上,不回显的问题

a-auto-complete 请求后端数据做模糊查询,解决下拉框选择选不上,不回显的问题 记录一个a-auto-complete卡bug卡了两天,找不到哪里的问题下拉框选择选不上,不回显,最后终于解决了。 我还对下拉框显示的内容做了小调整。…

越来越真的Deepfake再次引起网安界的关注

当地时间5月6日,全球网络安全领域最受关注的年度盛会 RSAC 2024在美国旧金山隆重开幕。当天,被誉为“安全圈奥斯卡”的创新沙盒大赛也决出了冠军,Reality Defender凭借其创新性的深度伪造(Deepfake)检测平台摘得桂冠&a…

【漏洞复现】泛微OA E-Cology users.data信息泄露漏洞

漏洞描述: 泛微OA E-Cology是一款面向中大型组织的数字化办公产品,它基于全新的设计理念和管理思想,旨在为中大型组织创建一个全新的高效协同办公环境。泛微OA E-Cology users.data存在敏感信息泄露漏洞,攻击者利用此漏洞可以获取…

Excel 根据包含的关键词将指定列按关键词指定顺序排列

例题描述和简单分析 有 Excel 文件,数据如下所示: AB1Parent ColumnModifier (Column)2Jack lives in the villageRose3As mentioned by jackVillage4Rose already spoke to jack about last nightJack5Rose left the village6rose was their yesterda…

DigitalOcean 应用托管更新:应用端到端运行时性能大幅改进

DigitalOcean 希望可以为企业提供所需的工具和基础设施,以帮助企业客户加速云端的开发,实现业务的指数级增长。为此 DigitalOcean 在 2020 年就推出了App Platform。 App Platform(应用托管) 是一个完全托管的 PaaS 解决方案&…

ubuntu下使用docker安装kafka

1.先安装zookeeper docker run -d --restartalways -e ALLOW_ANONYMOUS_LOGINyes --log-driver json-file --log-opt max-size100m --log-opt max-file2 --name zookeeper -p 2181:2181 -v /etc/localtime:/etc/localtime bitnami/zookeeper:latest 2.安装kafka docker run…

Docker 的 Ubuntu 操作系统镜像

Debian 和 Ubuntu 都是目前较为流行的 Debian 系列 的服务器操作系统,十分适合研发场景。 Debian 和 Ubuntu 属于同一系列的发行版。Debian 是由 Ian Murdock 在 1993 年创建的最初的发行版。Ubuntu 是 Mark Shuttleworth 在 2004 年基于 Debian 创建的发行版。 Li…

2024 National Invitational of CCPC (Zhengzhou)(CCPC郑州邀请赛暨CCPC河南省赛)

2024 National Invitational of CCPC (Zhengzhou) 2024CCPC郑州邀请赛暨CCPC河南省赛 2024 National Invitational of CCPC (Zhengzhou) B. 扫雷 1 题意:扫n轮雷,每轮开始获得一枚扫雷币,可保存,从第一轮开始,可以…

STM32 CANFD 基础知识留档

讲得比较细的文章但可能有问题自行判定 附1 附2 前言 CAN2.0 协议中数据段波特率和仲裁段波特率默认是一致,因此只需要关注传输波特率即可 CANFD 协议是向下兼容 CAN2.0 的数据通讯,因此实际使用中需要配置 STM32H7 系列支持的标准是 Compliant with …

大语言模型中上下文长度扩展技术的内容、原因和方式-综述

24年1月阿联酋科技创新研究院、孟加拉国伊斯兰科技大学、斯坦福大学、亚马逊公司和南卡大学AI研究院的论文“The What, Why, and How of Context Length Extension Techniques in Large Language Models – A Detailed Survey“。 LLM通常面临上下文长度外推方面的限制。 理解…

C++11 线程池:轻量级高并发解决方案

C11 线程池:轻量级高并发解决方案 线程池(Thread Pool)是一种线程管理的机制,它包含了多个预先创建的线程,用于执行多个任务,这些任务被放入任务队列中等待执行。 满足我们的生产者和消费者模型。 线程…

一文带你快速了解GPT-4o!内含免费使用指南!

一、GPT-4o简介 北京时间5月14日,OpenAI举行春季发布会。OpenAI在活动中发布了新旗舰模型“GPT-4o”!据OpenAI首席技术官穆里穆拉蒂(Muri Murati)介绍,GPT-4o在继承GPT-4强大智能的同时,进一步提升了文本、…

电力场景设备漏油检测数据集VOC+YOLO格式338张1类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):338 标注数量(xml文件个数):338 标注数量(txt文件个数):338 标注类别…

Qt---项目的创建及运行

一、创建第一个Qt程序 1. 点击创建项目后,选择项目路径以及给项目起名称 名称:不能有中文、不能有空格 路径:不能有中文路径 2. 默认创建有窗口类myWidget,基类有三种选择:QWidget、QMainWindow、QDialog 3. m…

#自学习# 记一次py脚本打开浏览器页面

在项目总结中,遇到系统后台利用浏览器拉起一个已知路径页面的需求,趁着机会整理下。实现起来比较简单,浏览器默认谷歌。 一、技术原理 Selenium:Selenium 是一个用于自动化 Web 浏览器的工具,可模拟用户在浏览器中的各…

成都百洲文化传媒有限公司怎么样?靠谱吗?

在数字化浪潮席卷全球的今天,电商行业正以前所未有的速度蓬勃发展。作为这一变革的积极参与者和推动者,成都百洲文化传媒有限公司以其专业的电商服务,正逐渐成为行业内的佼佼者。 一、公司简介 成都百洲文化传媒有限公司自成立以来&#xff…

MyBatis的创建和测试

创建项目点击Spring Initializr然后点击next 点击SQL 选择里面的Mybatis Framework和Mysql Driver 按如下图片创建项目 user表中的数据 #下面这些内容是为了让MyBatis映射 #指定Mybatis的Mapper文件 mybatis.mapper-locationsclasspath:mappers/*xml #指定Mybatis的实体目录 my…