MINDAGENT:游戏交互中的新兴性设计

一、摘要

1.问题/研究背景

LLM具有在多智能体系统中执行复杂调度的能力,并可以协调这些代理以完成需要广泛合作的复杂任务。

但是,目前还没有一个标准的游戏场景相关的测试指标评估 LLM 在游戏中的表现以及与人类玩家的合作能力

2.研究目标/动机

提出MindAgent-----新颖的基础设施用于评估游戏交互中规划协调新兴能力

3.研究方法概述

研究方法:

MindAgent(新颖的基础设施)是利用现有的游戏框架来实现

引入CUISINEWORLD一种新的游戏场景和相关基准,可以调度多智能体协作效率并监督多个智能体玩游戏。

通过新的自动度量协作评分CoS进行综合评估

4.结论或意义

希望我们对LLM以及用于通用调度和协调的新基础设施的研究结果能够帮助阐明如何通过学习大型语言语料库来获得这些技能。

二、引言

1.研究领域的背景知识

LLM展示了解决复杂任务的潜力,这些任务:以前被认定是特定领域算法或人类专家独有的。包括:数学推理到回答专业法律、医学问题等

2.当前研究现状及问题

最近一些研究表明使用LLM为机器人和游戏人工智能生成复杂计划的可能性,标志着LLLM作为通才智能代理的一个重要里程碑

3.研究动机或意义

  • 与之前的单智能体规划相比多智能体规划的行动空间呈指数增长(相对于智能体的数量)规划者必须同时控制多个代理,避免可能的冲突,并协调它 们完成需要复杂协作的共同目标
  • 进一步研究LLM的规划能力:多智能体规划
  • MindAgent可以使LLM与多个不同的代理执行复杂的协调和调度

4.提出研究问题或假设

  1. 为了让LLM能够在多大程度上获得多智能体规划技能,研究者建立一个新的基准:CUISNEWORLD
  2. 为了将智能体融入到视频游戏中,研究者主要设计了一个基础设施:MINDAGENT,促进LLM多智能体规划的能力

5.MindAgent观察结果

  1. 零样本多智能体规划:无需附加功能,像 GPT-с 这样强 大的预训练 LLM 就能够调度多个智能体(范围从2至4)只需阅读简单的游戏说明 和菜谱即可完成菜肴,甚至与人类玩家合作;
  2. 具有高级提示的规划:我们能够 通过利用新兴的上下文学习能力来显着提高他们的多智能体规划性能:
  3. 通用潜力:LLM展现出作为通才多智能 体规划者的巨大潜力,因为它具有很强的泛化能力,可以用更少的智能体示例来协 调更多的智能体,并适应像《我的世界》这样的新游戏领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/888486.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

洛谷P1827 [USACO3.4] 美国血统 American Heritage(c嘎嘎)

题目链接:P1827 [USACO3.4] 美国血统 American Heritage - 洛谷 | 计算机科学教育新生态 题目难度:普及 首先介绍下二叉树的遍历: 学过数据结构都知道二叉树有三种遍历: 1.前序遍历:根左右 2.中序遍历:左根…

『数据结构』空间复杂度

🚩 WRITE IN FRONT 🚩 🔎 介绍:"謓泽"正在路上朝着"攻城狮"方向"前进四" 🔎🏅 荣誉:2021|2022年度博客之星物联网与嵌入式开发TOP5|TOP4、2021|2222年获评…

这就是AOP

AOP AOP(Aspect Oriented Programming,面向切面编程)是一种编程范式,它的目的是通过分离横切关注点(cross-cutting concerns)来提升代码的模块化程度,AOP 的概念最早是由 Xerox PARC 提出的,它并非站在 OOP 的对立面,而是对 OOP 的一个很好的补充。Spring Framework …

多模态COGMEN详解

✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨ 🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢,在这里我会分享我的知识和经验。&am…

STM32 进阶 定时器3 通用定时器 案例2:测量PWM的频率/周期

需求分析 上一个案例我们输出了PWM波,这个案例我们使用输入捕获功能,来测试PWM波的频率/周期。 把测到的结果通过串口发送到电脑,检查测试的结果。 如何测量 1、输入捕获功能主要是:测量输入通道的上升沿和下降沿 2、让第一个…

重生之我在异世界学编程之C语言:操作符篇

大家好,这里是小编的博客频道 小编的博客:就爱学编程 很高兴在CSDN这个大家庭与大家相识,希望能在这里与大家共同进步,共同收获更好的自己!!! 本文目录 引言正文1. 算术操作符2. 关系&#xff0…

STM32 进阶 定时器 2基本定时器 基本定时器中断案例:LED闪烁

基本定时器 基本定时器TIM6和TIM7各包含一个16位自动装载计数器,由各自的可编程预分频器驱动。 这2个定时器是互相独立的,不共享任何资源。 这个2个基本定时器只能向上计数,由于没有外部IO,所以只能计时,不能对外部…

git 常见使用

在使用 git 时,可以通过以下命令更新和拉取远程仓库的最新代码: 基本步骤 确保在正确的分支: 检查当前所在分支: git branch如果需要切换到其他分支: git checkout 分支名更新远程仓库信息: 拉取远程仓库的…

部门管理系统Spring AOP实现日志记录接口案例开发

需求分析 在开发过程中,为了记录系统操作行为,我们通常需要实现操作日志功能。本案例要求对系统中增、删、改等接口的操作日志记录到数据库表中,具体需求包括: 日志内容: 操作人(从请求头中的 Token 中解析…

OpenVas安装步骤及报错问题

安装步骤 1、更新系统 apt update && apt upgrade && apt dist-upgrade 2、安装openvas apt-get install openvas 3、初始化 gvm-setup 时间要很久 4、检查安装结果 gvm-check-setup 安装成功 5、设置用户名和密码,都为admin sudo runuse…

深度学习之pth转换为onnx时修改模型定义‌

文章目录 概述实现步骤python代码 概述 在将PyTorch模型(.pth文件)转换为ONNX格式时,通常的转换过程是通过torch.onnx.export函数来实现的。这个过程主要是将PyTorch模型的计算图导出为ONNX格式,以便在其他框架或环境中使用。 在…

STL算法之sort

STL所提供的各式各样算法中&#xff0c;sort()是最复杂最庞大的一个。这个算法接受两个RandomAccessIterators(随机存取迭代器)&#xff0c;然后将区间内的所有元素以渐增方式由小到大重新排列。还有一个版本则是允许用户指定一个仿函数代替operator<作为排序标准。STL的所有…

解决Tomcat运行时错误:“Address localhost:1099 is already in use”

目录 背景: 过程&#xff1a; 报错的原因&#xff1a; 解决的方法&#xff1a; 总结&#xff1a; 直接结束Java.exe进程&#xff1a; 使用neststat -aon | findstr 1099 命令&#xff1a; 选择建议&#xff1a; 背景: 准备运行Tomcat服务器调试项目时&#xff0c;程序下…

AJAX三、XHR,基本使用,查询参数,数据提交,promise的三种状态,封装-简易axios-获取省份列表 / 获取地区列表 / 注册用户,天气预报

一、XMLHttpRequest基本使用 XMLHttpRequest&#xff08;XHR&#xff09;对象用于与服务器交互。 二、XMLHttpRequest-查询参数 语法: 用 & 符号分隔的键/值对列表 三、XMLHttpRequest-数据提交 核心步骤 : 1. 请求头 设置 Content-Type 2. 请求体 携带 符合要求 的数…

矩阵加法        ‌‍‎‏

矩阵加法 C语言代码C 语言代码Java语言代码Python语言代码 &#x1f490;The Begin&#x1f490;点点关注&#xff0c;收藏不迷路&#x1f490; 输入两个n行m列的矩阵A和B&#xff0c;输出它们的和AB。 输入 第一行包含两个整数n和m&#xff0c;表示矩阵的行数和列数。1 <…

flink-connector-mysql-cdc:01 mysql-cdc础配置代码演示

flink-connector-mysql-cdc&#xff1a; 01 mysql-cdc基础配置代码演示02 mysql-cdc高级扩展03 mysql-cdc常见问题汇总04 mysql-cdc-kafka生产级代码分享05 flink-kafka-doris生产级代码分享06 flink-kafka-hudi生产级代码分享 flink-cdc版本&#xff1a;3.2.0 flink版本&…

ELK的Filebeat

目录 传送门前言一、概念1. 主要功能2. 架构3. 使用场景4. 模块5. 监控与管理 二、下载地址三、Linux下7.6.2版本安装filebeat.yml配置文件参考&#xff08;不要直接拷贝用&#xff09;多行匹配配置过滤配置最终配置&#xff08;一、多行匹配、直接读取日志文件、EFK方案&#…

HTML 添加 文本水印

body,html {margin: 0;height: 100vh;width: 100vw;} // 自定义文案const setting {text: "水印文案", // 水印内容innerDate: true, // 在水印下方增加日期width: 110, // 水印宽度};// 自定义文字水印const watermark (function () {return {build: function (a…

Android平台GB28181设备接入模块如何支持GB28181云端录像补录

技术背景 GB28181 的补录功能是一种用于弥补视频数据缺失的重要机制。在实际的视频监控场景中&#xff0c;由于网络不稳定、设备故障等多种因素&#xff0c;可能会导致视频数据在上云或存储过程中出现缺失&#xff0c;无法保证数据的完整性。GB28181 的补录功能就是为了解决这…

高级java每日一道面试题-2024年12月04日-JVM篇-什么是指针碰撞?

如果有遗漏,评论区告诉我进行补充 面试官: 什么是指针碰撞? 我回答: 在Java高级面试中&#xff0c;指针碰撞是一个重要而基础的概念&#xff0c;它涉及到JVM在堆内存中分配对象时的内存管理机制。以下是对指针碰撞的详细解释&#xff1a; 一、定义 指针碰撞&#xff08;B…