革新机器人任务规划:TREE-PLANNER引领高效、准确的机器人动作生成新趋势

DeepVisionary 每日深度学习前沿科技推送&顶会论文分享,与你一起了解前沿深度学习信息!

引言

任务规划在机器人技术中扮演着至关重要的角色。它涉及到为机器人设计一系列中级动作(技能),使其能够完成复杂的高级任务。这一过程不仅需要考虑机器人的能力,还需考虑周围环境以及可能存在的各种约束和不确定性。近年来,利用大型语言模型(LLMs)直接生成动作成为了任务规划领域的新趋势。这种方法因其卓越的性能和用户友好性而受到青睐。然而,传统的基于LLM的任务规划方法存在诸多效率问题,如高代价的令牌消耗和冗余的错误修正,这些问题限制了其在大规模测试和应用中的可扩展性。

论文概览

  • 标题:TREE-PLANNER: Planning with Large Language Models for Efficient Close-Loop Task
  • 作者:Mengkang Hu, Yao Mu, Xinmiao Yu, Mingyu Ding, Shiguang Wu, Wenqi Shao, Qiguang Chen, Bin Wang, Yu Qiao
  • 机构
    • The University of Hong Kong
    • Noah’s Ark Laboratory
    • Harbin Institute of Technology
    • Shanghai AI Laboratory
  • 链接:https://arxiv.org/pdf/2310.08582.pdf
    在这里插入图片描述

TREE-PLANNER方法介绍

TREE-PLANNER是一种新型的任务规划方法,它通过将任务规划过程分解为三个阶段来提高效率和减少错误:计划采样、动作树构建和基于环境的决策。这种方法首先利用大型语言模型(LLM)来采样可能的任务计划,然后将这些计划聚合成一个动作树,最后在执行过程中根据实时环境信息对动作树进行决策。
在这里插入图片描述

1. 计划采样(Plan Sampling)

在这一阶段,TREE-PLANNER利用LLM根据任务的全局信息和初始观察来生成一系列潜在的任务计划。这些计划是基于LLM的常识性知识生成的,每个计划都是一系列动作的序列。

2. 动作树构建(Action Tree Construction)

在动作树构建阶段,采样得到的所有潜在计划被整合到一个树状结构中。这个动作树的构建是通过比较不同计划中的动作并将相同的动作聚合在一起来实现的。这样可以避免在执行相同动作时的重复工作,提高执行效率。

3. 基于环境的决策(Grounded Deciding)

最后一个阶段是基于当前环境信息对动作树进行顶向下的决策。TREE-PLANNER会根据实时的环境反馈调整计划,选择最合适的动作执行。当执行中发生错误时,TREE-PLANNER能够通过回溯动作树灵活地进行错误修正,从而减少了错误修正的次数和代价。

通过这三个阶段的分解,TREE-PLANNER大大减少了令牌的消耗和错误修正的需要,使得任务规划更加高效和准确。

在这里插入图片描述

实验设置与数据集描述

环境

实验在VirtualHome环境中进行,这是一个用于模拟家庭任务的仿真平台。VirtualHome包含多个场景,每个场景中都有数百个对象,这些对象具有各自的属性,并且对象之间存在关系。例如,一个任务的目标条件可能是“电视已打开”,这需要在环境中找到电视并执行打开操作。

数据集

我们构建了一个数据集,包括4个VirtualHome场景和35个独特的家庭任务。每个任务都包括任务名称、目标条件和一个标准计划。我们首先从VirtualHome的ActivityPrograms知识库中注释目标条件,然后通过执行这些程序来生成标准计划。为了确保数据质量,我们采用了简单的启发式规则来过滤掉质量低的注释,并通过两名计算机科学专业的研究生进行手动质量控制。

评估指标

我们使用四个指标来评估不同方法的性能:可执行性(EXEC.)、成功率(SR)、目标条件召回率(GCR)和评估的财务开销( C O S T )。 E X E C . 指的是计划是否可以在给定环境中执行,而不考虑其与任务的相关性。 G C R 通过比较生成计划达到的目标条件与真实目标条件的差异来计算。 S R 衡量是否所有目标条件都已满足,即当 G C R = 1 时, S R = 1 。 COST)。EXEC.指的是计划是否可以在给定环境中执行,而不考虑其与任务的相关性。GCR通过比较生成计划达到的目标条件与真实目标条件的差异来计算。SR衡量是否所有目标条件都已满足,即当GCR=1时,SR=1。 COST)。EXEC.指的是计划是否可以在给定环境中执行,而不考虑其与任务的相关性。GCR通过比较生成计划达到的目标条件与真实目标条件的差异来计算。SR衡量是否所有目标条件都已满足,即当GCR=1时,SR=1COST用于评估不同方法的令牌效率,根据OpenAI提供的定价计算。

通过这些设置和评估指标,我们能够全面地测试和比较TREE-PLANNER与其他基线模型的性能和效率。

主要实验结果与分析

在VirtualHome环境中进行的实验表明,TREE-PLANNER在两种设置下均展现出了卓越的性能。在允许修正错误的设置中,TREE-PLANNER在成功率方面超过了最佳基线模型1.29%,在不允许修正错误的设置中,这一优势更是提高到了3.65%。此外,TREE-PLANNER在令牌效率上也表现出色,相比ITERATIVE-PLANNER,其令牌成本降低了53.29%。在允许修正错误的设置中,与LOCAL REPLAN和GLOBAL REPLAN相比,令牌成本分别降低了74.36%和92.24%。

修正效率方面,TREE-PLANNER减少了37.99%和40.52%的动作重试次数,这一改进显著减少了令牌消耗。这些结果不仅证明了TREE-PLANNER在执行任务规划时的高效性,也显示了其在处理动态和复杂环境中的高适应性。
在这里插入图片描述

讨论TOKEN与修正效率

1. TOKEN效率

TREE-PLANNER通过将LLM查询分解为单一的计划采样调用和多个基于环境的决策调用,显著降低了令牌消耗。在传统的ITERATIVE-PLANNER中,每一步执行都需要重新加载和处理全局信息和环境观察,导致高令牌消耗。TREE-PLANNER通过一次性采样并构建行动树,减少了这部分重复的计算成本,从而实现了高令牌效率。

2. 修正效率

TREE-PLANNER的修正机制提供了一种介于LOCAL REPLAN和GLOBAL REPLAN之间的新方法。通过在行动树上进行回溯,TREE-PLANNER允许在发现执行错误时,不必重新从头开始规划,而是从上一个有效的分叉点重新决策。这种方法不仅减少了决策的冗余,也大大减少了因错误修正而产生的时间和令牌消耗。

总体来看,TREE-PLANNER通过创新的任务规划方法有效地解决了传统LLM任务规划中的令牌和修正效率问题,提供了一种既高效又实用的新框架。

错误分析与未来方向

在TREE-PLANNER模型的实验和分析中,我们发现了几个关键的错误类型和潜在的改进方向。首先,错误类型可以分为三类:(i) 缺失正确计划;(ii) 决策错误;(iii) 虚假否定。其中,缺失正确计划占据了错误的主要部分,这表明尽管计划采样在某种程度上能够达到较高的GCRmax,但它仍然是模型性能的一个瓶颈。

针对这些问题,未来的改进方向包括:

1. 增强计划采样阶段的效率和准确性:可以通过增加计划重采样的设计来打破现有的性能上限,特别是在grounded deciding阶段,以确保能够从更广泛的正确计划中进行选择。

2. 提高决策阶段的准确性:实验中发现,大量错误是由于LLM在grounded deciding阶段的决策错误造成的。未来可以通过引入更先进的技术,如链式思考(chain-of-thought)和自我反思(self-reflection),来提高模型在这一阶段的表现。

3. 优化错误修正机制:虽然TREE-PLANNER在错误修正方面已经取得了显著进展,减少了重复决策和令牌消耗,但仍有改进空间。可以探索更灵活和高效的错误追踪和修正策略,以进一步提高模型的实用性和效率。

通过这些改进,我们希望能够进一步提升TREE-PLANNER的性能,使其在更广泛的应用场景中表现出更高的效率和更强的鲁棒性。

总结与展望

TREE-PLANNER作为一种新型的基于大型语言模型的任务规划框架,通过其创新的计划采样、动作树构建和基于环境的决策过程,有效地解决了传统迭代规划方法中的令牌效率低和错误修正冗余的问题。实验结果显示,TREE-PLANNER在虚拟家庭环境中的表现超越了现有的基线模型,无论是在任务成功率还是在令牌和错误修正效率上都有显著提高。

展望未来,TREE-PLANNER的研究可以在几个方向上进行深入:

  1. 扩展到更复杂的环境和任务:考虑将TREE-PLANNER应用于更多种类的环境和任务,特别是那些动态变化更加剧烈和不确定性更高的场景。

  2. 集成更先进的语言模型和决策技术:随着语言模型和人工智能决策技术的不断进步,集成最新的研究成果可能会进一步提升TREE-PLANNER的性能和适应性。

  3. 优化模型的可解释性和用户交互:提高模型的可解释性,使用户能够更好地理解模型的决策过程和修正策略,同时探索更自然和有效的用户交互方式。

通过这些研究和改进,TREE-PLANNER有望成为未来智能任务规划领域的一个重要工具,为自动化系统和机器人技术的发展提供强大的支持。

关注DeepVisionary 了解更多深度学习前沿科技信息&顶会论文分享!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/11150.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电视剧电影原声背景音乐,经典影视配乐片段音效合集

一、素材描述 本套影视配乐素材,大小1.89G,27个压缩文件。 二、素材目录 宰相刘罗锅配乐片段.rar 影视配乐65首.rar 太极张三丰原声.rar 东邪西毒原声配乐15首.rar 东方不败之风云再起配乐24首.rar 东方不败原声配乐16首.rar 电影大话西游原声配…

python绘制圣诞树 如何用python绘制一个圣诞树

欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一.前言 二.代码 三.使用 四.总结 一.前言 圣诞树,是指用灯烛和装饰品把枞树或洋松装点起来的常青树。作为是圣诞节重要的组成元素之一,近代圣诞树起源于德国,后来逐步在世界范围内流行起来

WPS表格:对比少于1万的两列数据

当我们需要对于A、B两列乱序的数据,找出A列中某一项B列有没有,或者找出B列中的某一项A列有没有,都可以先将这两列数据放入WPS表格中: 1.选中C列的第一行的单元格,在函数区输入函数 如果我们以A为基准,找A中…

SQL语句优化技巧

目录 1、sql语句规范 2、sql语句优化 1、sql语句规范 MySQL在Linux系统下数据库名,表名,存储过程名,函数名称,触发器名称等区分大小写,列名不区分大小写,原因是这些操作系统下文件名称区分大小写。 MySQL…

19、案例实战:上亿请求轻松应对,老年代垃圾回收参数调整技巧大公开

19.1、前文回顾 在上一篇文章中,我们已经向大家介绍了一个日活跃用户百万级别,处理请求量上亿的电商系统案例。我们选择了这个中型电商系统在大促期间的瞬时高峰下单场景,作为我们的JVM优化分析的场景。通过预测,我们得出在大促高峰期,每台机器每秒需要处理300个订单请求…

蓝桥杯-线性动态规划问题背包问题进阶策略详解-

题目&#xff1a;蓝桥云课-青蛙吃虫 解题代码&#xff1a; #include <iostream> #include<cstring> #include<algorithm> using namespace std;const int N106;int f[N][N]; int a[N]; int t,l,r,k,n;int main() {cin>>t;while(t--){scanf("%d%…

云计算第十二课

安装虚拟机 第一步新建虚拟机 选择自定义安装 下一步 选择稍后安装操作系统 选择系统类型和版本 选择虚拟机文件路径&#xff08;建议每台虚拟机单独存放并且路径不要有中文&#xff09;点击下一步 选择bios下一步 选择虚拟机处理器内核数量 默认硬盘或者自行调大硬盘 选择虚…

win10建立共享文件夹和ipad共享文件

win10端设置 查看自己的局域网IP 在任意地方新建一个文件夹 打开文件夹的属性,点到共享的地方 点击高级共享 然后点击应用,确认 再回到之前哪个地方,点击共享 把Everyone的权限改为读取/写入 最后点击共享就欧克了 失败的可能原因 ipad端设置 然后回出现一个要输入用户名和…

【2024新版】龙年新版ui周易测算网站H5源码/在线起名网站源码/运势测算网站系统源码

>>>功能说明&#xff1a; 1、系统配置&#xff1a;系统基本配置、测算价格配置、在线预约配置、系统信息配置、代理分成配置、推广积分配置、VIP价格配置、账号管理 2、推广管理&#xff1a;我的信息、推广链接、订单管理、体现管理 3、付费应用&#xff0c;订单管…

[数据集][目标检测]电力场景安全帽检测数据集VOC+YOLO格式295张2类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;295 标注数量(xml文件个数)&#xff1a;295 标注数量(txt文件个数)&#xff1a;295 标注类别…

机器学习---朴素贝叶斯

朴素贝叶斯是一种用于分类和预测任务的算法&#xff0c;他的原理是基于贝叶斯定理。其中朴素的意思是假设各特征之间相互独立。这个实验我是用的老师课后作业的题目预测某天是否会打网球&#xff0c;假设每个特征独立。 目录 贝叶斯公式&#xff1a; 训练集&#xff1a; 处理…

最新版★重大升级★神点云连锁餐饮V2独立版点餐系统★公众号/h5/小程序前后端全套源码

提醒&#xff1a; 市场上流通很多老版本代码&#xff0c;一大堆问题且无法保证售后的源码&#xff0c;请各位买家一定要睁大眼睛&#xff0c;以防上当受骗&#xff01;&#xff01;&#xff01;本系统源码全是经本人亲自测试与修复的完好版本&#xff0c;且本人用此版本源码已…

Java | Leetcode Java题解之第86题分隔链表

题目&#xff1a; 题解&#xff1a; class Solution {public ListNode partition(ListNode head, int x) {ListNode small new ListNode(0);ListNode smallHead small;ListNode large new ListNode(0);ListNode largeHead large;while (head ! null) {if (head.val < x…

第 1 天_二分查找【算法基础】

第 1 天_二分查找 前言34. 在排序数组中查找元素的第一个和最后一个位置题解官方33. 搜索旋转排序数组题解官方74. 搜索二维矩阵 前言 这是陈旧已久的草稿2021-11-09 19:33:44 当时在学习数据结构&#xff0c;然后再LeetCode上找了一个算法基础。 但是后来又没做了。 现在20…

使用LLaMA Factory来训练智谱ChatGLM3-6B模型

使用LLaMA Factory来训练智谱ChatGLM3-6B模型时&#xff0c;以下是一个训练过程&#xff1a; 1. 环境搭建 a. 安装Python和Anaconda 下载并安装适合你操作系统的Python版本&#xff08;推荐Python 3.10或更高版本&#xff09;。安装Anaconda&#xff0c;以管理Python环境和依…

【STM32+k210项目】基于AI技术智能语音台灯的设计(完整工程资料源码)

视频演示 基于AI技术智能语音台灯的设计 前言&#xff1a; 随着社会的快速发展&#xff0c;人们对家用电器智能化程度的要求越来越高。不管是对于学生人群还是对于工作加班者&#xff0c;台灯是每家每户必不可少的工具&#xff0c;长期处于光线太强或者过弱的环境中学习和一系列…

FreeRTOS二值信号量

目录 一、信号量的概念 1、信号量的基本概念 2、信号量的分类 二、二值信号量简介 三、二值信号量相关API 1、创建二值信号量 2、释放二值信号量 3、获取二值信号量 四、二值信号量实操 1、实验需求 2、CubeMX配置 3、代码实现 一、信号量的概念 1、信号量的基本概…

计算机毕业设计python+spark知识图谱音乐推荐系统 音乐数据分析可视化大屏 音乐爬虫 LSTM情感分析 大数据毕设 深度学习 机器学习

本科毕业设计&#xff08;论文&#xff09;开题报告 课题名称 基于Spark的音乐推荐与数据分析系统 的设计与实现 课题类型 系统设计 学院 大数据与人工智能学院 班级 专业 数据科学与大数据技术 指导教师 职称 学生姓名 学号 重庆工程学院教务处制 1.课…

如何快速变得专业:掌握类的基本概念-类/方法/关键字/变量/数据类型/注释

在李笑来的《财富自由之路》中提到一种初学者快速入门的学习方法&#xff1a;快速掌握最小必要知识。 关于Java的类&#xff0c;最少必要知识就是本文提到的基本概念&#xff0c;掌握了这些基本概念&#xff0c;就对类有了基本的了解&#xff0c;为后续的深入学习和沟通奠定了基…

智慧油田三维电子沙盘系统

深圳易图讯科技(www.3dgis.top)智慧油田三维电子沙盘系统采用三维GIS、大数据、云计算、虚拟现实、物联网、AI等前沿技术&#xff0c;支持无人机航拍、高清卫星影像、DEM高程数据、矢量数据、无人机倾斜摄像、BIM模型、点云、城市白模、等高线、标高点等数据融合和切换&#xf…