Google ASPIRE框架:赋予大型语言模型(LLMs)自我评估的新动力

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/ 。 

在人工智能的飞速发展中,一个名为ASPIRE的新框架让大型语言模型(LLMs)的潜能再上一层楼。ASPIRE的核心在于教会LLMs不仅仅是回答问题,更重要的是,对这些答案进行自我评估,就像学生在教科书后面核对答案一样。该框架包括三个关键阶段:特定任务的调整、答案采样和自我评估学习。

首先是特定任务的调整。ASPIRE通过调整特定任务的参数(θp)来培训LLMs,同时保持模型本身的稳定。在这一阶段,LLMs通过使用一些参数效率高的调整技术,如软提示调整和LoRA,针对特定任务进行微调。这种微调不仅提高了模型的预测准确性,还增加了正确输出序列的可能性。

接下来是答案采样阶段。ASPIRE使用经过特定任务调整的LLMs为每个训练问题生成不同的答案,并为自我评估学习创建数据集。这里,束搜索算法被用于生成高可能性的输出序列,而Rouge-L度量则用于判断这些输出序列是否正确。

最后,是自我评估学习阶段。在为每个查询生成高可能性的输出后,ASPIRE通过添加可适应参数(θs)并仅对其进行微调来学习自我评估。冻结原始的θ和经过学习的θp参数可以确保在自我评估学习过程中不会改变LLM的预测行为。最终目的是优化θs,使得经过适应的LLM能够自行区分正确和错误的答案。

这个框架的实施主要是通过软提示调整来完成的。通过这种机制,可以学习“软提示”来使冻结的语言模型更有效地执行特定的下游任务。实验结果表明,使用ASPIRE调整后的LLMs在多个问答数据集上表现出色,例如CoQA、TriviaQA和SQuAD。在这些测试中,即使是比大型预训练模型更小的LLMs,也能通过ASPIRE实现类似甚至更高的准确性。

通过ASPIRE框架的应用,LLMs在选择性预测任务中的性能得到了显著提升,这不仅展示了LLMs在自我评估方面的潜力,也为未来AI在关键应用领域中的应用开辟了新道路。研究团队对ASPIRE的未来应用充满期待,并邀请社区共同参与这一激动人心的旅程。

论文地址: https://aclanthology.org/2023.findings-emnlp.345.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/643391.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大数据学习之Flink、比较不同框架的容错机制

第一章、Flink的容错机制 第二章、Flink核心组件和工作原理 第三章、Flink的恢复策略 第四章、Flink容错机制的注意事项 第五章、Flink的容错机制与其他框架的容错机制相比较 目录 第五章、Flink的容错机制与其他框架的容错机制相比较 Ⅰ、Flink的容错机制与其他框架的容…

springboot 整合 ElasticSearch 方法 (一)

下载 ES 相当于安装 MySQL, 可以在官网上下载 (链接在后面). 要注意安装的 ES 的版本要和项目中用的 Springboot 的版本对应. 比如我用的 Springboot 版本是 2.6, 所以ES要下载7.15 版本的. 官网链接: https://www.elastic.co/cn/downloads/elasticsearch 点右边这个查看更多…

腾讯云4核8G12M服务器我的世界mc够多少人?

mc我的世界服务器4核8g够多少人?80人,4核8G服务器最多支持80人同时在线。关于我的世界服务器的CPU和内存有用户测试过,阿腾云atengyun.com认为最多可以支持80人同时在线。如果运行的云服务器配置较低,启动游戏后可以在左下角看到配…

展厅设计更好的方法

一、与公司形象契合 在展厅规划时必定要留意公司的LOGO、主色调,以及企业文明。在展现时使用丰满的展厅规划传达出企业的理念。而在功用设置上,应当考虑内涵功用,从展厅作业人员的视点动身,为展厅作业人员提供杰出的环境&#xff…

【Java】---反射:Class、Filed、Constructor、Method

【Java】—反射 文章目录 【Java】---反射一、反射1.1 概念1.2 操作步骤 二、Class类2.1 概念2.2 方法2.2.1 getName()2.2.2 getSimpleName()2.2.3 getPackage()2.2.4 getSuperclass()2.2.5 getInterfaces() 三、Field类3.1 概念3.2 方法3.2.1 setAccessible(Boolean b)3.2.2 s…

关于图像分割项目的可视化脚本

1. 前言 之前实现了目标检测和图像分类任务的可视化脚本,本章将最后一个分割任务的可视化脚本实现 效果展示如下: 代码会在当前目录保存展示好的图片,从左到右依次为,原图、mask图、mask覆盖在原图的掩膜图 关于目标检测的可视化…

HTTP状态信息

1xx: 信息 消息:描述:100 Continue服务器仅接收到部分请求,但是一旦服务器并没有拒绝该请求,客户端应该继续发送其余的请求。101 Switching Protocols服务器转换协议:服务器将遵从客户的请求转换到另外一种协议。 2xx: 成功 消息:描述:200…

【二】从零到1设计一个丧葬行业小程序

1、准备工作 1-1、服务器准备 腾讯云轻量级服务器 4核2G 地址: http://1.14.34.13/ 购买域名 www.pengyangyan.work (备案中) 图片服务器:七牛云 1-2、环境配置 服务器 docker容器部署 https://blog.csdn.net/pengyangyan/article/d…

app如何实现悬浮框滚动到那个模块定位到那。

如图&#xff1a; 使用uniapp内置方法 onPageScroll 获取到滚动了多少。 其实拿到屏幕滚动多少就很简单了&#xff0c;下面是思路。 tap栏切换效果代码就不贴了。直接贴如何到那个模块定位到哪&#xff0c;和点击定位到当前模块。 <view v-if"show" class&qu…

Java中异常的优雅处理方式

工作当中经常遇到程序跑异常的问题&#xff0c;而优雅处理异常则是高质量代码的关键。本文将深入讨论Java中异常的优雅处理方式&#xff0c;通过代码示例和实际使用场景进行详细说明&#xff0c;帮助大家更好地理解和应用异常处理机制。 1. 异常处理基础 在Java中&#xff0c…

HarmonyOS鸿蒙应用开发( 四、重磅组件List列表组件使用详解)

List列表组件&#xff0c;是一个非常常用的组件。可以说在一个应用中&#xff0c;它的身影无处不在。它包含一系列相同宽度的列表项&#xff0c;适合连续、多行呈现同类数据&#xff0c;如商品列表、图片列表和和文本列表等。ArkUI 框架采用 List 容器组件创建列表&#xff08;…

某国有企业后备人才培养机制建设

某电力勘测设计院始建于1958年&#xff0c;是中国电力建设集团有限公司旗下的大型电力工程咨询公司。伴随着中国电力事业的发展&#xff0c;已发展为具备甲级电力工程规划、咨询、勘测、设计、总承包、环境及安全管理评价、地质灾害勘察、评估与治理、光电建筑一体化及发电专项…

大数据学习之Flink算子、了解DataStream API(基础篇一)

DataStream API &#xff08;基础篇&#xff09; 注&#xff1a; 本文只涉及DataStream 原因&#xff1a;随着大数据和流式计算需求的增长&#xff0c;处理实时数据流变得越来越重要。因此&#xff0c;DataStream由于其处理实时数据流的特性和能力&#xff0c;逐渐替代了DataSe…

Windows下安装达梦8开发版数据库

达梦数据库属于国产主流数据库之一&#xff0c;本文记录WIndows下安装最新的达梦8数据库的过程。   达梦官网&#xff08;参考文献1&#xff09;下载开发版&#xff08;X86平台&#xff09;版安装包&#xff0c;如下图所示&#xff1a; 解压安装包后&#xff0c;其中包含ISO文…

Unity中UGUI在Mask剪裁粒子特效的实现

在Unity使用Mask是剪裁不了粒子特效的&#xff0c;之前有想过RenderTexture来实现&#xff0c;不过使用RenderTexture不适合用于很多个特效&#xff0c;因为RenderTexture依赖Camera的照射&#xff0c;如果在背包中每种道具都有不同的特效&#xff0c;那使用RenderTexture则需要…

Vue3+Vite+Cesium项目开发心得(实时更新)

之前就想写的&#xff0c;纯属个人习惯总结&#xff0c;欢迎订正&#xff01; Cesium相关 1. Cesium包的引入&#xff0c;我还是建议直接放到public下面&#xff0c;html里直接加script标签的形式&#xff1b; 2. Vue的响应式不要挂接任何Cesium创建的任何对象&#xff0c;尤…

Armv8-M的TrustZone技术之SAU寄存器总结

每个SAU寄存器是32位宽。下表显示了SAU寄存器概要。 5.1 SAU_CTRL register SAU_CTRL寄存器的特征如下图和表所示&#xff1a; 5.2 SAU_TYPE register 5.3 SAU_RNR register 5.4 SAU_RBAR register 5.5 SAU_RLAR register 5.6 SAU区域配置 当SAU启用时&#xff0c;未由已启用…

【技术】SpringBoot 接口怎么加密解密

1. 介绍 在我们日常的Java开发中&#xff0c;免不了和其他系统的业务交互&#xff0c;或者微服务之间的接口调用 如果我们想保证数据传输的安全&#xff0c;对接口出参加密&#xff0c;入参解密。 但是不想写重复代码&#xff0c;我们可以提供一个通用starter&#xff0c;提…

服务器部署模型访问前端页面

如果你在学校服务器上部署了一个模型&#xff0c;此时他给了你一个url&#xff1a;0.0.0.0:2222,这个时候该如何访问呢&#xff1f; 其实很简单&#xff0c;但是自己弄错了&#xff0c;所以弄了很久。记录一下&#xff0c;自用。 以下ip地址是假的&#xff0c;仅供记录一下。…