2024年1月15日Arxiv最热论文推荐:斯坦福LLM精准微调新框架、GPT不愿承认回答错误、速度快15倍的3D全景分割新突破

本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。

论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台上的智能体 「AI论文解读达人」提供。

如需查看其他热门论文,欢迎移步赛博马良 ^_^

TOP1

APAR: LLMs Can Do Auto-Parallel Auto-Regressive Decoding

标题:

清华大学让大语言模型自动并行自回归解码,速度提升高达4倍!

标签:

Tsinghua、NLP

作者:

Mingdao Liu, Aohan Zeng, Bowen Wang, Peng Zhang, Jie Tang, Yuxiao Dong

推荐理由:

这篇论文由清华大学发表,且标题提到了大型语言模型(LLMs)的自动并行自回归解码(Auto-Parallel Auto-Regressive Decoding),这是一个当前AI领域的热点话题,同时也涉及模型效率提升,这可能意味着在模型推理过程中的一个重要进步。清华大学是一个有影响力的机构,这也增加了论文的吸引力。

论文简介:
大型语言模型(LLMs)的大规模采用要求高效的部署策略。然而,自回归解码过程是大多数LLMs生成文本的基础,它给实现高效服务带来了挑战。在这项工作中,我们引入了一种并行自回归生成方法。通过在包含层次结构的通用领域数据上进行指导调优,我们使LLMs能够独立规划其生成过程,并执行自动并行自回归(APAR)生成,显著减少了生成步骤的数量。APAR本身可以实现高达2倍的加速,当与推测性解码结合时,加速比可以达到高达4倍。此外,APAR在生成过程中减少了键值缓存的消耗和注意力计算。与最先进的服务框架相比,在高吞吐量场景下,这导致吞吐量增加了20-70%,延迟减少了20-35%。

论文解读链接:

https://www.saibomaliang.com/generate?session_id=8939e4ab-3dcd-41a6-be41-1815133918ee

TOP2

An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language Models

标题:
成本降半!斯坦福联合华盛顿大学打造大语言模型精准微调新框架

标签:
Stanford、Microsoft、NLP、ML

作者:
Gantavya Bhatt, Yifang Chen, Arnav M. Das, Jifan Zhang, Sang T. Truong, Stephen Mussmann, Yinglun Zhu, Jeffrey Bilmes, Simon S. Du, Kevin Jamieson, Jordan T. Ash, Robert D. Nowak

推荐理由:
这篇论文由斯坦福大学和微软联合发表,探讨了大型语言模型的标签高效微调,这是一个非常实用且具有商业价值的研究方向。论文的合作机构包括顶尖大学和大公司,这将吸引更多的关注。

论文简介:
在指令数据集上进行的有监督微调(Supervised finetuning, SFT)在实现现代大型语言模型(Large Language Models, LLMs)观察到的卓越零样本泛化能力方面发挥了关键作用。然而,为指令生成高质量响应所需的注释工作变得代价高昂,特别是随着指令数据集所涵盖的任务数量不断增加。主动学习在从未标注的样本池中识别有用的样本子集以进行注释方面是有效的,但其高昂的计算成本仍然是阻碍其在LLMs背景下广泛应用的障碍。为了减轻SFT的注释成本并规避主动学习的计算瓶颈,我们提出使用实验设计。实验设计技术选择最具信息量的样本进行标注,并通常最大化某种不确定性和/或多样性的概念。在我们的工作中,我们实现了一个框架,评估了几种现有的和新颖的实验设计技术,并发现这些方法在标签效率上始终能够显著提升,同时计算开销很小。在生成性任务上,我们的方法仅需随机抽样所需注释成本的50%即可达到相同的泛化性能。

论文解读链接:

https://www.saibomaliang.com/generate?session_id=736178ba-b3b2-4420-a929-12388281f82b

TOP3

Scalable 3D Panoptic Segmentation With Superpoint Graph Clustering

标题:

3D全景分割新突破!SuperCluster模型训练速度快15倍,参数量仅为竞品的1/30

标签:
CV、3DV2024

作者:
Damien Robert, Hugo Raguet, Loic Landrieu

推荐理由:
这篇论文被接受在3DV 2024会议上做口头报告,这是一个有影响力的会议,且论文涉及的3D全景分割是一个热门的研究方向,具有很好的应用前景,特别是在自动驾驶和机器人领域。

论文简介:

我们提出了一种高效的大型3D点云全景分割方法,通过将这一任务重新定义为一个可扩展的图聚类问题。这种方法只需使用局部辅助任务进行训练,从而消除了训练过程中资源密集型的实例匹配步骤。此外,我们的公式可以轻松适应超点(superpoint)范式,进一步提高效率。这使得我们的模型能够在单次推理中处理包含数百万点和数千个对象的场景。我们的方法,称为SuperCluster,为两个室内扫描数据集实现了新的全景分割性能标准。我们还为两个大规模移动测绘基准:KITTI-360和DALES,设定了首个性能标准。我们的模型只有209209

209209

k参数,比最佳竞争方法小了30多倍,并且训练速度快达15倍。我们的代码和预训练模型可在以下位置获取。

论文解读链接:

https://www.saibomaliang.com/generate?session_id=cfe1e3c4-df92-41e8-aa0f-133079459b24

TOP4

Synthetic Data Generation Framework, Dataset, and Efficient Deep Model for Pedestrian Intention Prediction

标题:

安全驾驶新突破:PedGNN模型预测行人意图,实时保护每一步!
标签:
ML、CV、IEEE International Conference on Systems 2023

作者:
Muhammad Naveed Riaz, Maciej Wielgosz, Abel Garcia Romera, Antonio M. Lopez

推荐理由:

这篇论文将在IEEE国际智能交通系统会议上发表,这是一个与实际应用紧密相关的会议。论文提出了一个用于行人意图预测的合成数据生成框架和高效深度模型,这是一个具有很高社会价值和应用前景的研究。

论文简介:
行人意图预测对于自动驾驶至关重要。特别是,了解行人是否打算在自车前方穿越是执行安全舒适操作的核心。从连续图像中预测此类意图的准确快速模型的创建具有挑战性。导致这一挑战的一个因素是缺乏具有多样化穿越和非穿越(C/NC)场景的数据集。我们通过引入一个名为ARCANE的框架来解决这种稀缺性,该框架允许以编程方式生成由C/NC视频剪辑样本组成的合成数据集。作为一个例子,我们使用ARCANE生成了一个大型且多样化的数据集,名为PedSynth。我们将展示PedSynth如何补充广泛使用的真实世界数据集,例如JAAD和PIE,从而使得C/NC预测模型更加准确。考虑到C/NC预测模型的车载部署,我们还提出了一个名为PedGNN的深度模型,该模型快速且内存占用非常低。PedGNN基于GNN-GRU架构,它接受一系列行人骨架作为输入来预测穿越意图。

论文解读链接:

https://www.saibomaliang.com/generate?session_id=8f1334da-241b-4a43-817b-b80625ce50fb

TOP5

Relying on the Unreliable: The Impact of Language Models’ Reluctance to Express Uncertainty

标题:

斯坦福最新研究:GPT不愿承认回答错误,高置信回答错误率高达47%

标签:
Carnegie Mellon University、Allen Institute for AI、NLP、ML、IR

作者:
Kaitlyn Zhou, Jena D. Hwang, Xiang Ren, Maarten Sap

推荐理由:
这篇论文由斯坦福大学等单位发表,探讨了人类与LM互动面临的一系列新的安全风险,并提出了设计建议和未来的缓解策略。论文的机构包括顶尖大学,论文涉及的是一个热门的研究方向,具有很好的应用前景。

论文简介:

随着自然语言成为人工智能交互的默认界面,LM(语言模型)在下游应用中适当传达不确定性的需求变得至关重要。在这项工作中,我们研究了LM如何通过自然语言融入对其回应的信心,以及下游用户如何对LM表达的不确定性做出反应。我们检查了公开部署的模型,并发现LM在回答问题时即使产生错误的回应也无法表达不确定性。LM可以被明确提示表达信心,但倾向于过度自信,导致高错误率(平均47%)的自信回应。我们通过进行人类实验来测试LM过度自信的风险,并展示用户是否依赖于LM生成的内容,不论它们是否被标记为确定。最后,我们调查了在RLHF(强化学习与人类反馈)对齐中使用的偏好注释数据集,并发现人类对带有不确定性的文本存在偏见。我们的工作突出了人类与LM互动面临的一系列新的安全风险,并提出了设计建议和未来的缓解策略。

论文解读链接:
https://www.saibomaliang.com/generate?session_id=c159f895-a9c3-4837-bf5f-9c159c95bec0

本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。

论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台上的智能体 「AI论文解读达人」 提供。

如需查看其他热门论文,欢迎移步赛博马良 ^_^

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/625216.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【ARM 嵌入式 编译系列 7.3 -- GCC 链接脚本中 NOLOAD 和 GROUP 的详细介绍】

文章目录 NOLOAD 和 GROUP 的详细介绍NOLOAD 关键字GROUP 关键字实际应用案例 NOLOAD 和 GROUP 的详细介绍 在使用 arm-none-eabi-gcc 工具链中的链接器脚本时,链接脚本使用链接器命令语言来描述如何生成最终的可执行文件。其中,noload 和 group 是两个…

WEB 3D技术 three.js 3D贺卡(1) 搭建基本项目环境

好 今天 我也是在网上学的 带着大家一起来做个3D贺卡 首先 我们要创建一个vue3的项目、 先创建一个文件夹 装我们的项目 终端执行 vue create 项目名称 例如 我的名字想叫 greetingCards 就是 vue create greetingcards因为这个名录 里面是全部都小写的 然后 下面选择 vue3 …

代码随想录算法训练营Day21| 93.复原IP地址、78.子集、90.子集||

LeetCode 93 复原 IP 地址 本题思路:最重要的是想到一个收集结果的条件,也就是终止条件。 当 . 的个数达到三个时候,并且,判断最后剩余的是否符合要求,如果符合,说明整个ip地址可以,就加入到结…

【数据结构】C语言实现共享栈

共享栈的C语言实现 导言一、共享栈1.1 共享栈的初始化1.2 共享栈的判空1.3 共享栈的入栈1.3.1 空指针1.3.2 满栈1.3.3 入栈空间错误1.3.4 正常入栈1.3.5 小结 1.4 共享栈的查找1.5 共享栈的出栈1.6 共享栈的销毁 二、共享栈的实现演示结语 导言 大家好,很高兴又和大…

SpringBoot ElasticSearch 聚合统计

SpringBoot ElasticSearch 聚合统计 在SpringData Elasticsearch中,聚合统计的原理主要依赖于Elasticsearch本身的聚合框架。Elasticsearch提供了强大的聚合功能,使得你可以对文档进行各种计算和统计,从而得到有关数据集的有用信息。 Elasti…

Linux文件隐藏属性及chattr和lsattr命令

chattr命令 [rootstudy ~]# chattr [-] [ASacdistu] 文件或目录名称 选项与参数: :增加某一个特殊参数,其他原本存在参数则不动。- :移除某一个特殊参数,其他原本存在参数则不动。 :设置等于,且…

腾讯云主机价格表和优惠活动汇总(2024年更新)

腾讯云服务器租用价格表:轻量应用服务器2核2G3M价格62元一年、2核2G4M价格118元一年,540元三年、2核4G5M带宽218元一年,2核4G5M带宽756元三年、轻量4核8G12M服务器446元一年、646元15个月,云服务器CVM S5实例2核2G配置280.8元一年…

检索增强生成RAG

文章目录 RAG解释混合检索重排序Rerank为什么需要RerankHNSW带来的随机性问题 当前大模型处理长输入的水平依然不够大模型如何处理长输入?重要信息位置为什么会影响大模型的效果LangChain的解决方案-检索后重新排序文档 召回模式N选1召回模式多路召回模式 摘要 在RA…

记录一次git merge后发现有些文件不对的问题,排查过程

分支进行merge(A merge到B)之后,发现string.xml中有些字段的值没有merge过来,一开始还以为自己是自己merge错误,检查了一遍自己的merge操作没有问题。 那为啥没有merge过来呢?有一种可能是,merg…

CMake把静态库编译进入动态库

CMake把静态库编译进入动态库 当尝试把静态库编译进入动态库时(类似如下的指令) add_library(testShare SHARED ./include/test.h)target_link_libraries(test_share pthread libtestStatic.a)发生如下报错 can not be used when making a shared object; recompile with -f…

排序——计数排序

文章目录 概念思路绝对映射:相对映射 代码实现特性结果演示 概念 计数排序是一个非基于比较的排序算法,该算法于1954年由 Harold H. Seward 提出。它的优势在于在对一定范围内的整数排序时,它的复杂度为Ο(nk)(其中k是整数的范围…

内网穿透[让你在家里也能榨干学校的服务器]Yep!

内网穿透 问题:什么是内网穿透,内网穿透的作用是什么? 前提!!!!你得拥有超级管理员的权限,比如root,不然后面的一切免提! 应用场景如下:比如你…

中科院国产多语言大模型-YAYI2开源!家族AI应用场景全覆盖!

项目简介 YAYI 2 是中科闻歌研发的新一代开源大语言模型,中文名:雅意,采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。 开源地址:https://github.com/wenge-research/YAYI2 YAYI2-30B是其模型规模,是基…

文件上传进阶绕过(二)4个技巧和靶场实战

★★免责声明★★ 文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与学习之用,读者将信息做其他用途,由Ta承担全部法律及连带责任,文章作者不承担任何法律及连带责任。 0、环境准备 请移步《文件上传靶场实战:upl…

Unity 实现双击交互

Unity 实现双击交互 Unity中要实现单击交互很简单,使用Button、Toggle、EventTrigger事件都可以实现,但是要实现双击某个物体触发交互事件,则需要另外编写脚本。 方法是在EventTrigger中IPointerClickHandler下的点击事件中编写通过短时间间…

Docker 项目如何使用 Dockerfile 构建镜像?

1、Docker 和 Dockerfile 的重要性 1.1、Docker 简介:讲述 Docker 的起源、它是如何革新现代软件开发的,以及它为开发者和运维团队带来的好处。重点强调 Docker 的轻量级特性和它在提高应用部署、扩展和隔离方面的优势。 本文已收录于,我的…

C++ | 四、指针、链表

指针 指针用来储存地址定义方式,int *ptr;,使用*来表示所定义的变量是指针取地址符,ptr &a;,通过&来取得一个普通变量的地址,并储存到指针中取值(解引用),想要取得一个指针…

【华为OD机试真题2023CD卷 JAVAJS】查找一个有向网络的头节点和尾节点

华为OD2023(C&D卷)机试题库全覆盖,刷题指南点这里 查找一个有向网络的头节点和尾节点 知识点图DFS搜索 时间限制:1s 空间限制:256MB 限定语言:不限 题目描述: 给定一个有向图,图中可能包含有环,图使用二维矩阵表示,每一行的第一列表示起始节点,第二列表示终止节…

LeetCode 34. 在排序数组中查找元素的第一个和最后一个位置

在排序数组中查找元素的第一个和最后一个位置 给你一个按照非递减顺序排列的整数数组 nums,和一个目标值 target。请你找出给定目标值在数组中的开始位置和结束位置。 如果数组中不存在目标值 target,返回 [-1, -1]。 你必须设计并实现时间复杂度为 O(lo…

Java 线程

1. 实现多线程的 2 种方式 Oracle 官网的文档中给出了 2 种实现多线程的方式: 实现 Runnable 接口;继承 Thread 类。 以上两种方式都会调用 Thread.run() 方法,区别是: 实现 Runnable 接口,只是执行 Thread.run() …