读hugging face的daily paper随笔

hugging face’s daily paper

2024.06.29

OMG-LLaVA

像素级视觉理解、推理。
实现了image-level、object-level、pixel-level的推理和理解。

Step-DPO

LLM长链推理的step-wise偏好优化,提高LLM的数学推理能力。

MUMU

引导多模态的图像生成,从多模态prompts生成image。

SimClass

涉及用户参与的多主体课堂模拟框架。

SeaKR

自适应检索增强生成的自我意识知识检索,当LLM对generation表现出高度的self-aware uncertainty时,会激活检索。
检索增强生成 RAG。

Aligning Teacher with Student Preferences for Tailored Training Data Generation

使老师和学生的偏好保持一致,用于生成量身定制的训练数据
ARTE:Aligning teacheR with studenT preferencEs
为知识蒸馏生成量身定制的训练示例。
知识蒸馏(Knowledge Distillation):常用的深度学习模型压缩和加速的技术,核心思想为利用一个更大、更复杂的模型(教师模型)来指导训练一个更小、更简单的模型(学生模型)。
知识蒸馏的主要过程:

  • 训练一个高性能的教师模型。
  • 用教师模型去预测数据样本,获取教师模型的输出,包括类别预测概率(soft labels)。
  • 将教师模型的soft labels作为学生模型的训练目标,要求学生模型能够尽可能逼近教师模型的输出,也就是蒸馏loss。
  • 知识蒸馏可以使相对较小的学生模型获得接近教师模型的性能,同时大幅度降低模型复杂度和推理时间。

Can LLMs Learn by Teaching? A Preliminary Study

LLM可以通过教学来学习吗?

MoA: Mixture of Sparse Attention for Automatic Large Language Model Compression

稀疏注意力混合用于大语言模型的自动压缩
稀疏注意力可以减轻LLM对内存和吞吐量的需求,传统方法通常采用均匀的稀疏注意力mask,在不同的注意力头和输入长度上应用同样的稀疏模式。本文提出了混合注意力,自动为不同的头和层定制不同的稀疏注意力配置。
提高了检索准确率。

T-FREE: Tokenizer-Free Generative LLMs via Sparse Representations for Memory-Efficient Embeddings

通过稀疏表示的无tokenizer生成式LLM,用于内存高效的embedding
tokenizer的发展最近停滞不前,主要限制包括计算开销、无效的词汇使用、不必要的大嵌入和head层。T-FREE,不需要参考语料库,通过字符三元组上的稀疏激活模式来直接编码单词。
参数量减少了85%以上。

AUTOHALLUSION: Automatic Generation of Hallucination Benchmarks for Vision-Language Models

视觉语言模型幻觉基准的自动生成
幻觉:图像中的某些上下文可能会导致语言模块对异常或者假设现象的过度自信和错误推理。现有的研究幻觉的基准,主要依赖于手工制作的案例。本文开发了一种自动基准生成方法,利用主要策略来生成幻觉示例。

Understand What LLM Needs: Dual Preference Alignment for Retrieval-Augmented Generation

理解LLM的需求:检索增强生成的双偏好对齐
检索增强生成(RAG)可以缓解大语言模型的幻觉问题。本文提出DPA-RAG,调整RAG系统中的不同知识偏好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/38738.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

海康视频播放,包含h5和web插件

自行下载 海康开放平台 demo 都写得很清楚,不多描述 1.视频web插件 vue2写法,公共vue文件写法,调用文件即可 开始时需要以下配置,不知道的找对接平台数据的人,必须要,否则播不了 getParameterData: {po…

万字总结随机森林原理、核心参数以及调优思路

万字总结随机森林原理、核心参数以及调优思路 在机器学习的世界里,随机森林(Random Forest, RF)以其强大的预测能力和对数据集的鲁棒性而备受青睐。作为一种集成学习方法,随机森林通过构建多个决策树并将它们的预测结果进行汇总&…

[Day 20] 區塊鏈與人工智能的聯動應用:理論、技術與實踐

AI在醫療領域的創新應用 隨著科技的快速發展,人工智能(AI)在各行各業的應用越來越廣泛,醫療領域也不例外。AI技術在醫療中的應用不僅提高了診斷的準確性,還改善了病患的治療效果,優化了醫療資源的配置。本…

暴雨来袭,陈赫家变“水帘洞”网友:赫哥滴滴打船吗?

在魔都上海,一场突如其来的暴雨 不仅让街道变成了河流,还悄悄上演了一场现实版的“水帘洞”奇遇 而这场奇遇的主角,竟然是喜剧界的明星——陈赫! 这天,乌云密布,电闪雷鸣 魔都的天空仿佛被捅了个窟窿 雨…

吴恩达《LangChain for LLM Application Development》课程笔记

目录 1. 前言 2. 课程笔记 2.1. 模型、提示和解析器 2.2. LLM记忆,上下文管理 2.3. 链式操作 2.4. 文档问答 2.4.1. stuff 方法 2.4.2. 其他方法 2.5. LLM应用评估 2.6. 代理 2.6.1. 预定义工具 2.6.2. 自定义工具 代码资源: 1. 前言 LangC…

文心一言 VS 讯飞星火 VS chatgpt (293)-- 算法导论21.4 2题

二、证明:每个结点的秩最多为 ⌊lgm⌋ 。如果要写代码,请用go语言。 文心一言: 在数据结构和算法中,当我们谈论“结点的秩”时,这通常与某些特定的数据结构(如B树或B树)相关,其中每…

SSH特性|组成|SSH是什么?

SSH,全称为Secure Shell,是由Internet Engineering Task Force (IETF)的网络工作小组制定的一种网络安全协议。它旨在为网络服务提供安全的远程登录和其他网络服务,如文件传输,端口转发等,以保护数据的机密性和完整性。…

代码随想录算法训练营第40天| 518. 零钱兑换 II、 377. 组合总和 Ⅳ、70. 爬楼梯 (进阶)

518. 零钱兑换 II 题目链接:518. 零钱兑换 II 文档讲解:代码随想录 状态:不会 思路: 和494.目标和类似,这题属于组合问题,当我们有一个硬币coin时,对于每个金额j,通过添加这个硬币&a…

从零学习python打卡笔记 第一天

小学生都开始学python了,你还有什么资格不学? 打卡笔记的python版本是3.12.4 一、python能干什么工作? web全栈工程师、大数据分析工程师、爬虫工程师、人工智能工程师、游戏开发工程师、自动化测试工程师、搜索引擎工程师、自动化运维工程师…

RSA加密算法工具类

这里写自定义目录标题 1. RSA加密算法介绍加密和签名**划重点:签名的作用不是防泄密,而是防篡改****对信件内容进行加密****对信息内容追加签名** 为什么在使用非对称加密算法(如 RSA)时,正确的使用方法是公钥加密&…

使用Redisson实现分布式锁详解

摘要 在分布式系统中,保证多个进程或线程对共享资源的互斥访问是非常重要的。本文将介绍如何使用Redisson库来实现分布式锁,以及它的优势和使用场景。 1. 分布式锁的基本概念 在分布式系统中,由于多个节点可能同时访问同一个资源&#xff…

python 的全局列表通过append到别的列表,被append的列表修改元素的值,原来列表元素也跟着改变。

问题: qq [[4],[8]] def test(aa):bb []bb.append(aa[0])bb[0][0] - 2 test(qq) print(qq) [[2],[8]]原因: append 是将存储位置赋值给列表,列表改变意味着原来的列表也要改变。 append() 方法用于在列表末尾添加新的对象。 语法 append(…

插值查找 python

插值查找,也被称为插值搜索,是一种在有序数组中查找某一特定元素的搜索算法。它是对二分查找的一种改进,通过计算元素在数组中的近似位置来减少比较次数,从而提高搜索效率。 原理: 插值查找的基本思想是,根…

Scala的宝藏库:探索常用的第三方库及其应用

Scala的宝藏库:探索常用的第三方库及其应用 Scala,作为一种多范式的编程语言,不仅拥有强大的内置功能,还得益于其丰富的第三方库生态系统。这些库扩展了Scala的能力,帮助开发者在不同领域构建高效、可维护的应用程序。…

平安养老险陕西分公司参加2024上半年省级单位驻富平帮扶团联席会

6月28日,平安养老险陕西分公司工会副主席武媛携驻村工作队赴富平县庄里镇永安村参加2024上半年度省级单位驻富平帮扶团联席会议。 会议由省委金融办副主任、省委金融工委委员李嘉辉及省委金融办选派挂职干部、富平县副县长席玮共同主持。 会上,席玮县长带…

【vue avue】初始化代码 和 增删改查

这里是目录! 一、初始化页面1. 有 avue ,js 补 option2.显隐列二、弹窗1. 新增 - 表单1.1 必填1.2 清除 rules 提示2.编辑三、启用、禁用、删除1.1 菜单左上角1.2 操作栏删除一、初始化页面 Code<template> <basic-container><avue-crud:table-loading="…

Java类的加载过程

加载&#xff08;Loading&#xff09;&#xff1a; 这是类加载过程的第一个阶段。在这个阶段&#xff0c;Java 虚拟机&#xff08;JVM&#xff09;找到并读取类的二进制数据&#xff0c;通常是 .class 文件。这些数据从文件系统、网络、zip 包、jar 文件或其他形式的二进制数据…

吴恩达机器学习 第三课 week2 推荐算法(下)

目录 01 学习目标 02 基于内容的过滤算法 03 实现“电影推荐系统” 3.1 问题描述 3.2 算法实现 04 大项目&#xff08;数据很大&#xff09;的推荐方法※ 4.1 方法原理 4.2 实施示例 05 总结 01 学习目标 &#xff08;1&#xff09;理解基于内容的过滤算法&#xff08…

嵌入式问题分析思路

BUG解决总体思路: 1.1 定位bug范围及性质 要有效解决问题&#xff0c;首先要缩小范围&#xff0c;集中关注最近的代码变化。这有助于迅速定位可能引入问题的部分&#xff0c;避免无谓的时间浪费。检查最近的代码提交记录和修改日志&#xff0c;找出可能影响现有功能的变更。然…