Rethinking overlooked aspects in vision-language models

Rethinking overlooked aspects in vision-language models

diannao/2025/4/8 8:01:08/文章来源:https://blog.csdn.net/u012193416/article/details/139481480

探讨多模态视觉语言模型的一些有趣结论欢迎关注 CVHub！https://mp.weixin.qq.com/s/zouNu-g-33_7JoX3Uscxtw1.Introduction

多模态模型架构上的变化不大，数据的差距比较大，输入分辨率和输入llm的视觉token大小是比较关键的，适配器，VIT和语言模型则不是那么关键。InternVL-1.5，Qwen-VL-Max和DeepSeek-VL利用了Laion-5B和COYO这样的大规模预训练数据，数据量达到10亿，InternVL-1.5将sft划分为11个子类，并为每个子类收集相应的开源数据，对于预训练数据，LLM存在一个scaling law，但是在LVM中尚未发现。LLaVA在60多万数据上预训练，15w数据上sft效果就很好了。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/diannao/23067.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Ubuntu 20.04 LTS配置JDK、Git

Ubuntu 20.04 LTS配置JDK、Git

一、配置JDK 1.1 更新系统执行以下命令 sudo apt update 出现以下界面即为安装成功 1.2 安装openjdk-11-jdk Ubuntu20.04中没有默认JDK，执行以下指令安装，默认会自动配置一些必要环境变量 sudo apt install openjdk-11-jdk 1.3 配置环境变量&…

阅读更多...

每天五分钟深度学习PyTorch：Tensor张量的索引和切片

每天五分钟深度学习PyTorch：Tensor张量的索引和切片

本文重点有时候当我们拥有一个Tensor张量的时候，我们可能需要获取它某一维度的信息，那么此时我们就需要索引和切片的技术，它们可以帮助我们解决这些问题。切片操作 a是四维的，然后默认是从第一维开始取，逗号表示取不同的维度 a[:2]表示第一维取0，1，后面三维取所有 …

阅读更多...

场外个股期权交易最新指南

场外个股期权交易最新指南

场外个股期权交易最新指南场外个股期权作为一种灵活的衍生品工具，允许投资者在特定条件下对交易所指定的股票进行买卖。相较于标准化的场内个股期权，场外个股期权为投资者提供了更大的自由度。以下是关于场外个股期权交易的基本步骤和要点：…

阅读更多...

通信技术振幅键控（ASK）调制与解调硬件实验

通信技术振幅键控（ASK）调制与解调硬件实验

一、实验目的 1. 掌握用键控法产生ASK信号的方法； 2. 掌握ASK非相干解调的原理。二、实验内容 1. 观察ASK已调信号的波形； 2. 观察ASK解调信号的波形。三、实验器材 1. 双踪示波器； 2. 通信原理实验箱信号源模块、③、④、⑦号模块。…

阅读更多...

全息之镜，未来的眼镜

全息之镜，未来的眼镜

全息之镜，作为未来眼镜的一种设想和展望，凭借其独特的全息技术，将在未来带来全新的视觉体验和应用场景。以下是关于全息之镜未来的详细分析和展望： 一、技术原理与特点全息之镜利用全息技术，通过干涉、衍射和折射等…

阅读更多...

力扣46 全排列引发对JAVA对象引用的思考

力扣46 全排列引发对JAVA对象引用的思考

先简单说一下本题思路： 数据结构：栈算法：递归使用深度遍历，得到全排列。要使用一个标记数组来标记某个数在本次递归中是否被使用，然后在下次递归前要取消标记。 class Solution {private int[] flag;private List&l…

阅读更多...

【踏雪无痕的痕六】——数学中有意思的问题

【踏雪无痕的痕六】——数学中有意思的问题

一、背景介绍提出一个问题往往比解决一个问题更有意义，因为提出一个问题相当于提出了一个思考问题的维度；而解决一个问题是沿着这个维度将已有的知识串起来的过程三、过程 1.数人数你会吗？ 小名再第10位，小李再第15位&#…

阅读更多...

Linux下SpringBoot项目部署（centos系统）

Linux下SpringBoot项目部署（centos系统）

一、首先找到自己的sql文件，没有就从数据库挪进来二、在Maven下打包一下（点击package），看到BUILD SUCCESS就是打包好了三、将上面两个文件分别挪到 linux 中对应的文件，没有就创建一个（我的是spring_blog…

阅读更多...

【微机原理与汇编语言】并行接口8255实验

【微机原理与汇编语言】并行接口8255实验

一、实验目的掌握可编程并行接口芯片8255的工作原理及初始化方法掌握8255在实际应用中的硬件连接及编程应用二、实验要求根据实验室现有条件，针对实验任务，设计实验方案并进行实现。三、实验内容启动0#计数器，每计5个数&#xff08…

阅读更多...

攻防世界—webbaby详解

攻防世界—webbaby详解

1.ssrf注入漏洞 ssrf（服务端请求伪造）是一种安全漏洞，攻击者通过该漏洞向受害服务器发出伪造的请求，从而访问并获取服务器上的资源，常见的ssrf攻击场景包括访问内部网络的服务，执行本地文件系统命令&#…

阅读更多...

Android基础-消息分发机制

Android基础-消息分发机制

Android中的消息分发机制是系统内部用于处理各种事件和消息传递的一套复杂而精巧的机制。它涉及到多个组件和层次，确保了Android系统的高效运行和响应性。下面将详细阐述Android中的消息分发机制，内容将涵盖其核心组件、工作原理、执行流程等方面。核心…

阅读更多...

Linux基础指令磁盘管理002

Linux基础指令磁盘管理002

LVM（Logical Volume Manager）是Linux系统中一种灵活的磁盘管理和存储解决方案，它允许用户在物理卷（Physical Volumes, PV）上创建卷组（Volume Groups, VG），然后在卷组上创建逻辑卷&am…

阅读更多...

双指针：盛水最多的容器

双指针：盛水最多的容器

目录描述解法盛水最多的容器_牛客题霸_牛客网描述给定一个数组height，长度为n，每个数代表坐标轴中的一个点的高度，height[i]是在第i点的高度，请问，从中选2个高度与x轴组成的容器最多能容纳多少水 1.你不…

阅读更多...

【python】ModuleNotFoundError: No Module Named ‘openyxl’

【python】ModuleNotFoundError: No Module Named ‘openyxl’

成功解决“ModuleNotFoundError: No Module Named ‘openyxl’”错误的全面指南在Python编程中，遇到ModuleNotFoundError: No Module Named openyxl这样的错误通常意味着Python解释器无法找到名为openyxl的模块。然而，这里存在一个常见的拼写错误&#…

阅读更多...

从0到1学Binder-Binder驱动初始化

从0到1学Binder-Binder驱动初始化

文章目录 1. binder_alloc_shrinker_init2. debugfs_create_dir/debugfs_create_file3. init_binder_device4. init_binderfs 我的微信公众号“ZZH的Android”，还有更多 Android 系统源码解析的干货文章等着你，欢迎关注加入交流群。 binder驱动启动入口如…

阅读更多...

蓝桥杯物联网竞赛_STM32L071KBU6_第十五届蓝桥杯物联网竞赛国赛代码解析

蓝桥杯物联网竞赛_STM32L071KBU6_第十五届蓝桥杯物联网竞赛国赛代码解析

目录前言：1、配置及代码：(1) A板：[1] CUBMX配置：[2] keil5代码： (2) B板：[1] CUBMX配置：[2] keil5代码： 2、代码解析： 前言： 这届国赛是目前为止最难一届&am…

阅读更多...

计算机发展史 | 从起源到现代技术的演进

计算机发展史 | 从起源到现代技术的演进

computer | Evolution from origins to modern technology 今天没有参考资料哈哈 PPT：（评论区？） 早期计算工具算盘 -算盘是一种手动操作的计算辅助工具，起源于中国，迄今已有2600多年的历史，是…

阅读更多...

实验9 静态路由配置

实验9 静态路由配置

实验9 静态路由配置一、原理描述二、实验目的三、实验内容四、实验配置五、实验步骤一、原理描述网络中的每个路由器都会维护一张路由表或转发表。路由表的表项记录着目的网络信息以及下一跳I 地址。路由表可以手动配置，也可以通过路由算法动态生成。静态…

阅读更多...

使用 MDC 实现日志链路跟踪，包教包会！

使用 MDC 实现日志链路跟踪，包教包会！

在微服务环境中，我们经常使用 Skywalking、Spring Cloud Sleut 等去实现整体请求链路的追踪，但是这个整体运维成本高，架构复杂，本次我们来使用 MDC 通过 Log 来实现一个轻量级的会话事务跟踪功能，需要的朋友可以参考一…

阅读更多...

小世界网络生成及其分析

小世界网络生成及其分析

研究背景：小世界网络是一种介于规则网络和随机网络之间的网络模型，具有短平均路径和高聚集性的特点。这种网络模型被广泛应用于社交网络、互联网、生物网络等领域的研究中。研究小世界网络的生成和分析可以帮助我们理解和揭示复杂网络的结构和特性，以及网络中信息传播、动力…

阅读更多...

最新文章