Qwen-VL 技术报告总结

Qwen-VL 技术报告总结

news/2025/4/27 7:35:03/文章来源:https://blog.csdn.net/Colin_xuan/article/details/135996226

感谢如此优秀的开源工作,仓库链接 Qwen-VL

权重分为 Qwen-VL && Qwen-VL-Chat，区别文档稍后介绍

训练过程

在第一阶段中主要使用224X224分辨率训练，训练数据主要来源是公开数据集，经过清洗，数据总量大约是1.4B,中文数据和英文j训练目标是视觉语言和文本语言对齐。使用的loss函数是交叉熵，训练过程：给定一个输入（例如图像or文本），预测整个词表中作为next token的概率（The language model, given an input (such as an image and some initial text), predicts the probability of each token in the vocabulary being the next token in the sequence.），实际标签转换为one-hot, 然后使用交叉熵损失函数计算两个的差（The actual distribution is represented by the true next token in the training data. In practice, this is often converted into a one-hot encoded vector, where the actual next token has a probability of 1, and all others have a probabil

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/662831.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

docker集成 nacos/nacos-server （包括踩的坑）

docker集成 nacos/nacos-server （包括踩的坑）

tips 这边需要的数据库我已经安装好了，所以数据库的安装这边已经省略了拉取镜像（这边使用nacos1.4.1作为例子） docker pull nacos/nacos-server:1.4.1创建映射的文件夹 (conf存放配置文件，logs存放日志文件) mkdir -p /data/n…

阅读更多...

使用docker部署Kafka(MAC Apple M2 Pro)

使用docker部署Kafka(MAC Apple M2 Pro)

前置准备下载适用于Apple M2 Pro的Zookeeper和Kafka Docker镜像 docker pull zookeeper:3.6 docker pull cppla/kafka-docker:arm 下载成功后确认镜像无误 docker images 部署Zookeeper 执行部署命令后查看容器是否启动 docker run -d --name zookeeper -p 2181:2181 -…

阅读更多...

92 C++对象模型探索。数据语义学 - 指向成员函数的指针，vcall进一步学习

92 C++对象模型探索。数据语义学 - 指向成员函数的指针，vcall进一步学习

类指针调用虚函数的时候，会使用 vptr 找虚函数表。在使用函数指针调用成员虚函数的时候会使用到vcall。如果是vcall代码段，则vcall代码会应道编译器找出正确的虚函数表中的虚函数地址进行调用。一指向类成员函数的指针，类静态函数&am…

阅读更多...

MySQL索引的原理和SQL优化策略

MySQL索引的原理和SQL优化策略

1. 索引在InnoDB存储引擎中，索引分为聚簇索引和辅助索引两种类型。聚簇索引是指基于表的主键构建的索引，它决定了表中数据的物理存储顺序。也就是说，聚簇索引中的键值按照主键的顺序来排序，并且每个叶子节点存储的是整个表行的…

阅读更多...

2024美赛A题思路/代码：资源可用性和性别比例

2024美赛A题思路/代码：资源可用性和性别比例

美赛直播b站，提前关注：川川菜鸟美赛辅导预定：美赛服务去年美赛A题作品：2023美赛A题题目背景尽管一些动物物种不属于通常的雄性或雌性，大多数物种在出生时要么显著地为雄性，要么为雌性。虽然许多物…

阅读更多...

HAL库配置PWM模式

HAL库配置PWM模式

一、什么是PWM 脉冲宽度调制(PWM)，是英文“Pulse Width Modulation”的缩写，简称脉宽调制。通过控制高低电平在一个周期内的占比从而输出一定的电压。向上计数原理介绍 PWM的一个周期定时器从0开始向上计数当0-t1段,定时器计数器TIMx_CNT值小于…

阅读更多...

直播团队职责

直播团队职责

一、内容策划直播团队的内容策划人员是整个直播活动的核心，他们需要负责策划直播的主题、内容、形式以及时间安排等。同时，他们还需要负责邀请嘉宾、安排活动等，确保直播内容丰富、有趣、有价值。二、主播管理主播是直播活动的关键人物…

阅读更多...

unity WebGL发布游戏生成WebGL

unity WebGL发布游戏生成WebGL

1.unty Hub中安装WEBGL支持 2.项目平台的切换 color space需要根据项目选择 ColorSpace，是指玩家设置的颜色空间。伽马颜色空间是历史悠久的标准格式，但线性颜色空间渲染可提供更精确的结果。具体区别：ColorSpace 3.由于没有自己服务器…

阅读更多...

壹[1]，Xamarin开发环境配置

壹[1]，Xamarin开发环境配置

1，环境 VS2022 注： 1，本来计划使用AndroidStudio，但是也是一堆莫名的配置让人搞得很神伤，还是回归C#。 2，MAUI操作类似，但是很多错误解来解去，且调试起来很卡。 3，最…

阅读更多...

Spring声明式事务

Spring声明式事务

1.概念事务就是用户定义的一系列执行SQL语句的操作, 这些操作要么完全地执行，要么完全地都不执行， 它是一个不可分割的工作执行单元一个使用Mybatis-Spring的主要原因是它允许Mybatis参与到Spring的事务管理中，而不是给Mybatis创建一个新的…

阅读更多...

如果你也觉得自己不够聪明，也缺乏才华。。。

如果你也觉得自己不够聪明，也缺乏才华。。。

在追求成功的道路上，我们常常自我怀疑，感觉自己不够聪明，缺乏必要的才华。然而，正是这种自我感知，如果处理得当，可以成为我们最大的优势。这篇文章旨在为那些怀疑自己的能力，但依然渴望在工作…

阅读更多...

图片热区功能

图片热区功能

一、需求描述及效果图 1.需求描述： 根据后端返回的坐标及人员信息，在图片上的相应位置添加图片热区功能，点击可展示出对应的人员信息。图片可进行缩放 2.示例： （定位是随便写的，仅做示例） …

阅读更多...

Mac用Crossover玩《幻兽帕鲁》手柄不能用怎么办？ Mac电脑玩《幻兽帕鲁》怎么连接手柄？幻兽帕鲁玩家超1900万

Mac用Crossover玩《幻兽帕鲁》手柄不能用怎么办？ Mac电脑玩《幻兽帕鲁》怎么连接手柄？幻兽帕鲁玩家超1900万

2024年首款爆火Steam平台的游戏《幻兽帕鲁》，在使用Crossover后可以用Mac系统玩了，很多玩家喜欢通过手柄玩游戏，它拥有很好的握持体验，长时间玩也不会很累，所以很多《幻兽帕鲁》玩家都喜欢用手柄来操作，很多…

阅读更多...

Docker 容器jar 运行报错 at sun.awt.FontConfiguration.getVersion 解决方法

Docker 容器jar 运行报错 at sun.awt.FontConfiguration.getVersion 解决方法

docker jar 运行报错 at sun.awt.FontConfiguration.getVersion 初步判断是在运行 Docker 容器中的 JAR 文件时遇到了与字体配置相关的问题。这个问题可能是由于容器内缺少字体配置或字体文件而引起的。要解决这个问题，你可以尝试以下方法： 1.安装字…

阅读更多...

史上最全知识图谱建模实践（下）：多元关系架构

史上最全知识图谱建模实践（下）：多元关系架构

在“知识图谱之本体结构与语义解耦——基于OpenSPG的建模实践（上）”一文中，我们从实体关系设计和概念语义建模2种场景，讲解了基于SPG的知识建模的方法和案例。本文中，我们将继续讲解多元关系架构场景中的知识建模实践…

阅读更多...

构建云安全防线：企业必备的10大能力解析

构建云安全防线：企业必备的10大能力解析

云计算技术为现代企业组织带来了可扩展性、灵活性、减少物理基础设施、降低运营成本以及全天候的数据访问等诸多好处。但研究数据也显示，目前只有4%的企业组织能够为云端资产提供充分的安全保护。在2023年，有超过80%的数据泄露事件涉及存储在云端的数据。…

阅读更多...

Vue3基本概念

Vue3基本概念

script部分 export default对象的属性： name：组件的名称 components：存储中用到的所有组件 props：存储父组件传递给子组件的数据 watch()：当某个数据发生变化时触发 computed：动态计算某个数据 setup(pro…

阅读更多...

json文件缺少的语言key的检测

json文件缺少的语言key的检测

需求在做多语言的项目的时候，需要对当前不同语言的key的差异进行对比并且找出缺少key的语言和具体的语言key 通过node的文件读取能力进行需求的实现 const fs require(fs) const path require(path); const lodash require(lodash); // 目的是找出多语言文件中…

阅读更多...

基于C/C++的MFC的IDC_MFCEDITBROWSE2控件不显示ico问题记录

基于C/C++的MFC的IDC_MFCEDITBROWSE2控件不显示ico问题记录

打开资源文件 *.rc文件 ，在最上方添加 #if !defined(_AFXDLL) #include "afxribbon.rc" // MFC ribbon and control bar resources #endif 如下图所示：

阅读更多...

解决pandas写入excel时的ValueError: All strings must be XML compatible报错

解决pandas写入excel时的ValueError: All strings must be XML compatible报错

报错内容： ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters 报错背景用pands批量写入excel文件，发生编码报错。检索了很多方案，都不能解决。导致报错的原因是存在违法字符&…

阅读更多...

最新文章