8月15日

8月15日

bicheng/2025/4/20 14:53:11/文章来源:https://blog.csdn.net/Tankoldbang/article/details/141225998

上午开会 rag继续异构大模型

狂野飙车9之前的账号终于找回来了

下午

关于minicpm的代码

minicpm-v

大模型预训练论文&方法总结 - 知乎 (zhihu.com)

这里有讲解的代码

发现还是先推荐把llava的掌握好了之后再看minicpm

多模态大模型LLaVA模型讲解——transformers源码解读_哔哩哔哩_bilibili

图像的读取

图像embedding 还需要在提取特征处理之后再使用

图像是怎么embeding 以及图像和文本怎么拼接

比如输入这个image 怎么样 image 这里是指向图片的链接

图像 [3, 高，宽] 第一维是3通道

画图工具 drawio

自定义多模态llava

图像用的clip

文本用的是qwen1.5-4B

加载模型的时候用的函数

from transformers import AutoModel, AutoModelForCausalLM, AutoTokenizer, AutoProcessorclip_model = AutoModel.from_pretrained(clip_model_name_or_path, device_map="cuda:0")
llm_model = AutoModelForCausalLM.from_pretrained(qwen_model_name_or_path, device_map="cuda:0"
)

这个AutoModel和AutoModelForCausalLM有什么区别

初始化llava的使用教程 huggingface里面有

拼接模型怎么知道要给什么层赋值呢

后面发现有个层没法初始化是随机的

就像文本需要用分词器视觉也需要用autoprocessor

训练llava

数据集

标准的添加路径

用Path（）.joinpath()

而不是用 '' + ''

加载数据与转换

构造数据集之后

需要使用transformer的 trainer

需要批处理的化需要用collator

from transformers import AutoProcessor

先看一下单个的处理调用官方提供的

在调用千问的时候要注意使用千问的对话模板

有的时候数据比较复杂

用dataclass 弄一下

合并批次

Collator

主要是多维的时候指定某一维拼接

torch.concat

__cal__ 重载

注意返回的维度

每个数据长度各不一样需要进行对齐

首先是需要统计最长的有多长

如何讲 pynotebook转换成成段的代码

注意导相对

构建数据的时候可以用model.loss 来测试

训练流程

data.py 文件

run_show.py代码是从什么地方复制的呢

首先是设定参数

dataclass

ModelArguments

对于不同的lora fulltuning

弹出消息logging.warning()

util.py中是peft的代码

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/52572.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

YoloV8改进策略：卷积篇|ACConv2d模块在YoloV9中的创新应用与显著性能提升|简单易用_即插即用

YoloV8改进策略：卷积篇|ACConv2d模块在YoloV9中的创新应用与显著性能提升|简单易用_即插即用

摘要在本文中，我们创新性地将ACConv2d模块引入到YoloV9目标检测模型中，通过对YoloV9中原有的Conv卷积层进行替换，实现了模型性能的大幅提升。ACConv2d模块基于不对称卷积块（ACB）的设计思想，利用1D非对称卷…

阅读更多...

sql server导入mysql，使用工具SQLyog

sql server导入mysql，使用工具SQLyog

概述需要将sql server的数据导入到mysql中，由于2种数据库存在各种差异，比如表字段类型就有很多不同，因此需要工具来实现。这里使用SQLyog来实现。 SQLyog安装安装过程参考文档：https://blog.csdn.net/Sunshine_liang1/article/…

阅读更多...

SQL Server事务日志文件过大的处理方法

SQL Server事务日志文件过大的处理方法

正常情况下事务日志文件过大时可以右点数据库--任务--收缩--文件--选择日志进行收缩，从而达到减小事务日志文件的目的。但在有些情况下没有达到执行收缩条件，无法执行收缩： 1、数据库恢复模式为完整恢复模式（FULL&#xff09…

阅读更多...

c++,python实现网络爬虫

c++,python实现网络爬虫

前言： 社交网络中用户生成的海量数据，社交网络数据的多样性和复杂性如何高效地从海量的数据中获取和处理我们需要的信息资源？ 该微博爬虫能够从社交网络平台中地提取文本、图片和用户之间的转发关系，并将这些数据结构化存储到…

阅读更多...

【图论】Tarjan算法（强连通分量）

【图论】Tarjan算法（强连通分量）

一、Tarjan算法简介 Tarjan算法是一种由美国计算机科学家罗伯特塔杨（Robert Tarjan）提出的求解有向图强连通分量的线性时间的算法。二、强连通分量的概念在有向图 G G G 中，如果任意两个不同的顶点相互可达，则称该有向图是强…

阅读更多...

Android高级UI --- canvas

Android高级UI --- canvas

前言我们先来聊聊，在我们生活中如何绘制一张如下的图。我们需要两样东西来绘制： 一张纸（Android 中的 canvas）：用来承载我们绘制的内容。一支笔（Android 中的 paint）：负责绘制内…

阅读更多...

（QT-UI）十四、在时间轴上绘制一段段时间片

（QT-UI）十四、在时间轴上绘制一段段时间片

本系列预计实现 ①刻度上方文字显示， ②时间轴拖动效果， ③时间轴刻度缩放， ④时间轴和其他控件联动显示， ⑤鼠标放置到时间轴，显示具体时间。 ⑥通过定时器，实时更新时间轴 ⑦时间轴上绘制时间片完…

阅读更多...

如何上传NPM包：一步步指南

如何上传NPM包：一步步指南

在JavaScript和Node.js开发中，NPM（Node Package Manager）是一个广泛使用的包管理工具。通过NPM，我们可以方便地管理项目中的依赖库，也可以将自己的代码打包发布给其他开发者使用。这篇文章将详细介绍如何将你自己的代码…

阅读更多...

电商API 接口的发展会对传统行业产生哪些影响

电商API 接口的发展会对传统行业产生哪些影响

API 接口的发展会给传统行业带来多方面的影响，具体如下： 提升运营效率与生产力优化业务流程：以制造业为例，通过 API 接口可将生产设备、管理系统等进行连接，实现设备数据的自动采集与传输，实时监控生产状态…

阅读更多...

004、架构_配置文件_总览

004、架构_配置文件_总览

配置文件用来配置各模块运行时使用的参数，GoldenDB数据库的配置文件以及文件说明参见下表：模块/服务器名称配置文件文件路径配置文件功能CNproxy.ini os.ini dis_info_load.ini$HOME/etc/proxy.ini 配置 CN 运行参数。 os.ini 配置链路信息，以及模块启动信息。 dis_info…

阅读更多...

linux系统使用 docker 来部署web环境 nginx+php7.4 并配置称 docker-compose-mysql.yml 文件

linux系统使用 docker 来部署web环境 nginx+php7.4 并配置称 docker-compose-mysql.yml 文件

Docker是一个开源的容器化平台，旨在简化应用程序的创建、部署和管理。它基于OS-level虚拟化技术，通过将应用程序和其依赖项打包到一个称为容器的标准化单元中，使得应用程序可以在任何环境中快速、可靠地运行。 Docker的优势有以下几个方面&a…

阅读更多...

重发布实验

重发布实验

一、实验拓扑二、实验需求 1.如图搭建网络拓扑，所有路由器各自创建一个环回接口，合理规划IP地址 2.R1-R2-R3-R4-R6之间使用OSPF协议，R4-R5-R6之间使用 RIP协议 3.R1环回重发布方式引入OSPF网络 4.R4/R6上进行双点双向重发布 5.分析网络中出…

阅读更多...

VScode | 我想推荐这些插件，好用

VScode | 我想推荐这些插件，好用

系列文章目录本系列文章主要分享作位前端开发的工具之------VScode的使用分享。 VScode | 我的常用插件分享_vscode 别名跳转-CSDN博客 VScode | 我的常用代码片段，提升开发速度-CSDN博客 VScode | 我会设置文件夹右键用VScode打开_vscode右键打开文件夹-CSDN博…

阅读更多...

如何使用ssm实现基于ssm的“游侠”旅游信息管理系统

如何使用ssm实现基于ssm的“游侠”旅游信息管理系统

TOC ssm190基于ssm的“游侠”旅游信息管理系统jsp 绪论 1.1 研究背景当前社会各行业领域竞争压力非常大，随着当前时代的信息化，科学化发展，让社会各行业领域都争相使用新的信息技术，对行业内的各种相关数据进行科学化&#x…

阅读更多...

【持续更新】nPlayer Premium v1.7.7.7-191219安卓知名播放器最新免费高级修改版

【持续更新】nPlayer Premium v1.7.7.7-191219安卓知名播放器最新免费高级修改版

nPlayer，也是安卓上一个非常强大的播放器。 ▨ 高级版亮点功能： • 多语言字幕支持：无论是电影还是电视剧，都能轻松添加多种语言字幕，让观影体验更上一层楼 • Chromecast 投屏：借助 Chromecast&#xff0…

阅读更多...

工商业光伏：从传统行业迈向数字化的第一步

工商业光伏：从传统行业迈向数字化的第一步

现在每个行业都需要和互联网挂上关系，光伏行业也不例外，从传统的行业思维迈向数字化，户用光伏是比较成功的，户用光伏一直都是代理模式，头部平台会提供一个平台系统来管理下面代理商的业务或者电站，但是呢&a…

阅读更多...

RocketMQ~刷盘机制、主从复制方式、存储机制

RocketMQ~刷盘机制、主从复制方式、存储机制

刷盘机制生产者发布MQ给Brocker，Brocker在存储这些数据的时候，需要进行刷盘，分为同步刷盘和异步刷盘。在同步刷盘中需要等待一个刷盘成功的ACK，同步刷盘对MQ消息可靠性来说是一种不错的保障，但是性能上会有较大影响…

阅读更多...

GoWeb 设置别名和多环境配置

GoWeb 设置别名和多环境配置

别名 vite.config.ts中添加代码如下即可 //设置别名resolve: {alias: {"": path.resolve(process.cwd(),"src"),//用替代src}}随后即可使用配置多环境 vite.config.ts中添加代码如下 envDir: ./viteenv,//相对路径随后在项目根目录创建对应的viteenv…

阅读更多...

【游戏速递】小猪冲刺：萌动指尖的极速挑战，小虎鲸Scratch资源站独家献映！

【游戏速递】小猪冲刺：萌动指尖的极速挑战，小虎鲸Scratch资源站独家献映！

在线玩：Scratch小猪冲刺：全新挑战的几何冒险游戏-小虎鲸Scratch资源站想象一下，一群憨态可掬的小猪，穿上炫酷的装备，踏上了追逐梦想的赛道。它们或跳跃、或滑行，灵活躲避各种障碍，只为那终点的…

阅读更多...

Web API 学习笔记第四弹

Web API 学习笔记第四弹

1.时间戳获取时间戳的方法①date.getTime()②new Date() 2.定时器 console.log(111)setTimeout(()>{console.log(222)},1000)console.log(333) console.log(111)setTimeout(()>{console.log(222)},0)console.log(333) 这两段代码打印结果分别是？ 第一段 …

阅读更多...

最新文章