【书生浦语第二期实战营学习笔记作业(四)】

课程文档:https://github.com/InternLM/Tutorial/blob/camp2/xtuner/readme.md
作业文档:https://github.com/InternLM/Tutorial/blob/camp2/xtuner/homework.md

书生浦语第二期实战营学习笔记&作业(四)

1.1、微调理论讲解及 XTuner 介绍

  • 两种Finetune范式: 增量预训练和指令跟随在这里插入图片描述
    增量预训练和指令跟随 区别:
    在这里插入图片描述
  • 一条数据的一生:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

1.2 微调方案 LoRA & QLoRA

在这里插入图片描述
LoRA介绍: LLM的参数量主要集中在模型中的Linear,训练这些参数会耗费大量的显存。
LoRA通过在原本的Linear旁,新增一个支路,包含两个连续的小Linear,新增的这个支路通常叫做 Adapter。
Adapter 参数量远小于原本的Linear,能大幅降低训练的显存消耗

LoRA & QLoRA对比
在这里插入图片描述

2.1 XTuner简介

在这里插入图片描述

2.2 XTuner快速上手

在这里插入图片描述
在这里插入图片描述

2.3 XTuner数据引擎

在这里插入图片描述
在这里插入图片描述

3.1 多模态LLM

  • 多模态LLM原理简介
    在这里插入图片描述

  • LLaVA方案简介
    在这里插入图片描述
    在这里插入图片描述

LLaVA方案

在这里插入图片描述

作业:

  1. 准备数据集
    在这里插入图片描述
  2. 模型训练
    在这里插入图片描述
    在这里插入图片描述
    对话测试:
    微调后的模型
    在这里插入图片描述
    微调前的模型
    在这里插入图片描述
    Web demo 部署:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/3106.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

不要摆摊,不要开早餐店,原因如下

关注卢松松,会经常给你分享一些我的经验和观点。 我最近开通了视频号会员专区嘛,专区有个问答功能可以提问,有个会员问了我问题,其中一条问答分享给大家: 松哥,突然想去兼职,早上卖点杂粮煎饼果…

C语言自定义类型【结构体】

结构体的概念 结构是一些值的集合,这些值被称为成员变量。结构的每个成员可以是不同类型的变量。 1.结构体的声明 1.1普通声明 我们假设要创建一本书的类型,那我们需要书名,作者,价格,书的ID 代码如下:…

2024年04月09日 Go生态洞察:2024年上半年Go开发者调查报告洞察

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 专栏链接: 🔗 精选专栏:…

Linux——web基础实验

实验前的安装 [rootwebserver ~]# yum -y install httpd [rootwebserver ~]# systemctl enable --now httpd Created symlink /etc/systemd/system/multi-user.target.wants/httpd.service → /usr/lib/systemd/system/httpd.service. [rootwebserver ~]# echo test for apach…

性能监控数据(本地、服务器)

CPU、内存、磁盘等的监控 一、mac本地性能监控 1. top 终端: top load Avg: 平均负载(1分钟,5 分钟,15 分钟)值不能超过 4,要不然就是超负荷运行 Tasks: 进程数 %Cpu(s): idle :剩余百分比 KiB Mem: free:剩余内存&#xff0…

再谈C语言——理解指针(五)(完结篇)

数组名的理解 在上⼀个章节我们在使⽤指针访问数组的内容时,有这样的代码: int arr[10] {1,2,3,4,5,6,7,8,9,10}; int *p &arr[0]; 这⾥我们使⽤ &arr[0] 的⽅式拿到了数组第⼀个元素的地址,但是其实数组名本来就是地址&#xf…

视频剪辑新高度:轻松为视频添加字幕,提升内容质量与传播力

视频已经成为最直观、最动人的信息传播方式。但是,仅仅依靠画面和声音,往往难以完全传达视频的核心内容或情感。这时,字幕的加入就显得尤为重要。它们不仅能够增强观众的观看体验,还能为视频增添独特的文字魅力。 首先&#xff0…

让你的电脑准时“打个盹”:Win10定时休眠

哈喽,大家好,我是木头左! 一、Windows 10任务计划程序 在快节奏的工作生活中,常常需要让电脑在特定时间执行某些任务,而Windows 10的任务计划程序就是为此而生的神器。它不仅可以自动更新系统、备份文件,甚…

九泰智库 | 医械周刊- Vol.23

⚖️ 法规动态 新疆药品和医疗器械产品注册费收费标准大幅降低平均降幅95% 近日,新疆自治区发展和改革委会同自治区财政厅印发《关于调整药品医疗器械产品注册费收费标准的通知》,明确自2024年4月29日起,取消药品补充申请注册费,药…

打造人脸磨皮算法新标杆,满足企业多元化需求

高清视频和图片已成为企业展示形象、传递信息的重要载体,拍摄过程中难以避免的皮肤瑕疵和纹理不均等问题,常常让精美的画面失色。美摄科技凭借其领先的人脸磨皮算法解决方案,为企业提供了高效、精细的图像处理服务,让每一帧画面都…

Git ignore、exclude for TortoiseGit 小结

1.Ignore Type:忽略类型,也即忽略规则,如何去忽略文件? 1.1.Ignore item(s) only in containing folder(s):仅忽略在包含在文件夹中项目。 仅忽略该文件夹下选定的patterns。the patterns其实就是文件类型,比如.txt后…

python安装pytorch@FreeBSD

先上结论,最后在conda下安装成功了! PyTorch是一个开源的人工智能深度学习框架,由Facebook人工智能研究院(FAIR)基于Torch库开发并维护。PyTorch提供了一个高效、灵活且易于使用的工具集,用于构建和训练深…

SpringMVC基础篇(一)

文章目录 1.基本介绍1.特点2.SpringMVC跟SpringBoot的关系 2.快速入门1.需求分析2.图解3.环境搭建1.创建普通java工程2.添加web框架支持3.配置lib文件夹1.导入jar包2.Add as Library3.以后自动添加 4.配置tomcat1.配置上下文路径2.配置热加载 5.src下创建Spring配置文件applica…

找不到openjdk-1.8-tools和openjdk-1.8-jconsole

每次打包都报找不到openjdk-1.8-tools和openjdk-1.8-jconsole,但是在项目中并没有用到。 这个是在maven仓库下的druid下的pom文件中。根本没有用到,于是把这两行注释调。解决 .m2\repository\com\alibaba\druid\1.2.6\druid-1.2.6.pom

钡铼IOy系列模块在无人值守智能仓库中的成功运用,提升仓储物流效率

随着科技的不断发展,无人值守智能仓库正成为现代物流行业的一个重要趋势。在这个快节奏的时代,提升仓储物流效率是企业追求的目标之一。钡铼IOy系列模块为无人值守智能仓库的成功运作提供了关键支持。本文将探讨钡铼IOy系列模块在无人值守智能仓库中的应…

深入Linux下的GCC编译器:从入门到精通

目录标题 1、GCC编译器概述2、安装GCC3、GCC的基本使用4、高级功能4.1 多文件编译4.2 静态和动态链接4.3 什么是链接?4.4 静态链接优点缺点 4.5 动态链接优点缺点 4.6 实际应用4.7 编译优化 GCC(GNU Compiler Collection)是一款免费、开源的编…

Elasticsearch下载

1 最新版下载地址 Download Elasticsearch | Elastic https://www.elastic.co/cn/downloads/elasticsearch 2 其他版本下载地址 https://www.elastic.co/cn/downloads/past-releases#elasticsearch 7.9.2:https://artifacts.elastic.co/downloads/elasticsearch/elasticsear…

基于springboot+vue+Mysql的篮球竞赛预约平台

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…

【vue功能】多张图片合并

多张图片合并成一张图片 步骤一,多张图片上传步骤二,循环获取所有绘制图片的总高度new FileReader()方法作用new Image()方法作用介绍 步骤三,合并多张图片canvas.toDataURL()作用-dpr作用 步骤四,下载图片 步骤一,多张…