LLm与微调入门

LLm与微调入门

pingmian/2025/4/28 22:34:52/文章来源:https://blog.csdn.net/m0_73202283/article/details/139891212

两种 Finetune 范式

增量预训练微调

使用场景：让基座模型学习到一些新知识，如某个垂类领域的常识训练数据：文章、书籍、代码等

指令跟随微调

使用场景：让模型学会对话模板，根据人类指令进行对话训练数据：高质量的对话、问答数据

不同数据集下使用微调

数据集1 - 数据量少，但数据相似度非常高在这种情况下，我们所做的只是修改最后几层或最终的softmax图层的输出类别。
数据集2 - 数据量少，数据相似度低在这种情况下，我们可以冻结预训练模型的初始层（比如k层），并再次训练剩余的（n-k）层。由于新数据集的相似度较低，因此根据新数据集对较高层进行重新训练具有重要意义。
数据集3 - 数据量大，数据相似度低在这种情况下，由于我们有一个大的数据集，我们的神经网络训练将会很有效。但是，由于我们的数据与用于训练我们的预训练模型的数据相比有很大不同。使用预训练模型进行的预测不会有效。因此，最好根据你的数据从头开始训练神经网络（Training from scatch）。
数据集4 - 数据量大，数据相似度高这是理想情况。在这种情况下，预训练模型应该是最有效的。使用模型的最好方法是保留模型的体系结构和模型的初始权重。然后，我们可以使用在预先训练的模型中的权重来重新训练该模型。

微调指导事项

使用较小的学习率来训练网络。由于我们预计预先训练的权重相对于随机初始化的权重已经相当不错，我们不想过快地扭曲它们太多。通常的做法是使初始学习率比用于从头开始训练（Training from scratch）的初始学习率小10倍。

pass

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/pingmian/32416.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

C++记录程序运行时间的4方法

C++记录程序运行时间的4方法

目录 1. 使用 <chrono>库（C11及以后版本） 2. 使用<ctime>库（较旧但常用的方法） 3、使用第三方库（如Boost.Timer） 4. 使用Windows API函数（Windows平台特有） 1. 使用 …

阅读更多...

Sequelize入门及简单的增删改查

Sequelize入门及简单的增删改查

前言学习一下NodeJS怎么使用Sequelize怎么查询数据库数据一、Sequelize是什么？ Sequelize 是一个基于 promise 的 Node.js ORM, 二、搭建项目 1.安装过程 npm i -g sequelize-cli //全局安装sequelize-clinpm i sequelize mysql2 //安装sequelize和mysql2…

阅读更多...

System.Runtime, Version=6.0.0.0，生成的dll使用出现错误问题

System.Runtime, Version=6.0.0.0，生成的dll使用出现错误问题

解决： 1.unity左上角file点击选中build settings 点击player settings ，然后在player的window的other settings的configuration更改为 Framerwork 其实这个不换也可以的，我后面调试完，发现这个不是重点，下面第2点才是…

阅读更多...

Python15 理解Python迭代器

Python15 理解Python迭代器

1.Python中的迭代器在Python中，迭代器是一种允许程序员遍历一个容器（特别是列表、元组、字典等集合类型）的对象，而不需要了解容器的内部结构。迭代器提供了一个统一的方法来逐一访问容器中的元素，这种机制称为迭代。…

阅读更多...

使用自签名 TLS 将 Dremio 连接到 MinIO

使用自签名 TLS 将 Dremio 连接到 MinIO

Dremio 是一个开源的分布式分析引擎，为数据探索、转换和协作提供简单的自助服务界面。Dremio 的架构建立在 Apache Arrow（一种高性能列式内存格式）之上，并利用 Parquet 文件格式实现高效存储。有关 Dremio 的更多信息，…

阅读更多...

应用占内存，应用太耗电。不如冻起来！

应用占内存，应用太耗电。不如冻起来！

在安卓系统中，一些不常用的系统组件、进程或顽固应用可能会持续在后台运行，占用宝贵的内存资源，导致手机出现卡顿、续航减少等问题。今天我将向您推荐几款实用的应用冻结工具，它们能够帮助您冻结或隐藏这些不必要的应用&#xff0…

阅读更多...

最新PHP仿猪八戒任务威客网整站源码/在线接任务网站源码

最新PHP仿猪八戒任务威客网整站源码/在线接任务网站源码

资源介绍老规矩，截图为亲测，前后台显示正常，细节功能未测，有兴趣的自己下载。 PHP仿猪八戒整站源码下载，phpmysql环境。威客开源建站系统，其主要交易对象是以用户为主的技能、经验、时间和智慧型商品。经…

阅读更多...

Vue81-独享路由守卫

Vue81-独享路由守卫

一、独享路由守卫的定义当只有某个特定的路由需要做校验的时候，可以在改路由组件规则的地方单独配置独属于改组件的路由守卫。二、示例 1、需求系统只在进入新闻路由页面的时候做校验。 2、代码实现注意： 独享路由守卫，只有前置路由守…

阅读更多...

Spring Gateway转发websocket原理

Spring Gateway转发websocket原理

Spring Cloud Gateway简称Spring Gateway，它可以转发请求到后端微服务。Spring Gateway除了转发HTTP请求，也支持websocket请求。我们看下它是怎么实现的吧。配置支持websocket转发支持websocket转发，需要用到spring-cloud-starter-gatewa…

阅读更多...

高通安卓12-OTA 升级

高通安卓12-OTA 升级

1.OTA介绍 OTA 英文全称是 Over-the-Air Technology，即空间下载技术的意思。 OTA 升级是 Android 系统提供的标准软件升级方式。它功能强大，可以无损失升级系统，主要通过网络[例如 WIFI、3G]自动下载 OTA 升级包、自动升级，但…

阅读更多...

TCP协议详解：三次握手与四次挥手

TCP协议详解：三次握手与四次挥手

TCP协议详解：三次握手与四次挥手目录 TCP协议详解：三次握手与四次挥手一、TCP协议概述二、TCP连接建立：三次握手三、TCP连接释放：四次挥手四、TCP协议的可靠性机制五、TCP流量控制与拥塞控制一、TCP协议概述 TCP（传输控制协议）是一种面向连接的、可靠的、基于…

阅读更多...

Windows11系统自动获取电脑IPV6地址，并且开机自动发送到指定邮箱

Windows11系统自动获取电脑IPV6地址，并且开机自动发送到指定邮箱

废话：最近放假回家，在家里突然想玩游戏了，Steamdeck性能终归有限。部分游戏始终玩的不爽，想到之前了解到的SunshnieMoonlight串流的方案，远程调用家里的电脑打游戏，简直不要太爽。一顿折腾之后配置好了所有…

阅读更多...

发送短信v2

发送短信v2

接口说明接口英文名 newSendCloudBaseSms 功能描述发送携带 URL Link 的短信注意事项短信内容短信由签名和正文内容组成： 短信签名是位于短信正文前【】中的署名，小程序发送短信时，签名为小程序名称。正文内容是由短信模板和变…

阅读更多...

【职场人】“万事皆可”领导的职场囧途

【职场人】“万事皆可”领导的职场囧途

故事单元一：无所不能的承诺在我的公司里，有一位领导，我们戏称他为“万事皆可”先生。每当有新的任务或挑战出现时，他总是第一个站出来，拍着胸脯说：“没问题，交给我吧！”他的这种自…

阅读更多...

一种微弱故障特征增强的旋转机械故障诊断方法（MATLAB）

一种微弱故障特征增强的旋转机械故障诊断方法（MATLAB）

导致轴承失效的根本原因是由异常磨损和局部间的机械冲击所导致的。对轴箱轴承日常运转的下所产生的均匀磨损而言，其振动信号特征与正常轴承振动信号大致一样，随机性较强，其概率密度函数呈现出高斯分布的现象，但由于磨损所导致的不…

阅读更多...

37 - 上级经理已离职的公司员工（高频 SQL 50 题基础版)

37 - 上级经理已离职的公司员工（高频 SQL 50 题基础版)

37 - 上级经理已离职的公司员工 selecte1.employee_id fromEmployees e1 left join Employees e2 on e1.manager_id e2.employee_id wheree2.manager_id is null and e1.manager_id is not null and e1.salary<30000;

阅读更多...

《计算机英语》 Unit 5 Networking 网络

《计算机英语》 Unit 5 Networking 网络

Section A Networking 网络 The need to share information and resources among different computers has led to linked computer systems, called networks, in which computers are connected so that data can be transferred from machine to machine. 不同计算机之间共享…

阅读更多...

什么是正态分布

什么是正态分布

最重要的连续分布的通用名是概率密度函数，而标准正态分布（Standard Normal Distribution） 是最重要的概率密度函数。这个连续分布之所以重要，我认为是因为它非常常见，换句话说，我们会很常用到它。标准正态分…

阅读更多...

C++基础编程100题-012 OpenJudge-1.3-10 计算并联电阻的阻值

C++基础编程100题-012 OpenJudge-1.3-10 计算并联电阻的阻值

更多资源请关注纽扣编程微信公众号 http://noi.openjudge.cn/ch0103/09/ 描述对于阻值为r1和r2的电阻，其并联电阻阻值公式计算如下： R 1/(1/r1 1/r2) 输入两个电阻阻抗大小，浮点型，以一个空格分开。输出并联之后的阻…

阅读更多...

【tomcat】tomcat系统架构以及核心启动流程

【tomcat】tomcat系统架构以及核心启动流程

对于web后端开发工程师来说，tomcat作为一个应用服务器框架本质上就是一个HTTP服务Servlet容器。研究过spring、spring mvc源码的同学应该了解，spring mvc其实就是基于Servlet规范实现的请求的转发路由、转发处理。而Spring和SpringMVC就是通过web.xml文件…

阅读更多...

最新文章