迁移学习 - 微调

迁移学习 - 微调

news/2025/7/3 20:15:57/文章来源:https://blog.csdn.net/weixin_45682053/article/details/134070035

什么是与训练和微调？

你需要搭建一个网络模型来完成一个特定的图像分类的任务。首先，你需要随机初始化参数，然后开始训练网络，不断调整参数，直到网络的损失越来越小。在训练的过程中，一开始初始化的参数会不断变化。当你觉得结果很满意的时候，你就可以将训练模型的参数保存下来，以便训练好的模型可以在下次执行类似任务时获得较好的结果。这个过程就是 pre-training。
之后，你又接收到一个类似的图像分类的任务。这时候，你可以直接使用之前保存下来的模型的参数来作为这一任务的初始化参数，然后在训练的过程中，依据结果不断进行一些修改。这时候，你使用的就是一个 pre-trained 模型，而过程就是 fine-tuning。

所以，预训练就是指预先训练的一个模型或者指预先训练模型的过程；微调就是指将预训练过的模型作用于自己的数据集，并使参数适应自己数据集的过程。

网络架构

一个神经网络一般可以分为两块

特征抽取将原始像素变成容易线性分割的特征
线性分类器来做分类

在这里插入图片描述

微调

在这里插入图片描述

微调中的权重初始化

在这里插入图片描述

训练

是一个目标数据集上的正常训练任务，但使用更强的正则化

使用更小的学习率
使用更少的数据迭代

源数据集远复杂与目标数据，通常微调效果更好。

重用分类器权重

源数据集可能也有目标数据中的部分标号
可以使用预训练好模型分类器中对应标号对应的向量来做初始化

固定一些层

神经网络通常学习有层次的特征表示

低层次的特征更加通用
高层次的特征则更跟数据集相关

可以固定底部一些层参数，不参与更新

更强的正则

总结：

微调通过使用在大数据上得到的预训练好的模型来初始化模型权重来完成提升精度
预训练模型质量很重要
微调通常速度更快、精度更高

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/124098.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

指针相关面试题目

指针相关面试题目

数组名的意义： 1. sizeof( 数组名 ) ，这里的数组名表示整个数组，计算的是整个数组的大小。 2. & 数组名，这里的数组名表示整个数组，取出的是整个数组的地址。 3. 除此之外所有的数组名都表示首元素的地址。下…

阅读更多...

【地理位置识别】IP归属地应用的特点

【地理位置识别】IP归属地应用的特点

IP归属地应用是一类用于确定特定IP地址的地理位置信息（通常是城市、地区或国家）的工具和服务。以下是IP归属地应用的几个主要特点： 地理位置识别： IP归属地应用主要用于确定IP地址的地理位置。这可以帮助组织更好地了解其网站访问…

阅读更多...

【C语言实现扫雷小游戏——可展开一片】

【C语言实现扫雷小游戏——可展开一片】

文章目录 1. 游戏分析和设计1.1扫雷游戏的功能说明1.2数据结构的分析与设计 2.代码实现2.1基本框架2.2初始化棋盘2.3打印棋盘2.4布置雷2.4统计周围雷的个数2.5排查雷2.6展开一片 3.完成代码3.1game.h3.2 game.c3.3test.c 学习完了函数和数组，让我们做个扫雷小游戏巩…

阅读更多...

评估在线不平衡学习的PAUC

评估在线不平衡学习的PAUC

评估在线不平衡学习的PAUC 原始论文《Prequential AUC: properties of the area under the ROC curve for data streams with concept drift》由于正常的AUC需要计算整体数据集上，每个数据的预测置信度的排名。那么我们首先要求我们的在线学习算法在进行预测时也返…

阅读更多...

Flume 快速入门【概述、安装、拦截器】

Flume 快速入门【概述、安装、拦截器】

文章目录什么是 Flume？Flume 组成Flume 安装Flume 配置任务文件应用示例启动 Flume 采集任务 Flume 拦截器编写 Flume 拦截器拦截器应用什么是 Flume？ Flume 是一个开源的数据采集工具，最初由 Apache 软件基金会开发和维护。它的主要目的是…

阅读更多...

Java 谈谈你对OOM的认识

Java 谈谈你对OOM的认识

文章目录前言一、基础架构二、常见OOM1、栈内存溢出java.lang.StackOverflowError2、堆内存溢出java.lang.OutOfMemoryError：Java heap space3、GC回收时间过长java.lang.OutOfMemoryError: GC overhead limit exceeded4、NIO程序堆外内存溢出java.lang.OutOfMemor…

阅读更多...

H 指数 II

H 指数 II

给你一个整数数组 citations ，其中 citations[i] 表示研究者的第 i 篇论文被引用的次数，citations 已经按照升序排列。计算并返回该研究者的 h 指数。 h 指数的定义：h 代表“高引用次数”（high citations）&#xff…

阅读更多...

STM32———USART串口控制LED灯亮灭

STM32———USART串口控制LED灯亮灭

1.硬件设计流程 2.程序设计流程 1.串口初始化时钟使能：RCC_APBxPeriphClockCmd(); GPIO初始化时钟使能：RCC_AHBxPeriphClockCmd();2.GPIO端口模式配置：GPIO_Init();3.串口参数初始化：USART_Init();4.串口使能：USART_C…

阅读更多...

SpringBoot相比于Spring的优点（自动配置和依赖管理）

SpringBoot相比于Spring的优点（自动配置和依赖管理）

自动配置例子见真章我们先看一下我们Spring整合Druid的过程，以及我们使用SpringBoot整合Druid的过程我们就知道我们SpringBoot的好处了。 Spring方式 Spring方式分为两种，第一种就是我们使用xml进行整合，第二种就是使用我们注解进行简化…

阅读更多...

RedissonCach的源码流程

RedissonCach的源码流程

上： https://blog.csdn.net/Michelle_Zhong/article/details/126384566 中： https://blog.csdn.net/michelle_zhong/category_11874153.html 下： https://blog.csdn.net/Michelle_Zhong/article/details/126391915?ops_request_misc%257B%…

阅读更多...

AAOS CarMediaService 问题分析

AAOS CarMediaService 问题分析

文章目录问题描述车载蓝牙音乐流程Music 监听焦点变化流程BT请求焦点的流程MediaSession 服务端的流程BT和music 之间的相互影响问题描述问题 AAOS界面连接蓝牙的情况下，Music应用播放音乐会暂停。分析暂停是应用的行为，Music应用会监听focus的变化…

阅读更多...

GE IS420UCSBH1A 控制器模块

GE IS420UCSBH1A 控制器模块

控制器模块是工业自动化和控制系统中的关键组件，用于监测、控制和管理各种工程过程。这些模块通常具有以下特点： 多通道控制： 控制器模块通常可以控制多个通道，允许同时管理多个设备或过程。实时控制： 模块支持实时控…

阅读更多...

docker 启动简单的开发环境（mysql, redis, etcd）

docker 启动简单的开发环境（mysql, redis, etcd）

docker开启容器分为两种，一种是命令启动，一种是用yaml启动本片文章用到的是yaml启动以下是启动脚本：env.yaml version: "3" services:jump_etcd:container_name: jump_etcdimage: bitnami/etcd:3privileged: truevolumes:- &q…

阅读更多...

判读文本编码是否为UTF8

判读文本编码是否为UTF8

（----转载-----，忘记出处了抱歉） private bool IsUtf8(byte[] buff) { for (int i 0; i < buff.Length; i) { if ((buff[i] & 0xE0) 0xC0) // 110x xxxx 10xx xxxx …

阅读更多...

使用NVIDIA GPU FFmpeg转码 YUV to H264（成功）

使用NVIDIA GPU FFmpeg转码 YUV to H264（成功）

0. 官方教程 NVIDIA官方教程：链接，本篇内容主要参考2.2 Software Setup。 1. 安装显卡驱动确保nvidia-smi能够正常使用： 2. 安装CUDA toolkit 注意要与显卡驱动版本对应，验证toolkit是否正确安装： 3. 安装ffnvco…

阅读更多...

Pytorch detach()方法

Pytorch detach()方法

detach() 是 PyTorch 中的一个方法，用于从计算图中分离（detach）张量。它可以将一个张量从当前计算图中分离出来，返回一个新的张量，该张量与原始张量共享相同的底层数据，但不再追踪梯度信息。当你需要在计…

阅读更多...

代码版本控制工具GitLab ：从安装到使用一步到位

代码版本控制工具GitLab ：从安装到使用一步到位

一、GitLab 是什么？ 如果听说过 Git 或者 GitHub，那么 GitLab 你一定也听说过。GitLab 是一个用于仓库管理系统的开源项目，使用 Git 作为代码管理工具，并在此基础上搭建起来的 Web 服务。简单理解：GitLab 类似私人版 …

阅读更多...

ssm框架

ssm框架

SSM框架是一个用于构建Java Web应用程序的集成框架，它由三个关键组件组成，分别是Spring、Spring MVC、和MyBatis，这三个组件的作用如下： Spring（Spring Framework）：Spring是一个轻量级的开源框架…

阅读更多...

计算机毕业设计选题推荐-社区志愿者服务微信小程序/安卓APP-项目实战

计算机毕业设计选题推荐-社区志愿者服务微信小程序/安卓APP-项目实战

✨作者主页：IT毕设梦工厂✨ 个人简介：曾从事计算机专业培训教学，擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Py…

阅读更多...

Transformers实战（二）快速入门文本相似度、检索式对话机器人

Transformers实战（二）快速入门文本相似度、检索式对话机器人

Transformers实战（二）快速入门文本相似度、检索式对话机器人 1、文本相似度 1.1 文本相似度简介文本匹配是一个较为宽泛的概念，基本上只要涉及到两段文本之间关系的，都可以被看作是一种文本匹配的任务， 只是在具体…

阅读更多...

最新文章