迁移学习 领域自适应

迁移学习

什么是迁移学习

迁移学习是机器学习领域用于标记数据难获取这一基础问题的重要手段,

将训练好的内容应用到新的任务上被称为迁移学习。

由于这个过程发生在两个领域间,已有的知识和数据也就是被迁移的对象被称为源域,被赋予经验的领域被称为目标域。

迁移学习不是具体的模型,而是解题思路。

核心思想

找到不同任务之间的相关性。不要找相关性不高的数据集(负迁移)。

使用迁移学习的原因

  1. 目标领域的数据太少,需要标注数据更多的源域的帮助。
  2. 节约训练时间。
  3. 为了实现个性化的应用。

常见应用场景

  1. 语料匮乏的小语种之间的翻译
  2. 缺乏标注的医疗影像数据识别
  3. 面向不同领域快速部署对话系统

        在大规模数据集上训练好的模型就称作是预训练模型,这种模型通常都具有很好的泛化能力,可以在它的基础上完成各种各样的任务。使用预训练模型的好处就是它可以帮我们去减少训练时间以及计算资源。

学习策略

  1. 人家训练好的权重参数当做初始化
  2. 人家训练好的直接拿过来当做我的权重参数,不进行训练

学习策略选择

数据量比较少的时候,一万多不到。数据量越少,越需要借助人家训练好的模型。当数据量越少的时候,需要冻住的层数是越多的。

数据量稍微中一点,不多也不少,可以只冻住前面这一部分,后面的自己训练。

数据量比较大的时候,需要冻住的更少。

总之,具体冻住模型的多少层,没有固定的答案,基本上是根据自己的数据量来的。你觉得数据量比较少,怕出现过拟合,怕出现问题,最好还是用人家训练好的结果。数据量比较多,我的任务跟人家的任务差异其实还很大,那尽可能只做初始化而不冻住这些层。

迁移学习特点

学习的非常快。

比如说A和B同学考试,把A做完的卷子给B,B只需要检查一遍卷子就可以交卷了。

迁移学习的时候,拿过来的网络模型权重参数通常情况下都是大家公认的,训练的比较好的参数,不是随便整出来的,都是经过大量的测试得到的结果。

迁移学习方法分类

 迁移学习研究领域与方法分类

同构:特征维度一样

异构:特征维度不一样,比如图片到文本

贯穿同构和异构的方法有监督迁移学习、半监督迁移学习、无监督迁移学习。

领域自适应属于同构迁移学习

领域自适应

什么是领域自适应

英文名:Domain Adaptation(DA)

相关的概念:cross-domain learning(同构迁移学习)

问题定义:有标签的源于和无标签的目标域共享相同的特征和类别,但是特征分布不同,如何利用源域标定目标域。

领域自适应实际上是源域目标域特征分布不一样,但是特征维度是一样的。

领域自适应问题分类

按照目标域有无标签

  • 目标域全部有标签:supervised DA 全监督领域自适应
  • 目标域有一些标签:semi-supervised DA 半监督领域自适应
  • 目标域全没有标签:unsupervised DA

Unsupervised DA最有挑战性,是我们的关注点。

        在域适应中,通常将有监督的训练域称为源域,半监督或无监督的训练域称为目标域。根据目标域标签数据,域适应分为半监督域适应,无监督域适应和其他域适应。基于域知识迁移层面,可将域适应分为3类:基于实例加权的域适应方法、基于特征的域适应方法以及基于模型的域适应方法。具体而言,基于实例加权的域适应是通过调整源域样本和类间权重以减小源域与目标域之间分布差异的;基于特征的域适应则利用新的特征表示空间的方式来拉近域之间的特征分布距离;基于模型的域适应,对源域模型只是迁移利用,以实现领域之间的对齐。

        换一种解释:通过在不同阶段进行领域自适应,研究者提出了三种不同的领域自适应方法:1)样本自适应,对源域样本进行加权重采样,从而逼近目标域的分布。2)特征层面自适应,将源域和目标域投影到公共特征子空间。3)模型层面自适应,对源域误差函数进行修改,考虑目标域的误差。

李宏毅讲解领域自适应

Domain shift:一旦训练资料和测试资料之间有一些差异, 它们中间的分布是不一样的,在训练资料上训练出来的模型在测试资料上可能就会坏掉。

领域自适应可以看做是迁移学习的一种,迁移学习就是你在A任务上学到的技能可以被用在B任务上。对于Domain adaptation来说,你的训练资料是一个Domain,你的测试资料是另外一个Damain。你在训练资料Domain上学到的资讯,要把它用到另外一个测试资料Domain上。

最基础的想法

        找到一个feature extractor,实际上是一个network,吃入一张图片,吐出一个feature。

        虽然source domain和target domain表面上看起来不一样,但是feature extractor会把他们不一样的部分拿掉,只抽取出它们共同的部分。虽然从图片看起来这两组图片一个有颜色,一个没有颜色,本来就不一样,但是期待地说这个feature extractor可以学到无视颜色这个事情,把颜色的资讯过滤掉。所以今天不管来自source domain的图片还是来自target domain的图片,只要通过这个feature extractor以后得到的feature看起来是没有差异的。

        这样就可以用source domain的这些feature训练一个模型,直接用在target domain上。接下来是怎么找出一个feature extractor。其实可以把一般的Classifier就分成feature extractor和label predictor两个部分,我们知道一个image的Classifier就是输入一张Image 得到Output就是分类的结果。假设Image Classifier有10层,那么前5层是Feature Extractor,后5层是Label Predictore。如果你上CNN的话,它的输出其实是Feature Map,但Feature Map拉直后就可以看做是一个Factor。再丢到Label Predictore的后面5层会产生class。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/706090.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

防火墙的内容安全

目录 1. 内容安全 1.1 IAE引擎 DPI---深度包检测技术 DFI---深度流检测技术 结论(优缺点): 1.2 入侵防御(检测)(IPS) IPS的优势: 入侵检测的方法: 入侵检测的流程 签名 查看预定义签名的内容 新建自定义签名 入侵防御的检测…

热闹元宵进行中,如何利用VR全景展示民宿品牌形象?

错峰出游闹元宵,元宵节恰逢周末,而且还是春节假期返工之后的首个休息日,不少人都想通过短途度假来缓解“节后综合征”。两位数的特价机票、打折的各种酒店让你实现“旅行自由”,那么如何知道特价酒店服务好不好呢?先别…

对于大前端开发来说,转鸿蒙开发究竟是福还是祸?

从铺天盖地的市场消息来看,华为即将面世的鸿蒙NEXT系统已经势不可挡了 想必大家都已经迫不及待地想要进行尝试。 估计大家都有着同样的疑问: 会不会是下一个风口?转鸿蒙应用开发难吗? 会不会是下一个风口? 自从鸿蒙…

江科大stm32 定时器 TIM输出比较--学习笔记

这几天遇到输出比较相关的问题,于是来学习下TIM输出比较部分知识点! 输出比较简介 CNT是计数器的值,CCR寄存器是捕获/ 比较寄存器 简单的讲,输出比较就是用来输出PWM波形。 PWM简介 占空比:高电平占一个周期的比例。…

搜索算法(算法竞赛、蓝桥杯)--双向BFS字串变换

1、B站视频链接&#xff1a;B19 双向BFS 字串变换_哔哩哔哩_bilibili 题目链接&#xff1a;[NOIP2002 提高组] 字串变换 - 洛谷 #include <iostream> #include <queue> #include <unordered_map> using namespace std;const int N7; int n; string A,B,a[N]…

opencascade c#例程解析

1.编译 将msvc.bat文件拖入vs2022的x64 native tools&#xff0c;即可 2.about.xaml <Windowxmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http://schemas.microsoft.com/winfx/2006/xaml"x:Class"IE_WPF_WinForms…

前后端项目-part03

文章目录 5.4.4 机构名称5.4.4.1 创建实体类Company5.4.4.2 创建实体类CompanyMapper5.4.4.3 创建实体类CompanyService5.4.4.4 创建实体类CompanyController5.4.4.5 后端测试5.4.4.6 修改basic.js5.4.4.7 修改course.vue5.4.4.8 测试5.4.5 课程标签5.4.5.1 效果5.4.5.2 修改co…

后台管理系统: 权限管理

权限管理 角色:一家企业而言&#xff1a;BOSS、运维、销售、程序员 权限:超级管理员&#xff08;BOSS&#xff09;&#xff0c;是有权利操作整个项目的所有的模块 test&#xff08;新媒体&#xff09;&#xff0c;只能首页、商品管理者一部分菜单数据 admin&#xff1a;…

ClickHouse 指南(三)最佳实践 -- 主键稀疏索引

在ClickHouse主索引的实用介绍 ClickHouse release 24.1, 2024-01-30 1、简介 在本指南中&#xff0c;我们将深入研究ClickHouse索引。我们将详细说明和讨论: ClickHouse中的索引与传统的关系数据库管理系统有何不同ClickHouse是如何构建和使用表的稀疏主索引的什么是在Clic…

Curator基本使用

文章目录 1. 基本操作1.1 建立连接1.2 创建结点1.3 查询结点查询数据查询子结点查看结点信息 1.4 修改结点普通修改带乐观锁的修改 1.5 删除删除单个结点删除带子结点的结点必须成功的删除带回调函数的删除 2. 监听器事件2.1 NodeCache单一结点连续监听2.2 PathChildrenCache监…

nginx平滑升级,信号使用,分割日志

信号 kill -l 看信号大全 nginx -h 中可以看到的信号较少 s signal : send signal to a master process: stop, quit, reopen, reload 可以使用man手册来查看详细的信号 如果没安装&#xff0c;去源码包里找到man文件 man 路径/nginx.8 不加路径打不开man帮助 st…

docker小知识:linux环境安装docker

安装必要软件包&#xff0c;执行如下命令 yum install -y yum-utils device-mapper-persistent-data lvm2目的是确保在安装 Docker 之前&#xff0c;系统已经安装了必要的软件包和服务&#xff0c;以支持 Docker 的正常运行。设置yum源&#xff0c;添加Docker官方的CentOS存储…

对Redis锁延期的一些讨论与思考

上一篇文章提到使用针对不同的业务场景如何合理使用Redis分布式锁&#xff0c;并引入了一个新的问题 若定义锁的过期时间是10s&#xff0c;此时A线程获取了锁然后执行业务代码&#xff0c;但是业务代码消耗时间花费了15s。这就会导致A线程还没有执行完业务代码&#xff0c;A线程…

vscode与vue/react环境配置

一、下载并安装VScode 安装VScode 官网下载 二、配置node.js环境 安装node.js 官网下载 会自动配置环境变量和安装npm包(npm的作用就是对Node.js依赖的包进行管理)&#xff0c;此时可以执行 node -v 和 npm -v 分别查看node和npm的版本号&#xff1a; 配置系统变量 因为在执…

机器学习:朴素贝叶斯算法(Python)

一、朴素贝叶斯算法的实现 naive_bayes_classifier.py import numpy as np import collections as cc # 集合的计数功能 from scipy.stats import norm # 极大似然估计样本的均值和标准方差 from data_bin_wrapper import DataBinsWrapperclass NaiveBayesClassifier:"…

Python分支和循环结构及其应用(文末送书)

一、分支结构 应用场景 我们写的Python代码都是一条一条语句顺序执行&#xff0c;这种代码结构通常称之为顺序结构。然而仅有顺序结构并不能解决所有的问题。 if语句的使用 在Python中&#xff0c;要构造分支结构可以使用if、elif和else关键字。所谓关键字就是有特殊含义的…

SpringCloud(17)之SpringCloud Stream

一、Spring Cloud Stream介绍 Spring Cloud Stream是一个框架&#xff0c;用于构建与共享消息系统连接的高度可扩展的事件驱动微服务。该框架提供了一个灵活的编程模型&#xff0c;该模型建立在已经建立和熟悉的Spring习惯用法和最佳实践之上&#xff0c;包括对持久发布/子语义…

腾讯云4核8G服务器优惠价格表(轻量+CVM)

腾讯云4核8G服务器多少钱&#xff1f;轻量应用服务器4核8G12M带宽一年446元、646元15个月&#xff0c;云服务器CVM标准型S5实例4核8G配置价格15个月1437.3元&#xff0c;5年6490.44元&#xff0c;标准型SA2服务器1444.8元一年&#xff0c;在txy.wiki可以查询详细配置和精准报价…

ChatGPT带火的HBM是什么?

“ChatGPT是人工智能领域的iPhone时刻&#xff0c;也是计算领域有史以来最伟大的技术之一。” 英伟达创始人兼CEO黄仁勋此前这样盛赞ChatGPT。 ChatGPT突然爆火&#xff0c;对大算力芯片提出了更高更多的要求。近日&#xff0c;据韩国经济日报报道&#xff0c;受惠于ChatGPT&am…

[rust] 10 project, crate, mod, pub, use: 项目目录层级组织, 概念和实战

文章目录 一 项目目录层级组织概念1.1 cargo new 创建同名 的 Project 和 crate1.2 多 crate 的 package1.3 mod 模块1.3.1 创建嵌套 mod1.3.2 mod 树1.3.3 用路径引用 mod1.3.3.1 使用绝对还是相对? 1.3.4 代码可见性1.3.4.1 pub 关键字1.3.4.2 用 super 引用 mod1.3.4.3 用 …