深度学习 Lecture 6 学习曲线、高偏差和高方差的调整和误差分析过程

深度学习 Lecture 6 学习曲线、高偏差和高方差的调整和误差分析过程

news/2025/4/4 22:14:00/文章来源:https://blog.csdn.net/m0_47407301/article/details/137211774

一、学习曲线（Learning curves)

用处：帮助了解学习算法性能如何的方式

曲线随着经验的数量（算法所拥有的训练样本）发生的变化

PS: 随着训练样本的增大，交叉验证误差会越来越小，趋于平稳；而训练集的误差会越来越大，趋于平稳（因为模型很难去符合所有的样本）。

如果算法本身就是高偏差（训练集的误差大），那增加数据集也不会让偏差改变太多。所以在确定是否要增加数据集之前，要先看我们的算法是否有高偏差。

而如果我们的算法是有高方差（也就是训练集的误差低于我们所知的准线误差，而交叉验证误差要高于准线误差的情况），这个时候就是可以增加数据集了，因为函数过拟合。

综上：

高偏差：增加数据集的量可能没有用

高方差：增加数据集的量可能有用

所以一般在做实验的时候，假如我们的数据集有1000条数据，为了看我们是高偏差还是高方差，我们会选择先选取100条，或者200条数据，这样逐步递增，把学习曲线画出来，看看数据量的增加，J_cv 和J_train之间的关系，这样才能判断是高偏差还是高方差

二、高偏差和高方差的调整

解决高方差（过拟合）：
1. 增加训练集的数据样本
2. 尝试更少的特征
3. 尝试增加正则化参数的值

解决高偏差（欠拟合）：
1. 增加特征
2. 尝试多项式特征
3. 尝试减小正则化参数的值

但是实际上，我们可以通过训练神经网络来解决高偏差和高方差

当具有高偏差时，可以增加神经网络的层数和神经元数量来调整，直到高偏差消失。
此时，如果具有高方差，就可以通过正则化参数的调整来让高方差消失。这样就可以无脑训练出一个合适的模型。

三、误差分析过程（Error analysis process)

指人工检查算法出错的这些样本，对样本进行主题/属性的分类，找到是为什么让样本出错，针对性的去解决问题。比如算法可能是因为A、B 和C出错，那就要看哪种占比更大，因为解决占比更大的错误，才能让算法的效能提升更大。

数据增强：使用现有的数据，生成新的数据。（比如给了一张图片，可以把这种图片旋转、放大或改变对比度等方式来生成新的几张图片）

数据合成：从空白开始创造全新的例子，而不是对现有的例子进行修改

四、迁移学习（Transfer learning)

对于一个没有那么多数据的算法应用，迁移学习可以让你用来自不同任务的数据帮助你解决当前任务。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/784833.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

机器学习之决策树桩或决策残端(Decision Stump)

机器学习之决策树桩或决策残端(Decision Stump)

简介决策树是一种常见的机器学习模型，它由一个树状结构组成，每个节点代表一个特征属性的决策规则，而每个叶子节点代表一个类别标签或者是一个数值输出。决策树的每个节点都会根据一个特征属性进行划分，直到达到某个停止条件为止，例如节点中的样本数量小于某个阈值，或者…

阅读更多...

在rv1126上实现数字识别

在rv1126上实现数字识别

有个项目，需要用到识别数字。使用rv1126，实现数字的识别，如下图。效果上还是存在有些问题，但还是比较好的。 1.采用的数据集少 2.数据分布不一。0，1两个数据集内容多，5，6，7&am…

阅读更多...

webpack搭建开发环境

webpack搭建开发环境

webpack搭建开发环境一.webpack开发模式二.webpack打包模式三.webpack打包模式应用四.Webpack 前端注入环境变量五.Webpack 开发环境调错 source map六. Webpack 设置解析别名路径七.优化-CDN的使用八.多页面打包九.优化-分割公共代码一.webpack开发模式作用：启动 Web 服务…

阅读更多...

健身房预约管理系统(源码+文档)

健身房预约管理系统(源码+文档)

健身房预约管理系统（小程序、ios、安卓都可部署） 文件包含内容程序简要说明含有功能：项目截图客户端首页我的预约登录教练预约时间我的注册页个人资料课程预约课程预约管理端订单管理团课管理教练管理分类管理用户管理文件包含内容 1、搭建…

阅读更多...

Vue3性能优化之自定义指令实现图片懒加载

Vue3性能优化之自定义指令实现图片懒加载

图片懒加载是一种常见性能优化的方式，进入网址时不全部加载图片当用户进入图片可视区域时加载不仅大大减少了服务器的压力也可以时首屏时间变短图片懒加载的实现原理：在图片没进入可视区域的时候，只需要让 img 标签的 src 属性指向一张…

阅读更多...

【5G 接口协议】CU与DU之间的F1协议介绍

【5G 接口协议】CU与DU之间的F1协议介绍

博主未授权任何人或组织机构转载博主任何原创文章，感谢各位对原创的支持！ 博主链接本人就职于国际知名终端厂商，负责modem芯片研发。在5G早期负责终端数据业务层、核心网相关的开发工作，目前牵头6G算力网络技术标准研究。博客…

阅读更多...

从词表到RLHF一镜到底训练一个大模型

从词表到RLHF一镜到底训练一个大模型

第6章如何训练大语言模型本章节主要探讨训练大语言模型的步骤和方法论。目前，可能大家接触的最多的模型训练方式是微调，也能收到一定程度的比较好的效果，其中有代表性的项目有Github上的Alpaca, Baize,Vicuna等。 6.1 Pretrain 预训练有了微调，为什么还需要预训练，直…

阅读更多...

第116讲：使用Mycat-eye管理Mycat数据库服务

第116讲：使用Mycat-eye管理Mycat数据库服务

文章目录 1.Mycat的管理工具2.Mycat-eye介绍3.部署Mycat-eye3.1.安装Zookeep3.2.安装Mycat-eye3.3.访问Mycat-eye 4.在Mycat-eye中导入Mycat服务的信息 1.Mycat的管理工具 Mycat默认开通2个端口，可以在server.xml中进行修改。 8066 数据访问端口，即进行…

阅读更多...

管易云和金蝶云星空单据接口对接

管易云和金蝶云星空单据接口对接

管易云和金蝶云星空单据接口对接接入系统：金蝶云星空金蝶K/3Cloud结合当今先进管理理论和数十万家国内客户最佳应用实践，面向事业部制、多地点、多工厂等运营协同与管控型企业及集团公司，提供一个通用的ERP服务平台。K/3Cloud支持的协同应用…

阅读更多...

8.4 循环神经网络

8.4 循环神经网络

小结对隐状态使用循环计算的神经网络称为循环神经网络（RNN）。循环神经网络的隐状态可以捕获直到当前时间步序列的历史信息。循环神经网络模型的参数数量不会随着时间步的增加而增加。我们可以使用循环神经网络创建字符级语言模型。我们可以使用…

阅读更多...

条形图、柱状图的绘制方法

条形图、柱状图的绘制方法

【题目描述】用*号输出柱状图。第一行输入一个整数n表示数据个数，第二行输入n个整数，用空格隔开。n和输入的数都不超过20。【样例输入】 7 5 1 1 8 1 1 5 【样例输出】 1．条形图（水平柱状图） 样例中的柱状图属…

阅读更多...

Generative AI 新世界 | 扩散模型原理的代码实践之采样篇

Generative AI 新世界 | 扩散模型原理的代码实践之采样篇

前言本期文章，我们一起来探究生成式 AI 这一火热的新知识领域。目前计划有三个大方向： 代码深度实践方向。例如用代码完整诠释 Diffusion 模型的工作原理，或者 Transformer 的完整架构等； 模型部署和训练优化方向。例如尝试解…

阅读更多...

【LeetCode热题100】【数组】最大子数组和

【LeetCode热题100】【数组】最大子数组和

题目链接：53. 最大子数组和 - 力扣（LeetCode） 只要和的值不要哪个子数组，原问题的解由子问题的解组成，可以用动态规划，数组中每个元素都是一个子数组的结尾，dp[i]是以num[i]为结尾的最大子数组…

阅读更多...

Linux实战笔记(六) SSH

Linux实战笔记(六) SSH

大家好，我是半虹，这篇文章我们介绍一下 SSH 1、简介 SSH 全称 Secure Shell，本质上是建立在应用层之上的网络传输协议通过加密和认证机制保证传输安全，经常用于远程登录或者远程访问除此之外，SSH 也能完成端口转发…

阅读更多...

C++进阶篇10---特殊类设计

C++进阶篇10---特殊类设计

一、设计一个类，不能被拷贝有人可能会觉得，这不是很简单吗，直接把拷贝构造ban掉，不就行了，但事实真的如此吗？ class A { public:A(){}A(const A& tmp) delete;// ... };int main() {A a;// A b a;…

阅读更多...

Spring Boot集成itext实现html生成PDF功能

Spring Boot集成itext实现html生成PDF功能

1.itext介绍 iText是著名的开放源码的站点sourceforge一个项目，是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档，而且可以将XML、Html文件转化为PDF文件 iText 的特点以下是 iText 库的显着特点 − Interactive − iText 为你提供类（API）来生成…

阅读更多...

2.从hello world开始【go】

2.从hello world开始【go】

当然，我们可以从最基本的Hello World程序开始。Hello World程序通常是学习一门新编程语言的第一步，因为它能够帮助你理解基础的程序结构和编译过程下面是一个Go语言的Hello World程序示例： package mainimport "fmt"func main()…

阅读更多...

Leetcode 3101. Count Alternating Subarrays

Leetcode 3101. Count Alternating Subarrays

Leetcode 3101. Count Alternating Subarrays 1. 解题思路2. 代码实现题目链接：3101. Count Alternating Subarrays 1. 解题思路这一题我们只需要用贪婪算法对原数组进行切分，使得每一段都是最大的交错子序列，然后，我们要获得…

阅读更多...

关于Ansible的模块②

关于Ansible的模块②

转载说明：如果您喜欢这篇文章并打算转载它，请私信作者取得授权。感谢您喜爱本文，请文明转载，谢谢。接《关于Ansible的模块 ①-CSDN博客》，继续学习和梳理Ansible的常用文件类模块 1. copy模块从当前机器上复制文件到…

阅读更多...

论文复现１：Ｍobilealoha

论文复现１：Ｍobilealoha

abstract:从人类演示中进行的模仿学习在机器人技术中表现出了令人印象深刻的表现。然而，大多数结果都集中在桌面操作上，缺乏一般有用任务所需的移动性和灵活性。在这项工作中，我们开发了一种用于模仿双手且需要全身控制的移动操纵任务的系统。我们首先推出 Mobile ALOHA，这…

阅读更多...

最新文章