吴恩达deeplearning.ai:模型选择交叉验证测试集的训练方法

以下内容有任何不理解可以翻看我之前的博客哦:吴恩达deeplearning.ai专栏
在上一节中,我们了解了如何利用测试集来评估模型性能。今天我们来进一步完善这个想法,让你使用该技术自动选择一个更好的模型。

文章目录

  • 模型选择
  • 交叉验证 Cross Validation
  • 交叉验证例子之手写识别


模型选择

上一节我们了解到,当你的模型很好地拟合训练集的时候,训练集的代价函数就不能很好地表示模型准确度(因为其代价函数基本为0),这将远远低于泛化误差(在新数据上的误差)。在此时,测试集的代价函数就比训练集的代价函数能够更好地反映模型的准确程度了。那么我们该如何利用测试集来选择更好的模型嘞。
在这里插入图片描述
以上是十个不同特征数量的模型,我们如何从中选择一个合适的模型呢?我们可以依次用这十个模型对数据进行拟合并计算出 J t e s t J_{test} Jtest,通过J的大小来判断谁的效果更好。
例如你在测试完这十个模型后,发现 d = 5 d=5 d=5时, J ( w [ 5 ] , b [ 5 ] ) J(w^{[5]},b^{[5]}) J(w[5],b[5])的值为最小,那么你可能会认为模型5的效果是最好的。
但是事实上,我们所测得的J可能是一种乐观的估计,它可能比真实的J要小些,原因是我们忽略了另一个变参数,就是d的大小。有可能就是恰好这个测试集的数据分布离d=5的函数比较近一些,无法排除偶然性。这个我觉得其实乍一看挺难理解的。可以做一个类比,测试集上的d就类似于训练集上的w和b,它们都是通过各自的数据集所选出来的,所以不能在各自的数据集上进行验证。因此在选择模型的时候,并不能采用这种方法。

交叉验证 Cross Validation

以上问题的解决方法是,将数据分为三个不同的子集,分别是训练集,交叉验证集(也可叫做验证集、开发集 dev set),以及测试集。
在这里插入图片描述
如上图,我们将数据集的60%设置为训练集,20%设置为交叉验证集,剩下20%为测试集。
我们使用以下三个数学公式分别计算其代价函数:
训练集误差:
J t r a i n ( w , b ) = 1 2 m t r a i n [ ∑ ( f − y ) 2 ] J_{train}(w,b)=\frac{1}{2m_{train}}[\sum (f-y)^2] Jtrain(w,b)=2mtrain1[(fy)2]
交叉验证集误差:
J c v ( w , b ) = 1 2 m c v [ ∑ ( f − y ) 2 ] J_{cv}(w,b)=\frac{1}{2m_{cv}}[\sum (f-y)^2] Jcv(w,b)=2mcv1[(fy)2]
测试集误差:
J t e s t ( w , b ) = 1 2 m t e s t [ ∑ ( f − y ) 2 ] J_{test}(w,b)=\frac{1}{2m_{test}}[\sum (f-y)^2] Jtest(w,b)=2mtest1[(fy)2]
如此,在上面那个例子中,模型选择的方法是这样的:首先在训练集训练从而找到合适的w,b;然后在交叉验证集上测试不同的d谁的价值函数最小,最后,在测试集上测试代价最小的d的模型的泛化能力。

交叉验证例子之手写识别

交叉验证集同样也可以用于别的模型,例如我们之前了解的手写识别。
在这里插入图片描述
例如你有三个神经网络模型架构,你想从中选择效果最好的模型。那么步骤仍然和以前一样,先在训练集上得出参数w,b,然后在交叉验证集上获得代价函数最小的架构,再在测试集上证明其泛化能力。这样的步骤可以确保好的效果不是因为数据所造成的偶然结果。
为了给读者你造成不必要的麻烦,博主的所有视频都没开仅粉丝可见,如果想要阅读我的其他博客,可以点个小小的关注哦。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/713826.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot 框架(上)

SpringBoot SpringBoot概述依赖管理自动配置SpringBoot 注解使用ConfigurationImport(value {Cat.class,Dog.class})ImportResource(locations "classpath:beans.xml") yaml 标记语言概述基本语法数据类型字面量对象数组 使用细节 Rest 风格请求处理概述注意事项 接…

vue2 开发记录

el-select 如何修改选择项的样式/el-select-dropdown__item 文字上下显示 测试代码 <div stylemargin-left: 100px><!-- 测试代码--><el-select filterablesizemini><div classxxx-el-select><el-optionv-foritem in [{key:1,des:2,…

AVT Prosilica GC Vision Cameras 相机视觉说明使用安装。具体详情内容可参看PDF目录内容。

AVT Prosilica GC Vision Cameras 相机视觉说明使用安装。具体详情内容可参看PDF目录内容。

TikTok矩阵系统功能怎么写?常用源代码是什么?

TikTok矩阵系统的功能是如何编写的?又有哪些常用的源代码支撑这些功能呢?本文将通过五段源代码的分享&#xff0c;为大家揭开TikTok矩阵系统的神秘面纱。 一、TikTok矩阵系统的核心功能 TikTok的矩阵系统涵盖了多个核心功能&#xff0c;包括但不限于用户管理、内容分发、推…

【接口测试】HTTP协议介绍

目录 介绍 HTTP状态码 HTTP报文 请求方法 HTTP版本 HTTP标头 通用标头 请求标头 响应标头 get 编码 post 编码 RESTful风格 HTTPS 绝大多数的Web服务接口都是基于HTTP协议进行通信的&#xff0c;包括RESTful API和SOAP等。了解HTTP协议可以帮助测试人员理解接口的…

回溯算法题单✨✨✨

力扣&#xff1a; 78. 子集 - 力扣&#xff08;LeetCode&#xff09; 216. 组合总和 III - 力扣&#xff08;LeetCode&#xff09; LCR 080. 组合 - 力扣&#xff08;LeetCode&#xff09; LCR 082. 组合总和 II - 力扣&#xff08;LeetCode&#xff09; LCR 083. 全排列…

【多线程】CAS详解

目录 &#x1f334;什么是 CAS&#x1f338;CAS 伪代码 &#x1f38d;CAS 是怎么实现的&#x1f340;CAS 有哪些应⽤&#x1f338;实现原子类&#x1f338;实现自旋锁 &#x1f333;CAS 的 ABA 问题&#x1f338;**什么是 ABA 问题**&#xff1f;&#x1f338;ABA 问题引来的 B…

【C++】核心编程--函数高级

文章目录 1. 函数的默认参数2. 函数占位参数3. 函数重载4. 注意事项 1. 函数的默认参数 在C中&#xff0c;函数的形参列表中的形参是可以有默认值的 //语法&#xff1a; 返回值类型 函数名 (参数 默认值){} #include<iostream> using namespace std; //函数默认参数 //如…

异常值检测-3σ法提交 代码注释

背景信息里面都给了相应的答案&#xff0c;但我们可以多了解一下代码的含义&#xff0c;而不是简单的复制粘贴 import pandas as pd import matplotlib.pyplot as plt from scipy import stats import numpy as npdata pd.read_csv("src/death.csv", index_colUnna…

ASPICE实操中的那点事儿-如何避免重复性测试

写在前面 ASPICE理解起来容易&#xff0c;毕竟是有条有理的。但实操起来&#xff0c;尤其是把ASPICE各过程域做全的时候&#xff0c;会遇到各种各样的问题&#xff08;不是技术问题有多难&#xff0c;而是该如何做选择&#xff0c;如何既能符合ASPICE要求&#xff0c;保证过程质…

智慧城市建设的新里程碑:公共服务电子支付大屏

随着科技的飞速发展&#xff0c;我们的生活正在经历前所未有的变革。电子支付的出现&#xff0c;无疑是这场变革中的一大亮点&#xff0c;它不仅改变了我们日常的支付方式&#xff0c;更成为智慧城市建设的重要一环&#xff0c;为公众提供了更加便捷、高效的服务体验。 在以前&…

python SHP2COCO

1. 将shp的标签数据转成coco # -*- coding: utf-8 -*- import os, json import cv2 from osgeo import gdal import numpy as np from osgeo import ogr, gdal, osr from shapely.geometry import box, shape from shapely.geometry.polygon import Polygon import collection…

Flutter 的状态管理

状态提升&#xff08;Lifting-state-up&#xff09; 把子组件的状态&#xff0c;提升到上级组件中&#xff0c;从而实现在多个组件之间共享和同步数据的效果 以 flutter counter demo&#xff0c;那个按按钮1 的来说&#xff0c;现在的 count 是几&#xff0c;不是存在页面显…

政府采购标书制作的要点解析

导语&#xff1a;政府采购是政府为满足公共利益&#xff0c;按照法定程序和标准&#xff0c;通过招标、竞争性谈判等方式&#xff0c;购买商品、工程和服务的行为。标书作为政府采购活动中的重要文件&#xff0c;其制作质量直接影响到项目的顺利进行。本文将围绕政府采购标书制…

二路归并排序的算法设计和复杂度分析and周记

数据结构实验报告 实验目的: 通过本次实验&#xff0c;了解算法复杂度的分析方法&#xff0c;掌握递归算法时间复杂度的递推计算过程。 实验内容&#xff1a; 二路归并排序的算法设计和复杂度分析 实验过程&#xff1a; 1.算法设计 第一步&#xff0c;首先要将数组进行…

【网站项目】314学生二手书籍交易平台

&#x1f64a;作者简介&#xff1a;拥有多年开发工作经验&#xff0c;分享技术代码帮助学生学习&#xff0c;独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。&#x1f339;赠送计算机毕业设计600个选题excel文件&#xff0c;帮助大学选题。赠送开题报告模板&#xff…

关于游戏公司组织架构的小讨论

过完年刚刚上班没几天&#xff0c;就有一件比较搞笑的事情&#xff0c;可以和大家分享一下。   某一天我们在公司的会议室开会&#xff0c;发现有非常多蚊子&#xff0c;于是找行政问能不能找专业人士来灭蚊。行政的答复是&#xff0c;专业灭蚊是有固定时间的&#xff0c;还要…

JVM相关面试题(2024大厂高频面试题系列)

一、JVM的组成 1、JVM由哪些部分组成&#xff0c;运行流程是什么&#xff1f; 回答&#xff1a;在JVM中共有四大部分&#xff0c;分别是Class Loader&#xff08;类加载器&#xff09;、Runtime Data Area&#xff08;运行时数据区&#xff0c;内存分区&#xff09;、Execut…

MyBatis的补充用法

说明&#xff1a;之前介绍过MyBatis的用法&#xff0c;像 用注解和Mapper.xml操作数据库、在Mapper.xml里写动态SQL。最近在一次用MyBatis批量更新数据库对象的场景中&#xff0c;意识到对MyBatis的一些标签用法不太熟悉&#xff0c;所以去 MyBatis官网 看了一些文档&#xff0…

php httpfs链接hdfs

一.代码&#xff08;有bug&#xff09; GitHub - michaelbutler/php-WebHDFS: A PHP client for WebHDFS 二.调用代码 1.代码1.代码 require_once(../webhdfs/src/org/apache/hadoop/WebHDFS.php);require_once(../webhdfs/src/org/apache/hadoop/tools/Curl.php); require_o…