【西瓜书】2.模型评估与选择

1.经验误差与过拟合

(1)错误率、精度

(2)误差:训练误差/经验误差、泛化误差

(3)过拟合、欠拟合

        欠拟合好克服,过拟合无法彻底避免

2.三大任务——评估方法

        泛化误差的评估方法,即将测试误差作为泛化误差的近似

        注意:测试样本不要出现在训练集中

对于一个数据集,划分为训练集和测试集,方法如下:

(1)留出法:

  • 分层采样(保留类别比例)
  • 划分不同结果差别很大,所以随机划分若干次如100次,每次获得一个测试评估结果,取100次的平均值。
  • 划分比例:若训练集大,评估结果稳定性差;若测试集大,评估结果的保真性差。一般留出1/5~3/1用于测试。

(2)交叉验证法:

  • 数据集划分为k组,每组用k-1个子集训练,剩余1个子集进行测试,也就是每个子集都被作为过k-1次训练集,作为过1次测试集,得到k个测试结果,返回均值。叫做K折交叉验证
  • k的取值决定了评估的稳定性和保真性
  • 不同的划分重复p次,取p次k折交叉验证结果的均值
  • 特例:若数据集中有m个样例,当k=m则称为留一法
    • 不受随机样本划分方式影响,且评估结果往往比较准确(注意是往往,但没有免费的午餐 )
    • 当数据集较大时,训练开销太大

(3)自助法:

  • 有放回的采样:有放回的采样m个样本放入D‘,有些样本可能在D'中出现多次,D'作为训练集。而约有36.8%的样本没在D'中出现过,这些样本作为测试集。
  • 适用于数据集小难以划分的情况。
  • 会引入估计偏差,如果数据量足够还是使用留出法和交叉验证法好一些。

(4)调参与最终模型

  • 参数:算法参数(超参数)、模型参数(如迭代次数)
  • 参数选择:选择范围和步长,得到的不是最优的
  • 1.模型评估:从训练集中划分验证集;2.实际使用:测试集
    • 验证集:​​​​​​​进行超参数调优(如学习率、批次大小、迭代次数等)、模型选择(例如,选择神经网络中的层数和神经元数量)
    • 测试集:评估最终模型的性能,确保模型在未知数据上的泛化能力

3.三大任务——性能度量

        性能度量是评估模型泛化能力的标准

3.1.回归任务:均方误差

3.2.分类任务:错误率与精度(关心查的有几个是对的)

3.3.分类任务:查准率/准确率、查全率/召回率 (关心查出来的有多少比例是好的)

4.三大任务——比较检验 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/23530.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32F103VE和STM32F407VE的引脚布局

STM32F103VE vs STM32F407VE 引脚对比表 引脚 STM32F103VE STM32F407VE 备注 1 VSS VSS 地 2 VDD VDD 电源 3 VSSA VSSA 模拟地 4 VDDA VDDA 模拟电源 5 OSC_IN OSC_IN 外部时钟输入 6 OSC_OUT OSC_OUT 外部时钟输出 7 NRST NRST 复位 8 PC13 (GPIO) PC13 (GPIO) GPIO 9 PC14 (…

如何永久擦除Android手机中的所有个人数据?

在这个数字化的时代,确保您的个人数据的安全和隐私至关重要。如果您计划出售或回收您的Android手机,了解如何正确擦除Android手机是至关重要的。本综合指南将引导您通过安全擦除Android手机的分步过程,以保护您的敏感信息。 手机是极其敏感的…

反转链表的三种方法--面试必考(图例超详细解析,小白一看就会!!!)

目录 一、前言 二、题目描述 三、解题方法 ⭐ 头插法 --- 创建新的链表 ⭐ 迭代法 --- 三指针 ⭐ 递归法 四、总结与提炼 五、共勉 一、前言 反转链表这道题,可以说是--链表专题--,最经典的一道题,也是在面试中频率最高的一道题目&…

编译 TMS320F2838x 项目

编译 tms320f28388 项目,并生成 hex 文件 介绍 C2000Ware 目录 archive 架构 boards 基于官方开发板的例子 device_support 官方驱动,建立工程重点要用到的东西(基于寄存器变量访问) docs 说明文档 driverlib 官方的驱动…

找好看的简历模板,就上这6个网站。

找好看的简历模板就上这6个网站,免费下载! 1、菜鸟图库 个人简历模板|WORD文档模板免费下载 - 菜鸟图库 站内有超多办公类素材,PPT、world、excel模板都能找到,简历模板有非常详细的分类,风格类型也很多,想…

数据库MongoDB详解

文章目录 入门指南1. 安装 MongoDB2. 启动 MongoDB 服务3. 连接到 MongoDB4. 创建数据库和集合5. CRUD 操作6. 索引7. 备份与恢复 不同场景下的应用方式:应用案例展示 入门指南 MongoDB 是一个基于分布式文件存储的非关系型数据库(NoSQL)&am…

Linux “ 软件管理 “

软件管理 widows 安装 方法一: 双击exe安装包,就可以安装。 用exe安装的软件会破记录到注册表中。 注册会记录安装位置,软件名称。 方法二: 用绿色方式进行安装。 不用写到注册表中,因此无法在开始菜单里面查看和卸…

AppInventor2有没有删除后的撤销功能?

问:不小心删除了组件,能撤回吗? 答:界面(组件)设计界面,没有撤销功能。代码(逻辑)设计视图,可以使用 CtrlZ 撤销,CtrlY 反撤销。 界面设计没有撤…

AIGC绘画设计——midjourney有哪些好用的关键词?

midjourney有哪些高级关键词? 这一期继续分享一些高级的关键词, 我有一些案例也是从其他博主那学习来的, 但为了尽可能不出错,每个案例都是自己尝试了很多次后才拿出来的。 挑选了几个效果比较好,使用场景较高的类型…

Odoo:全球用户规模最大的免费开源ERP,使用前必须关注的事项

在数字经济时代,使用企业资源规划 (ERP) 工具管理业务是优化绩效和获得最佳结果的必要条件。 Odoo作为世界上最受欢迎的免费开源企业管理软件,已成功服务全球超过1200万以上的企业用户规模,开源智造作为Odoo亚太地区的金牌服务机构&#xff…

【Mybatis】INSERT INTO 遇到NULL怎么处理?

目录标题 背景-使用Mybatis手写批量插入Insert方法测试核心代码,author字段为null,插入条件怎么写? MybatisPlus解决方案自动填充字段 Mybatis解决方案if标签处理 问题:如果不在工程里面设置默认值?如何直接使用数据库…

26-unittest之装饰器(@classmethod)

unittest中的setUp可以在每个测试方法运行前执行,有效的减少了代码量。但有个弊端,比如打开浏览器操作,执行每个测试方法前都要重新打开一次,这样就会浪费很多时间。 是否可以只打开一次浏览器,执行完所有的测试方法后…

Springboot jar运行时,将jar内的文件拷贝到文件系统中

背景 因为执行需要,需要把jar内templates文件夹下的的文件夹及文件加压到宿主机器的某个路径下, 以便执行对应的脚本文件 PS: 通过类加载器等方式,直接getFile遍历文件,在idea中运行是没问题的,但是当打包成jar运行就会…

金融科技重塑跨境支付:创新引领全球支付新纪元

一、引言 随着全球化的加速和科技的飞速发展,跨境支付作为国际贸易的“血脉”,正经历着前所未有的变革。金融科技以其强大的创新能力和技术支撑,正在重塑跨境支付领域的格局,推动全球支付行业向更加高效、安全、便捷的方向发展。本文将深入探讨金融科技如何引领跨境支付的创…

【Mongodb】Mongodb亿级数据性能测试和压测

一,mongodb数据性能测试 如需转载,请标明出处:https://zhenghuisheng.blog.csdn.net/article/details/139505973 mongodb数据性能测试 一,mongodb数据性能测试1,mongodb数据库创建和索引设置2,线程池批量…

React+TS前台项目实战(一)-- 项目初始化配置及开此系列的初衷

文章目录 前言一、初始化项目二、基础配置1. 项目目录及说明如下2. TS版本使用Craco需注意 总结 前言 前面 后台管理系统实战 系列教程暂时告一段落了,想了解全局各种配置的可自行查看。本次教程将重点介绍React前台项目的实操,关于具体的配置&#xff…

龙迅LT8712X TYPE-C或者DP转HDMI加VGA输出,内置MCU,只是IIS以及4K60HZ分辨率

龙迅LT8712X描述: LT8712X是一种高性能的Type-C/DP1.2到HDMI2.0和VGA转换器,设计用于将USB Type-C源或DP1.2源连接到HDMI2.0和VGA接收器。LT8712X集成了一个DP1.2兼容的接收器,一个HDMI2.0兼容的发射机和一个高速三角机窝视频DAC。此外&…

Python 可变长参数的魔法:灵活函数设计的秘密

哈喽,大家好,我是木头左! 什么是可变长参数? 在 Python 中,可变长参数允许你向函数传入任意数量的参数,而无需预先定义它们的个数。这为编写更加灵活和通用的函数提供了可能。可变长参数主要有两种形式&am…

记录某书请求返回406及响应{“code“:-1,“success“:false}

今天测试某个平台的爬虫时使用requests post请求正常写了个测试脚本把各种参数带上出来以后出现了406情况,和网站数据是完全一样的 以为是 X-S、X-T参接不对,但在postman里测试又是可以的成功,以为是检验了参数顺序,测试发现也没…

JavaSE基础语法合集

随着不断学习,我们已经走完了JavaSE基础语法的所有内容,博主的单独语法篇共十二篇,感兴趣的也可以去看看,内容基本一致,目录是重新排布的,数组和方法都在初识Java章节。 适合:老手复习和新手从零…