机器学习（2）

机器学习（2）

news/2025/7/16 7:42:45/文章来源:https://blog.csdn.net/m0_57715084/article/details/138758311

目录

2-1泛化能力

2-2过拟合和欠拟合

2-3三大问题

2-4评估方法

2-5调参和验证集

2-6性能度量

2-7比较检验

2-1泛化能力

如何进行模型评估与选择？

2-2过拟合和欠拟合

泛化误差：在“未来”样本上的误差

经验误差：在训练集上的误差，亦称“训练误差”‘

过拟合：把训练样本自身的一些特点当成了所有潜在样本都会具有的一般性质

欠拟合：对训练样本的一般性质尚未学好

在使用算法时问自己两个问题：

1.该算法如何解决overfitting？

2.在什么时候解决overfitting会失效？

2-3三大问题

三个关键问题：

如何获得测试结果？——>评估方法

如何评估性能评估？——>性能度量

如何判断实质差别？——>比较检验

2-4评估方法

关键：怎么获得“测试集”？

测试集应该与训练集互斥

常见方法：留出法；交叉验证法；自助法

留出法：

拥有的数据集一部分用于训练，一部分用于测试

k-交叉验证法：

若k=m，则得到“留一法”

自助法：

2-5调参和验证集

算法的参数：一般由人工设定，亦称“超参数”

模型的参数：一般由学习确定

区别：训练集vs测试集vs验证集

其实验证集就是训练集的一部分，只是训练集中一部分用于训练，留出一部分用于调参数，亦称为验证集

2-6性能度量

性能度量是衡量模型泛化能力的评价标准，反映了任务需求

使用不同的任务度量往往会导致不同的评判结果

什么模型是“好”的，不取决于算法和数据，还取决于任务需求

错误率：分类错误的样本数占样本总数的比例

精度：分类正确的样本数占样本总数的比例

TP:模型预测为真，实际为真

FN:模型预测为假，实际为真

FP:模型预测为真，实际为假

TN:模型预测为假，实际为假

一般来说，查准率和查全率是一对矛盾的度量

F1是基于查准率和查全率的调和平均定义的

在一些应用中对查准率和查全率的重视程度有所不同，例如在商品推荐系统中，更希望推荐的是用户感兴趣的内容，此时查准率比较重要；而在逃犯检索系统中，更希望抓到所有逃犯，因此，查全率更为重要。

2-7比较检验

有了实验评估方法和性能度量，看起来就能对学习器的性能进行评估比较了。但实际上机器学习中性能比较这件事比大家想的复杂得多。

统计假设检验为我们进行学习器性能比较提供了重要依据。基于假设检验结果我们可以推断出，若在测试集上观察到学习器A比B好，则A的泛化性能是否在统计意义上优于B，以及这个结论的把握有多大。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/837276.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

10、Go Gin 连接Redis以及CookieSession

10、Go Gin 连接Redis以及CookieSession

一、Redis 在Go语言中，使用Gin框架结合Redis数据库可以构建高性能的Web应用程序。Gin是一个轻量级的HTTP框架，提供了快速构建RESTful API的能力；而Redis则是一个高性能的键值存储系统，常用于缓存、消息队列、计数器等多种场景 1、…

阅读更多...

每日OJ题_贪心算法四⑧_力扣767. 重构字符串

每日OJ题_贪心算法四⑧_力扣767. 重构字符串

目录力扣767. 重构字符串解析代码力扣767. 重构字符串 767. 重构字符串难度中等给定一个字符串 s ，检查是否能重新排布其中的字母，使得两相邻的字符不同。返回 s 的任意可能的重新排列。若不可行，返回空字符串 "" 。 …

阅读更多...

Jetson Orin NX L4T35.4.1平台自启动时间优化调试记录1

Jetson Orin NX L4T35.4.1平台自启动时间优化调试记录1

1.前言尝试优化Orin NX (p3767+p3768)与R35.4.1 BSP的启动时间；从USB引导Orin设备；最初，引导时间是55-57秒；在内核端进行了一些优化之后，我们现在是38-40秒；正试图在15秒内启动Orin设备，但是UEFI本身需要12秒才能完成 UEFI 优化: （1）https://github.com/NVI…

阅读更多...

鸿蒙系统编译方式

鸿蒙系统编译方式

鸿蒙系统编译编译原理编译方式概述hb编译ohos-buildhb安装编译使用build脚本hpmhpm介绍编译举例说明综合应用举例虚拟机中编译docker中使用hpm编译编译原理编译构建指导：https://docs.openharmony.cn/pages/v4.0/zh-cn/device-dev/subsystems/subsys-build-all.md，文档介绍…

阅读更多...

java 对象赋值

java 对象赋值

在Java中，对象赋值给另一个对象通常是通过引用的方式来实现的。这意味着赋值操作后，两个对象引用同一个对象，它们指向相同的内存地址，修改其中一个对象的属性会影响到另一个对象。 class MyClass {private int intValue;private …

阅读更多...

设计模式六大原则之里氏替换原则

设计模式六大原则之里氏替换原则

文章目录概念替换逻辑行为不变拆解小结概念子类对象能够替换程序中父类对象出现的任何地方，并且保证原来程序的逻辑行为不变及正确性不被破坏。替换替换的前提是面向对象语言所支持的多态特性，同一个行为具有多个不同表现形式或形态的能力。逻…

阅读更多...

Android adb shell关于CPU核的命令

Android adb shell关于CPU核的命令

Android adb shell关于CPU核的命令先使用命令： adb shell 进入控制台。然后，直接在$后面输入下面命令，针对CPU的命令。 cat /proc/cpuinfo | grep ^processor | wc -l 查看当前手机的CPU是几核的。 cat sys/devices/system/cpu/online …

阅读更多...

Java面试八股之什么是Java反射

Java面试八股之什么是Java反射

什么是Java反射基本概念反射是Java语言的一个重要特性，它允许我们在运行时分析类、接口、字段、方法等组件的信息，并能够动态地操作这些组件，包括创建对象、调用方法、访问和修改字段值等。简单来说，反射提供了在程序运行时对…

阅读更多...

【kubeflow文档】kubeflow介绍与架构

【kubeflow文档】kubeflow介绍与架构

1. kubeflow介绍 Kubeflow项目致力于使机器学习（ML）工作流在Kubernetes上的部署变得简单、可移植和可扩展。目标不是重新创建其他服务，而是提供一种直接的方法，将ML的开源系统部署到不同的基础设施中。无论在哪里运行Kubernetes&a…

阅读更多...

Shell的运行原理和Linux的权限

Shell的运行原理和Linux的权限

Shell的运行原理 Linux严格意义上说是一个操作系统，我们称之为“核心（kernel）”，但我们一般用户不能直接使用kernel，而是通过kernel的“外壳程序”，也就是所谓的Shell，来与kernel沟通。 Shell…

阅读更多...

迷茫时读书，焦虑时运动，独处时蓄力

迷茫时读书，焦虑时运动，独处时蓄力

这个观点非常富有哲理，它传达了在不同情绪状态下如何通过特定的活动来调整自己，以达到更好的心理状态和更健康的生活方式。迷茫时读书：当我们感到迷茫、不知所措时，读书可以为我们提供新的视角、知识和启发。书籍是智慧的结晶&am…

阅读更多...

C++ QT设计模式：责任链模式

C++ QT设计模式：责任链模式

基本概念责任链模式（Chain of Responsibility Pattern）是一种行为型设计模式，将请求沿着处理链传递，直到有一个对象能够处理为止。实现的模块有： Handler（处理者）：定义一个处理…

阅读更多...

Operations Research课程之非线性规划（梯度下降｜牛顿法｜Gurobi+Python）

Operations Research课程之非线性规划（梯度下降｜牛顿法｜Gurobi+Python）

目录 1.非线性规划介绍 2.梯度下降法(Gradient descent) 2.1 梯度和Hessians矩阵 2.2 梯度下降算法 2.3 算法举例 3. 牛顿法(Newton’s method) 3.1 适合单变量的牛顿法 3.2 适合多变量的牛顿法 3. 实例(GurobiPython) 3.1 Agricultural Pricing问题描述 3.2 Gurobi…

阅读更多...

【论文复刻】堆叠柱状图+饼图

【论文复刻】堆叠柱状图+饼图

复刻了一下这篇论文里的fig2c：Impacts of COVID-19 and fiscal stimuli on global emissions and the Paris Agreement | Nature Climate Change 效果图： 主要步骤： 1. 数据准备：随机赋值 2. 图像绘制：绘制堆叠柱状…

阅读更多...

【C++】可变参数模板简单介绍

【C++】可变参数模板简单介绍

前言可变参数模板是C11中的新特性，它能够让我们创建可以接收可变参数的函数模板和类模板，相比C98/03，类模版和函数模版中只能含固定数量的模版参数，可变模版参数是一个巨大的改进，通过系统系统推演数据的类型&#xf…

阅读更多...

Python笔记-Alchemy中改变表的模式（库schema）

Python笔记-Alchemy中改变表的模式（库schema）

现在是2024-01-10，发到互联网上应该是2024-05-13。查了下chatgpt，麻了，乱七八糟的。最后还是靠stackoverflow解决的，目前，从解决问题的角度来看，这个还是牛逼点。原文如下： python - How d…

阅读更多...

Ansible常用变量【下】

Ansible常用变量【下】

转载说明：如果您喜欢这篇文章并打算转载它，请私信作者取得授权。感谢您喜爱本文，请文明转载，谢谢。前言在上一篇文章《Ansible常用变量【上】》中，学习了Ansible常用变量的前半部分，放了个五一假&#x…

阅读更多...

部署的脚本

部署的脚本

文章目录部署脚本2024心得优秀博客部署脚本2024 心得脚本部署，可以帮你大大的提高工作效率。脚本也被称为自动化办公。自己写的博客要么是太简单，要么是写的不好，总之是狗屎，所以不要自己写博客。多收集和整理一些不错的博客…

阅读更多...

拼多多流量推广和点击哪个好？拼多多自然流量规则

拼多多流量推广和点击哪个好？拼多多自然流量规则

流量推广是通过付费广告来增加商品的曝光量，而点击推广则是通过付费广告来增加商品的点击量。那么，对于商家来说，哪种推广方式更好呢? 一、拼多多流量推广和点击哪个好流量推广：流量推广的优势在于能够快速提高商品的曝光量&a…

阅读更多...

买货查窜货过程中的可能情况

买货查窜货过程中的可能情况

控价除了要管控渠道中的低价、乱价链接外，还可能需要解决窜货问题，当窜货问题蔓延不及时解决时，渠道会越来越受影响，所以治理窜货也是控价过程中很重要的一步，窜货问题的治理多通过买货溯源来解决，买货要先…

阅读更多...

最新文章