【机器学习】回归

文章目录

    • 1. 如何训练回归问题
    • 2. 泛化能力
    • 3. 误差来源
    • 4. 正则化
    • 5. 交叉验证

1. 如何训练回归问题

第一步:定义模型

  • 线性模型: y ^ = b + ∑ j w j x j \hat{y} = b + \sum_{j} w_j x_j y^=b+jwjxj
    • 其中,( w ) 是权重,( b ) 是偏差。

第二步:确定损失函数

  • 损失函数:实际值和预测值的差平方和
    L = ∑ i = 1 n ( y ^ i − ( b + ∑ j w j x i j ) ) 2 L = \sum_{i=1}^{n} (\hat{y}_i - (b + \sum_{j} w_j x_{ij}))^2 L=i=1n(y^i(b+jwjxij))2

第三步:寻找最好的函数

目的:

  • 找到最好的函数,目的是找到参数 ( w ) 和 ( b ) 使损失函数最小。

方法:

  • 梯度下降法
    • 计算当前参数 ( w ) 和 ( b ) 的梯度。
    • 分别对 ( w ) 和 ( b ) 计算偏导数。
    • 更新参数:
      w ′ = w − η ⋅ ∂ L ∂ w , b ′ = b − η ⋅ ∂ L ∂ b w' = w - \eta \cdot \frac{\partial L}{\partial w}, \quad b' = b - \eta \cdot \frac{\partial L}{\partial b} w=wηwL,b=bηbL
      其中, η \eta η 是学习率。

说明:

  • 线性模型没有局部最优解,但学习率选择会影响参数是否能跨过最优解。

2. 泛化能力

欠拟合

  • 概念:没有训练到位,训练结果和测试结果都不好。
  • 原因:迭代次数少,模型过于简单。
  • 解决方法:引入新参数,提高模型复杂度。
  • 特点:偏差大,方差小。

过拟合

  • 概念:训练结果很好,但测试结果不好。
  • 原因:为了迎合训练数据,引入高次项,导致模型过于复杂,曲线变得过于曲折。
    • 权重影响模型的平滑度,方法影响的是上下平移。
  • 解决方法:
    • 增加训练数据,复杂模型更容易找到最好的函数。
    • 人工降维,减少模型复杂度。
    • 引入正则化参数,减小权重,使曲线平滑。
    • 使用 Dropout 和 Early Stop 等技术。
  • 特点:偏差小,方差大。

3. 误差来源

方差(Variance)

  • 定义:训练结果与训练结果平均值之间的方差。
  • 描述:反映了模型的抗扰动能力,训练结果的分散程度。

偏差(Bias)

  • 定义:训练结果与真实值的偏差。
  • 描述:刻画了模型的拟合能力,训练结果偏离正确结果的程度。

总结:

  • 模型简单:
    • Function set 小 → 方差小 → 偏差大 → 曲线平滑 → 欠拟合 → 通过调整模型复杂度解决。
  • 模型复杂:
    • Function set 大 → 方差大 → 偏差小 → 曲线陡峭 → 过拟合 → 通过正则化解决。

4. 正则化

目的

  • 在最小化损失函数的同时,减小权重的值。
  • 权重越小,曲线越平滑,输入变化对结果的影响较小。
  • 控制权重的更新,减小模型复杂度。

实现方法:

  • 在损失函数中加入正则化项: L reg = L + λ ∑ i w i 2 L_{\text{reg}} = L + \lambda \sum_{i} w_i^2 Lreg=L+λiwi2
  • 其中, λ \lambda λ 是正则化参数,控制权重的大小
  • 因为要最小化Loss,所以权重也会被最小化

5. 交叉验证

定义:

  • 交叉验证:划分训练集和测试集,模拟测试结果的不可预测性,避免过拟合。

目的:

  • 使用验证集验证训练结果,并根据验证结果调整模型,确保泛化能力。

步骤:

  1. 将数据划分为训练集和验证集。
  2. 使用验证集模拟测试集,验证训练结果。
  3. 根据验证集上的表现调整模型。
  4. 使用整个训练集重新训练模型,得到最终的模型。

注意:

  • 验证集调整后,不应根据测试集的结果再做调整,即便你忍不住。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/65812.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++ 设计模式:状态模式(State Pattern)

链接:C 设计模式 链接:C 设计模式 - 备忘录 状态模式(State Pattern)是一种行为设计模式,它允许对象在内部状态改变时改变其行为。状态模式将状态的行为封装在独立的状态类中,并将状态的切换逻辑委托给这些…

redis开发与运维-redis0401-补充-redis流水线与Jedis执行流水线

文章目录 【README】【1】redis流水线Pipeline【1.1】redis流水线概念【1.2】redis流水线性能测试【1.2.1】使用流水线与未使用流水线的性能对比【1.2.2】使用流水线与redis原生批量命令的性能对比【1.2.3】流水线缺点 【1.3】Jedis客户端执行流水线【1.3.1】Jedis客户端执行流…

leetcode hot 100 杨辉三角

118. 杨辉三角 已解答 简单 相关标签 相关企业 给定一个非负整数 numRows,生成「杨辉三角」的前 numRows 行。 在「杨辉三角」中,每个数是它左上方和右上方的数的和。 class Solution(object):def generate(self, numRows):""":ty…

Uncaught ReferenceError: __VUE_HMR_RUNTIME__ is not defined

Syntax Error: Error: vitejs/plugin-vue requires vue (>3.2.13) or vue/compiler-sfc to be present in the dependency tree. 第一步 npm install vue/compiler-sfc npm run dev 运行成功,本地打开页面是空白,控制台报错 重新下载了vue-loa…

【微服务】【Sentinel】认识Sentinel

文章目录 1. 雪崩问题2. 解决方案3. 服务保护技术对比4. 安装 Sentinel4.1 启动控制台4.2 客户端接入控制台 参考资料: 1. 雪崩问题 微服务调用链路中的某个服务故障,引起整个链路中的所有微服务都不可用,这就是雪崩。动图演示: 在微服务系统…

【Python运维】构建基于Python的自动化运维平台:用Flask和Celery

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 在现代IT运维中,自动化运维平台扮演着至关重要的角色,它能够显著提高运维效率,减少人为错误,并且增强系统的可维护性。本文将引导读者如…

STM32完全学习——使用定时器1精确延时

一、定时器的相关配置 首先一定要是递减定时器,递增的不太行,控制的不够准确,其次在大于10微秒的延时是非常准确的,小于的话,就没有那没准,但是凑合能用。误差都在一个微秒以内。使用高级定时器也就是时钟…

connect to host github.com port 22: Connection timed out 的解决方法

原因是 Github 被 GFW 屏蔽了。 Windows 系统,打开 C:\Windows\System32\drivers\etc,复制其中的 hosts 文件至桌面,用文本编辑器或者其他工具打开。 复制以下内容进去: 140.82.114.4 github.com 151.101.1.6 github.global.ss…

PyTorch中的autocast:混合精度训练的实现原理

PyTorch中的autocast:混合精度训练的实现原理 在深度学习中,尤其是在训练大型模型时,计算资源和显存消耗往往是非常关键的因素。为了优化这些问题,混合精度训练(Mixed Precision Training)应运而生。autoc…

Word格式修改

经常修改格式,留下这篇汇总 Word的累加符号上下标变右标指定目录:word如何取消封面或者目录下方的页码,页码从正文开始加参考文献:【Word】怎样给论文添加引用参考文献删空白页: word中无法删除空白页怎么办&#xff…

常见的排序算法过程和比较分析

比较分析 排序类别排序算法时间复杂度(最好)时间复杂度(最坏)时间复杂度(平均)辅助空间复杂度稳定性插入排序直接插入排序O(n)O(n)O(n)O(1)稳定插入排序折半插入排序O(n)O(n)O(n)O(1)稳定插入排序希尔排序…

随笔 | 写在2024的最后一天

. 前言 转眼又到了一年的末端。过去这一年,和前些年有些不同,变化巨大,感触良多。多到一时竟不知从何开始写。今天这篇随笔,因为时间有限,可能文法也会有些凌乱,就是想到哪里写到哪里,如果未来…

【QGIS入门实战精品教程】7.3:QGIS制作千层饼(DEM+等高线+影像+TIN)

文章目录 一、效果展示二、数据准备三、制作过程1. 打开软件2. 添加图层3. 制作千层饼一、效果展示 二、数据准备 订阅专栏后,从专栏配套案例数据包中的7.3.rar中获取。 1. dem 2. 影像 3. 等高线 4. tin 三、制作过程 1. 打开软件 打开QGIS软件。 QGIS软件主界面。

如何将CSDN文章 导出为 PDF文件

一、首先,打开我们想要导出为 PDF格式的 CSDN文章,以下图为例。 二、按 F12 调出浏览器调式模式后,选择 控制台 三、在控制台处粘贴代码 代码: (function(){ use strict;var articleBox $("div.article_content"…

Apache Hive常见问题

入门问题 什么是Apache Hive? 解释Hive的用途。Hive作为基于Hadoop的数据仓库工具是如何工作的?与传统关系型数据库相比,使用Hive有什么优势? Hive和关系型数据库管理系统(RDBMS)之间的区别是什么&#…

HTML——54. form元素属性

<!DOCTYPE html> <html><head><meta charset"UTF-8"><title>form元素属性</title></head><body><!--form标签用于创建一个表单&#xff0c;会将里面的内容一起发送服务器&#xff0c;结构类似于表格--><!-…

告别 $arr[0]: PHP 和 Laravel 中更优雅的数组处理方式

你是否曾经历过这样的惊魂时刻&#xff1a;线上代码突然崩溃&#xff0c;只因访问了一个不存在的数组元素&#xff1f;或者更糟的是&#xff0c;应用开始疯狂抛出错误&#xff0c;而你却毫无头绪&#xff1f;这一切的罪魁祸首可能就是看似人畜无害的硬编码数组索引&#xff0c;…

二十三种设计模式-单例模式

单例模式&#xff08;Singleton&#xff09;&#xff1a;确保一个类只有一个实例&#xff0c;并提供一个全局访问点。 单例模式两种实现方法&#xff1a;懒汉式和饿汉式。 懒汉式&#xff08;Lazy Initialization&#xff09; 懒汉式单例模式在第一次被使用时才创建实例&…

聊聊长连接和短连接

大家好&#xff0c;我是G探险者。 现在的软件架构无非就是两种架构模式&#xff0c;C/S架构&#xff0c;B/S架构。 C/S架构&#xff1a;C就是客户端client&#xff0c;S就是服务端server。 B/S架构&#xff1a;B就是浏览器browser,S就是服务端server。 当别人问你的项目是什么架…

【Linux报告】实训六 重置超级用户密码

实训六 重置超级用户密码 2018编写-今日公布 【练习一】忘记root密码 步骤一&#xff1a;开启或重启系统&#xff0c;并且要在五秒之内按任何键&#xff1b; 步骤二&#xff1a;按任意键&#xff0c;停止进入系统&#xff0c;按【e】键&#xff0c;跳转新页面&#xff0c;再…