一文让你彻底理解 AdaBoost 自适应提升算法 | AdaBoost 的关键要点、基本原理、优缺点和实际应用

🍉 CSDN 叶庭云https://yetingyun.blog.csdn.net/


一、关键要点

AdaBoost,即自适应提升(Adaptive Boosting)算法的缩写,是一种基于 Boosting 策略的集成学习方法,旨在降低偏差。AdaBoost 的 “自适应” 二字意味着它能够在每一轮迭代后调整对训练数据实例的关注度(特别是那些之前被错误预测的样本)和更新弱学习器的权重。

与随机森林类似,AdaBoost 也是集成学习中的代表性算法之一,并且适用于分类和回归任务。Boosting 方法在近年来的多项数据竞赛中均取得了卓越的成绩,其背后的概念却并不复杂。该方法通过简单、易于理解的步骤构建简单的模型,进而将这些简单模型组合成强大的学习器。

当 Bagging 方法无法有效发挥作用时,可能会导致所有分类器在同一区域内都产生错误的分类结果。Boosting 方法背后的直观理念是,我们需要串行地训练模型,而非并行。每个模型都应专注于之前分类器表现不佳的样本区域。相较于随机森林中各决策树的相互独立性,AdaBoost 展示了一种顺序训练的级联结构。在 AdaBoost 中,后续模型的训练基于前一个模型的预测结果,形成依赖关系。这种级联方式使 AdaBoost 更专注于解决之前未能正确预测的样本,逐步优化预测性能。AdaBoost 充分考虑了每个弱学习器的发言权,不同于随机森林的简单投票或计算平均值。

AdaBoost 的核心思想在于:每一轮迭代后更新样本权重和弱学习器权重(这里的弱学习器通常使用决策树桩,决策树桩是指一个单层决策树),从而实现整体性能的优化提升。核心逻辑在于 “前人栽树,后人乘凉”。即前辈为后辈创造条件,后辈在此基础上进行改进。在 AdaBoost 中,我们首先训练一个弱学习器,并对其预测性能进行评估。在每一轮迭代后,我们更新样本的权重,也就是改变样本的困难度。对预测正确的样本减少关注,而对预测错误的样本加大关注,使新模型更能专注于克服前面的模型无法正确预测的困难样本。

在这里插入图片描述

最终,我们通过为不同的弱学习器赋予不同的权重,并将它们有效结合,成功地构建了一个强大的集成学习模型。这个集成模型不仅涵盖了处理容易样本的模型,还包括了处理困难样本的模型。因此,AdaBoost 显著提高了模型的预测能力。

【注意:配图截图自 B 站 UP 主 —— 五分钟机器学习,视频链接为:https://www.bilibili.com/video/BV1iA411e76Y/。非常好的分享,点赞、投币支持。】


二、AdaBoost 的基本原理和建模过程

我们的第一个挑战在于如何评估样本的难度。通常,在训练 AdaBoost 的第一个模型时,我们会为每个样本点分配一个难度值,该值等于数据集中样本总数的倒数。训练完第一个模型后,我们将评估所有样本点,找出预测正确和错误的样本。对于预测正确的样本,我们会降低其难度值;而对于预测错误的样本,则增加其难度值。每一轮迭代后更新样本权重

在这里插入图片描述

在此基础上,我们训练第二个模型,并再次评估所有样本点。由于训练第二个模型时,我们已经提高了对困难样本点的关注度,因此部分之前的预测错误的样本现在可能被正确预测。我们采用与训练第一个模型相同的策略:对于预测正确的样本,降低其难度值;对于预测错误的样本,增加其难度值(这相当于调整学习数据的分布)。这个过程会持续进行,直到达到我们预先设定学习器数量。届时,AdaBoost 中将包含多个模型。

通过赋予不同的权重来组合不同的弱学习器。最后,我们需要整合每个模型的结果。不同于随机森林中的简单投票或均值计算,AdaBoost 需要对每个模型的预测性能进行评估,以确定不同弱学习器的权重。最后,利用这些权重将所有弱学习器的输出整合成一个整体。以上便是训练 AdaBoost 的基本逻辑。

AdaBoost 使用指数损失函数(exponential loss function): L ( y , f ( x ) ) = exp ⁡ ( − y f ( x ) ) L(y, f(x)) = \exp(-yf(x)) L(y,f(x))=exp(yf(x))

其中, y y y 是实际标签(取值为 -1 或 1), f ( x ) f(x) f(x) 是模型对样本 x x x 的预测值。AdaBoost 通过最小化加权指数损失来训练每个弱学习器,并通过调整样本权重来重点关注误差较大的样本。尽管 AdaBoost 通常不直接采用梯度下降法来优化损失函数,但其过程可以视作一种特殊的梯度下降形式。具体来说,在每一轮中选择弱学习器以最小化当前所有样本的加权指数损失总和,这可以被看作是在损失空间中朝着减少总体误差的方向迈出的一步。

相较于随机森林中各决策树的相互独立性,AdaBoost 展示了一种顺序训练的级联结构。随机森林的性能受限于其并行结构,导致性能上限相对较低,类似于三个学渣合作,虽有提升,但在面对特别困难的问题时仍无法正确解答。而在 AdaBoost 中,后续模型的训练基于前一个模型的预测结果,形成依赖关系。这种级联方式使 AdaBoost 更专注于解决之前未能正确预测的样本,逐步优化预测性能。AdaBoost 充分考虑了每个弱学习器的发言权,不同于随机森林的简单投票或计算平均值。

这意味着对于复杂数据,模型的预测性能上限可能会超过随机森林。然而,过度追求对困难样本的正确预测,有时会导致模型过拟合,使其对异常样本点过于敏感。AdaBoost 的性能上限较高,但下限也较低。此外,由于 AdaBoost 的特殊结构,后续模型的训练是基于前一个模型的预测结果进行的,这导致模型的训练速度相对较慢

AdaBoost 除了能用于分类任务外,也能执行回归预测(即 AdaBoost.R2),尽管它在回归任务中并不常见。在 AdaBoost 回归中,损失函数可能采用加权均方误差,该误差量化了真实值与预测值之间的差异。作为一种元估计器,AdaBoost 回归器首先在原始数据集上训练一个基础回归器,然后在同一数据集上训练该回归器的多个副本,AdaBoost 在每次训练时会根据当前预测的误差调整样本的权重。因此,后续的回归器会更加关注那些预测误差较大的困难样本。


三、AdaBoost 的优点和不足

AdaBoost 的优点:

  • 准确性高:通过在每一轮迭代后调整对训练数据实例的关注度()和更新弱学习器的权重,最后将不同的弱学习器以不同的权重组合在一起,以输出最终的预测结果。AdaBoost 通常能够达到较好的预测性能。

  • 易于代码实现:相对于其他复杂算法,AdaBoost 算法容易实现。并且默认参数就能取得不错的效果。

  • 自动处理特征选择:AdaBoost 可以自动选择有效特征,并且忽略不相关或噪声特征。

  • 灵活性:可与各种类型数据和不同类型问题配合使用。

  • 不太容易过拟合:在许多实践中,尽管增加了复杂度,但 AdaBoost 往往不容易过拟合。

AdaBoost 的不足:

  • 噪声敏感性:对噪声和异常值敏感。由于算法会给错误预测样本更高权重,因此噪声和异常值可能会导致模型表现不佳。

  • 计算量较大:尽管单个模型可能简单,但需要顺序训练多个模型可能导致计算量增大。由于 AdaBoost 是一种迭代算法,需要顺序训练大量弱学习器,因此在处理大规模数据集或高维特征时,其计算量可能会变得相当大。

  • 数据不平衡问题:在面对极端不平衡数据时表现可能不佳。

总体而言,AdaBoost 是一种简单而高效的算法,适合作为解决分类问题的起点。然而,在应用时,需要注意其对噪声和异常值的敏感性。


四、AdaBoost 的实际应用

面部识别系统:想象一个门禁系统需要识别人脸来决定是否允许进入。每个人脸都有很多特征:眼睛大小、鼻子形状、嘴巴位置等等。 AdaBoost 可以通过逐步 “关注” 难以区分人脸特征的部分(比如某些人眼睛形状相似),逐渐提高系统识别人脸的准确性。

信用评分:银行需要决定是否批准贷款申请。他们可以使用 AdaBoost 来结合多个简单模型(例如基于申请人年龄、收入、信用记录等因素)来预测申请人违约的可能性。通过不断迭代,AdaBoost 能够更加精确地识别哪些客户是安全风险较低的借款者。

客户流失预测:公司通常希望知道哪些客户可能会停止使用其服务或产品。使用 AdaBoost 分析客户数据(包括购买历史、服务使用频率、客户反馈等),可以帮助公司识别出潜在的流失客户,并采取措施挽留他们。

AdaBoost 是一种强大且灵活的机器学习算法,广泛应用于多个领域。它通过不断迭代,并在每一轮迭代后更新样本和弱学习器的权重,将不同的弱学习器以不同的权重组合在一起,以输出最终的预测结果。这种方法有效地提高了预测的准确率和稳健性。无论是面部识别、信用评分还是客户流失预测等问题,AdaBoost 都能提供有效的解决方案。


📚️ 相关链接:

  • 【五分钟机器学习】Adaboost:前人栽树后人乘凉

  • 机器学习中最最好用的提升方法:Boosting 与 AdaBoost

  • 7 个步骤详解 AdaBoost 算法原理和构建流程(附代码)

  • AdaBoost 算法解密:从基础到应用的全面解析

  • CAO Ying, MIAO Qi-Guang, LIU Jia-Chen, GAO Lin. Advance and Prospects of AdaBoost Algorithm. ACTA AUTOMATICA SINICA, 2013, 39(6): 745-758. doi: 10.3724/SP.J.1004.2013.00745

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/789527.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue和FastAPI实现前后端分离

前言 近期接触了一些开源大模型应用服务,发现很多用的都是FastAPI web框架,于是乎研究了一下它的优势,印象最深有两个:一个是它的异步处理性能比较好,二是它可以类似java swagger的API交互文档,这个对应前…

【快捷部署】013_Podman(3.4.4)

📣【快捷部署系列】013期信息 编号选型版本操作系统部署形式部署模式复检时间013podman3.4.4Ubuntu 22.04apt-2024-04-03 一、快捷部署 注意! 必须满足:Ubuntu 20.10 and newer #由于本期安装脚本较为简单,所以不制作一键安装脚本&#xf…

【Django学习笔记(三)】BootStrap介绍

BootStrap介绍 前言正文1、BootStrap 快速了解2、初识BootStrap2.1 下载地址2.2 创建目录2.3 引入BootStrap2.4 使用BootStrap 3、BootStrap 组件&样式3.1 导航条3.2 栅格系统3.3 container3.3.1 container3.3.2 container-fluid 3.4 面板3.5 媒体对象3.6 分页3.7 图标3.7.…

SAP-CO主数据之作业类型创建-<KL01>

公告:周一至周五每日一更,周六日存稿,请您点“关注”和“在看”,后续推送的时候不至于看不到每日更新内容,感谢。 目录 一、背景: 成本中心主数据创建: 成本要素主数据创建: 二…

氟化氢冷凝装置PFA反应烧瓶可应用半导体行业

PFA多颈烧瓶是一种高品质的实验室器皿,它具有多个颈口,可以在同一容器内进行多种化学反应。PFA多颈烧瓶能够耐受高温和强酸、强碱等腐蚀性介质,是化学实验中不可或缺的物品。多颈烧瓶可以配合搅拌桨、温度计、恒压分液漏斗、冷凝管等使用&…

golang语言系列:学习路线图

云原生学习路线导航页(持续更新中) 本文是 golang语言系列 文章,主要展示golang语言学习的全路线图 参考:https://github.com/darius-khll/golang-developer-roadmap/blob/master/i18n/zh-CN/ReadMe-zh-CN.md

本地Windows打包启动前端后台

本地Windows打包启动前端后台 1、安装jdk Windows JDK安装 2、Nginx 2.1、将 nginx-1.16.1文件夹复制到D:\home\jisapp目录下 2.2、域名证书配置: 将域名证书放到D:\home\jisapp\ssl\2023目录下->配置nginx.conf文件(D:\home\jisapp\nginx-1.22.0…

通过nvtx和Nsight Compute分析pytorch算子的耗时

通过nvtx和Nsight Compute分析pytorch算子的耗时 一.效果二.代码 本文演示了如何借助nvtx和Nsight Compute分析pytorch算子的耗时 一.效果 第一次执行,耗时很长 小规模的matmul,调度耗时远大于算子本身 大规模的matmul,对资源的利用率高小规模matmul,各层调用的耗时 二.代码…

【Linux】Vim编辑器

专栏文章索引:Linux 目录 在Vim编辑器中,一个Tab键相当于几个空格? 在Vim编辑器中,一个Tab键相当于几个空格? 在Vim编辑器中,默认情况下,一个Tab键相当于8个空格。 这是Vim的默认设置&#x…

【C++】二分查找算法(模板)

重点 只需要记住两点: 1.left right 时,一定就是最终结果(包括找不到目标值),无需再次判断,如果判断就会死循环 2.求中点如果是求左端点 mid left (right - left)/2 如果是求右端点 mid left (right -…

物联网实战--入门篇之(四)嵌入式-UART驱动

目录 一、串口简介 二、串口驱动设计 三、串口发送 四、串口接收处理 五、PM2.5数据接收处理 六、printf重定义 七、总结 一、串口简介 串口在单片机的开发中属于非常常用的外设,最基本的都会预留一个调试串口用来输出调试信息,串口时序这里就不谈…

洛谷-P1706 全排列问题(DFS)

目录 题目链接: 思路: 代码: 题目链接: P1706 全排列问题 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 思路: 如果n比较小,可以写n个for循环输出全排列。但是这种简单方法只能用于较小的n&#xff0…

代码随想录算法训练营第三十六天|435. 无重叠区间,763. 划分字母区间

435. 无重叠区间 题目 给定一个区间的集合 intervals ,其中 intervals[i] [starti, endi] 。返回 需要移除区间的最小数量,使剩余区间互不重叠 。 示例 1: 输入: intervals [[1,2],[2,3],[3,4],[1,3]] 输出: 1 解释: 移除 [1,3] 后,剩下…

基于opencv的SVM算法的车牌识别系统设计与实现

基于opencv的SVM算法的车牌识别系统设计与实现 车牌识别技术是智能交通系统中的一项关键技术,它能够自动识别车辆的车牌号码。本文将详细介绍如何使用Python编程语言结合OpenCV库和SVM算法来实现车牌识别系统。 系统架构 车牌识别系统主要包括以下几个模块&…

提高生产力!这10个Lambda表达式必须掌握,开发效率嘎嘎上升!

在Java8及更高版本中,Lambda表达式的引入极大地提升了编程的简洁性和效率。本文将围绕十个关键场景,展示Lambda如何助力提升开发效率,让代码更加精炼且易于理解。 集合遍历 传统的for-each循环对集合进行遍历虽然直观,但在处理大…

Python(乱学)

字典在转化为其他类型时,会出现是否舍弃value的操作,只有在转化为字符串的时候才不会舍弃value 注释的快捷键是ctrl/ 字符串无法与整数,浮点数,等用加号完成拼接 5不入??? 还有一种格式化的方法…

jupyter notebook 配置默认文件路径

Jupyter是一种基于Web的交互式计算环境,支持多种编程语言,如Python、R、Julia等。使用Jupyter可以在浏览器中编写和运行代码,同时还可以添加Markdown文本、数学公式、图片等多种元素,非常适合于数据分析、机器学习等领域。 安装 …

理解VAE,可视化

引言 本文主要摘抄自:Understanding Variational Autoencoders (VAEs), Joseph Rocca, Sep 24, 2019,同时会加一些自己的理解和对原文的解释。 关于数据生成,目前深度生成模型中主流的有: 生成对抗网络——GANs,这是…

超市销售数据-python数据分析项目

Python数据分析项目-基于Python的销售数据分析项目 文章目录 Python数据分析项目-基于Python的销售数据分析项目项目介绍数据分析结果导出数据查阅 数据分析内容哪些类别比较畅销?哪些商品比较畅销?不同门店的销售额占比哪个时间段是超市的客流高封期?查看源数据类型计算本月…

QT 实现无边框可伸缩变换有阴影的QDialog弹窗

实现无标题栏窗口的拖拽移动、调节窗口大小以及边框阴影效果。初始化时进行位或操作,将这些标志合并为一个值,并将其设置为窗口的标志。这些标志分别表示这是一个对话框、无边框窗口、有标题栏、有最小化按钮和最大化按钮。 setWindowFlags(Qt::Dialog |…