AdaBoost 算法 入门

AdaBoost 是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,即弱分类器,然后把这些弱分类器集合起来,构造一个更强的最终分类器。算法的适应性在于前一个基本分类器分错的样本会得到加强,加权后的全体样本再次用来训练下一个基本分类器。同时,在每一轮中加入一个新的弱分类器,直至达到某个预定的足够小的错误率或达到预先指定的最大迭代次数。

具体来说,整个 AdaBoost 迭代算法包含 3 个主要步骤
(1)初始化训练数据的权值分布。如果有 M 个样本,则每一个训练样本最开始时都被赋予相同的权值:1/M。

(2)训练弱分类器。在训练过程中,如果某个样本点已经被准确地分类,那么在构造下一个训练集中它的权值就被降低;相反,如果某个样本点没有被准确地分类,那么它的权值就得到提高。在 t 轮训练结束后,根据得到的弱分类器 h_t 的性能,计算该分类器对应的权值 α_t ,并由 h_t 在训练集上的分类结果对权重向量 W_i→ W_(i+1) 进行更新。接着,权值更新过的样本集用于训练下一个分类器,整个训练过程如此迭代地进行下去。

(3)将各个训练得到的弱分类器组合成强分类器。各个弱分类器的训练过程结束后,加大分类误差率小的弱分类器的权重,使其在最终的分类函数中起较大的决定作用,降低分类误差率大的弱分类器的权重,使其在最终的分类函数中起较小的决定作用。换言之,误差率低的弱分类器在最终分类器中占的权重较大,否则较小。

AdaBoost 算法的特点:

AdaBoost 是一种具有很高精度的分类器,其算法具有如下特点:

(1) 可以使用各种方法构建子分类器,AdaBoost 算法提供对其进行组合以及提升的框架。
(2) 当使用简单分类器时,计算出的结果是可以理解的。
(3) 弱分类器构造极其简单,无须做特征筛选。
(4) AdaBoost 算法简单,不用调整分类器,不会导致过拟合。

AdaBoost 算法的应用:

(1) 用于二值分类或多分类的应用场景。
(2) 用于特征选择(Feature Selection)。
(3) 无须变动原有分类器,而是通过组合出新的分类器,提升分类器的性能。

在这里插入图片描述
(1)D1 表示样本的初始权重分配,数据点包含两类数据,两种颜色。在 AdaBoost算法运行过程中,我们使用水平或者垂直的直线作为分类器来进行分类。算法最开始给了一个均匀分布D。因此,h_1 里的每个点的权重是0.1。

(2)利用第一个分类器进行划分,有三个数据点划分错了,根据误差公式,计算得到带权的误差为:ɛ_1 = (0.1+0.1+0.1)= 0.3。第一个分类器的权重a_1 为0.42。根据算法要求,把分错的数据点的权值变大,得到新的权重分布。

在这里插入图片描述
至此,根据分类的正确率得到一个新的样本权重分布 D_2 ,一个子分类器h_1。

(3)进行第2次迭代,根据分类的正确率,得到一个新的样本权重分布 D3 以及一个子分类器 h2 。
在这里插入图片描述
(4)计算最后一个分类器的错误率和权重,得到最后一个分类器的权重为 h3。

在这里插入图片描述
(5)整合所有子分类器,即对其进行加权求和。从结果中看,即使简单的分类器,组合起来也能获得很好的分类效果。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483807.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第一单元总结

一、作业分析 第一次作业 与后两次作业相比,第一次作业非常简单,仅要求对由常数项和幂函数组成的多项式求导。但由于缺少面向对象编程经验,我在这次作业中栽了不少跟头。 (1)度量分析 在第一次作业中,我还没…

牛客16426 玩具谜题

题目描述 南有一套可爱的玩具小人,它们各有不同的职业。 有一天,这些玩具小人把小南的眼镜藏了起来。小南发现玩具小人们围成了一个圈,它们有的面朝圈内,有的面朝圈外,如下图: 这时 singer 告诉小南一个谜…

牛客16438 回文日期

date1 input() date2 input()""" 判断是否是闰年 """ def isLeap(year):if (year%4 0 and year%100 ! 0) or (year%400 0):return 1else:return 0""" 判断是否是回文数 """ def isPalindrome(year):for i in …

Codeforces 1139F Dish Shopping 树状数组套平衡树 || 平衡树

Dish Shopping 将每个物品拆成p 和 s 再加上人排序。 然后问题就变成了, 对于一个线段(L - R), 问有多少个(li, ri)满足 L > li && R > ri, 这个东西可以直接树状数组套平衡树维护。 但是这个题目有个特殊性,因为排…

牛客16494 生活大爆炸版石头剪刀布

题目描述 石头剪刀布是常见的猜拳游戏:石头胜剪刀,剪刀胜布,布胜石头。如果两个人出拳一样,则不分胜负。在《生活大爆炸》第二季第8集中出现了一种石头剪刀布的升级版游戏。升级版游戏在传统的石头剪刀布游戏的基础上,…

codeforces 1073E

题解: 考虑数位DP,状压出现过的数字集合S,f ( l , x , S , pz , lim )表示到第 l 位,数字为x, 数字集合为S ,是否为前导0,是否贴上界 然后同时定义g为该状态下的数字和,利用 10^(l-1) * f(l , x…

时空AI技术:深度强化学习在智能城市领域应时空AI技术:深度强化学习在智能城市领域应用介绍...

来源:海豚数据科学实验室作者:京东科技 时空AI团队深度强化学习是近年来热起来的一项技术。深度强化学习的控制与决策流程必须包含状态,动作,奖励是三要素。在建模过程中,智能体根据环境的当前状态信息输出动作作用于环…

牛客16500 珠心算测试

题目描述 珠心算是一种通过在脑中模拟算盘变化来完成快速运算的一种计算技术。珠心算训练,既能够开发智力,又能够为日常生活带来很多便利,因而在很多学校得到普及。 某学校的珠心算老师采用一种快速考察珠心算加法能力的测验方法。他随机生成…

读书笔记007:《伤寒论》- 手少阴心经

手少阴脉起心中,下膈直与小肠通,支者还从肺系走,直上喉咙系目瞳。直者上肺出腋下,臑后肘内少海从,臂内后廉抵掌中,锐骨之端注少冲。多气少血属此经,是动心脾痛难任,渴欲饮水咽干燥&a…

牛客16585 统计单词数

题目描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数。 现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在…

牛客21312 神秘餐馆

题目描述 一家神秘餐馆准备开放N天,牛牛 和 牛妹听到这个消息后,准备尽可能多的一起去吃午饭 餐馆有M道菜,牛牛和牛妹每次来只允许点一道菜,如果在第i天买了第j道菜 那么第i7天也只能买第j道菜 第i天第j道菜的价格为price[i][j] …

牛客21297 手机号码

题目描述 给你一个整数n表示手机号码的位数 再给你m个字符串表示保留的号码,比如911 110 120等 问你一共有多少的手机号码不以保留号码开头 n, m map(int, input().split()) s [] for _ in range(m):s.append(input())sum pow(10, n) num 0for i in range(m):flag Falsefo…

牛客16785 Cantor表

先找到第N个数在第几行第几列,然后根据规律进行计算 N int(input())t 1 while N-t > 0:N N-tt 1if t%2 0:print("%d/%d"%(N,t-N1)) else:print("%d/%d"%(t-N1,N))

Echarts富文本rich及格式化工具formatter的使用

Echarts官网上说,ECharts,一个使用 JavaScript 实现的开源可视化库,可以流畅的运行在 PC 和移动设备上,兼容当前绝大部分浏览器(IE8/9/10/11,Chrome,Firefox,Safari等)&a…

国拨经费约31.48亿!科技部发布科技创新2030 —“脑科学与类脑研究”重大项目2021年度项目申报指南...

来源:科技部科技部关于发布科技创新 2030 —“脑科学与类脑研究”重大项目 2021年度项目申报指南的通知国科发资〔2021〕265号各省、自治区、直辖市及计划单列市科技厅(委、局),新疆生产建设兵团科技局,国务院各有关部…

牛客16662 津津的储蓄计划

题目描述 津津的零花钱一直都是自己管理。每个月的月初妈妈给津津300元钱,津津会预算这个月的花销,并且总能做到实际花销和预算的相同。 为了让津津学习如何储蓄,妈妈提出,津津可以随时把整百的钱存在她那里,到了年末她…

Hinton获2021迪克森科学奖:他改变了AI,改变了世界

来源:AI科技评论作者:维克多编辑:青暮据卡内基梅隆大学(CMU)官方消息,Geoffrey Hinton 获得了2021年的迪克森科学奖(The Dickson Prize in Science)。此奖项设立于1969年&#xff0c…

牛客21783 牛牛的星际旅行

题目描述 在一个遥远的星球上,每周有N天,牛牛去了这个星球旅游,他恰好只带了N件不同的衣服,编号为1到N 每一天他会穿其中的某一件衣服,一周之内不能穿同一件衣服两次,而且假如某件衣服是在第x天穿的&#x…

国拨经费约31.48亿!科技部发布科技创新2030 —“脑科学与类脑研究”重大项目2021年度项目申报指南

来源:科技部科技部关于发布科技创新 2030 —“脑科学与类脑研究”重大项目 2021年度项目申报指南的通知国科发资〔2021〕265号各省、自治区、直辖市及计划单列市科技厅(委、局),新疆生产建设兵团科技局,国务院各有关部…

牛客21805 字符串编码与解码

链接:https://ac.nowcoder.com/acm/problem/21805 来源:牛客网 时间限制:C/C 1秒,其他语言2秒 空间限制:C/C 32768K,其他语言65536K 64bit IO Format: %lld 题目描述 给你两个长度相同的字符串a&#xff…