一位老师,一位领导,一个让全体学生考上目标学校的故事

今天,小夕给大家讲一个故事...

v2-b8749c02a1c08a600012ae0b57b393d7_b.png

从前,有座山...​

山里,有座学校...

学校里,有一位老师,一位领导,还有五只可爱的小仙(学)女(生)。

这5个学生的名字是:小兔,小青,小路,小音,小夕。她们的高考目标依次为清华、清华、清华、清华、浙大。但是不管她们的目标如何,在家长的逼迫下:

1. 假设过了浙大的线,但是没过清华的线,那就上浙大。(所以想考清华的学生会很难过)
2. 假设如果过了清华的线,那么就必须要上清华,哪怕目标是浙大,也不能报。(所以想考浙大的学生会很难过)

然后老师的培养目标呢,并不是让所有的学生都上清华,而是让每个学生都达成她们心中的目标!想上浙大的学生,就不能考的太高,以免上了清华。想上清华的学生,就要考的足够高,以免上了浙大。

1. 这个老师很奇怪,他每天会制定一个精力分配计划表,比如老师每天都有100份精力,他要给各个学生分配精力。开学第一天,由于他对这些学生都不熟悉,于是他给这5个学生平均分配精力,即每人都能得到20份精力。

2. 这个老师白天怎么上课呢?他会重点关注和培养今天的精力分配计划中那些精力分配很多的学生。他这一天,会讲很多次课,每节课结束的时候呢,都会安排一个随堂考试。并且根据这场考试后各个学生的成绩单,来评价一下这场考试的成功率

2. 但是注意啊,怎么衡量这个考试成不成功呢?重点来啦,这个老师很奇葩!他主要是看今天重点关注的学生能不能考上目标学校!比如今天老师的100份精力中,92份给了小夕,剩下的8份平分给了小兔等4人。那么!今天!只要小夕能达成目标(即恰好考上浙大),那么其他4人都没有达成目标也没事( ̄∇ ̄),这时的考试成功率是92%。但是如果这场考试中小夕没有达成目标(即不小心考上了清华),其他4人都达成了目标(即考上了清华),就认为这场考试的成功率只有8%!(我仿佛听到有人说这个老师是不是智障...)

2. 然后呢,按照上面讲的这么不公平的考试结果评价准则,选出今天考的最成功的一场!然后将这一场考试作为今天最终的考试结果,并且彻底忽略掉今天的其他考试。并将这场考试的考试卷成功率连夜汇报给上级。

3. 上级是一个夜猫子,而且秉公执法却不做复查的人。于是,他会在明天到来之前,根据今天老师递交的考试结果中的成功率,来给这场考试的考试卷打个分数。日后拿出这张考试卷时,看到打的这个分,就知道这场考试卷的含金量是多少啦。

4. 老师也不敢睡觉,连夜等待上级给这场考试打的分数。等来上级打的这个分数后,老师赶紧拿着这个分数今天的精力分配计划表来制定明天的精力分配计划表

4. 怎么制定呢?上级打的分数决定了精力分配计划表的变动大小,如果上级给打了0分,就意味着计划表不要变动了。上级给打的分数越高,明天的计划表就要改动越大。那么怎么改呢?这时,老师终于开始考虑全体学生了,老师会将今天这场考试中达成目标的学生的精力分配减少(比如今天在小夕身上分配92份精力,小夕达成了目标,那么根据上级的打分,明天分配的精力要降低20%,所以明天给小夕的精力暂时记为92*(1-0.2)=73.6。),将今天这场考试中未达成目标的学生的精力分配增加(比如今天在小兔身上分配2份精力,那么根据上级的打分,明天分配的精力要增加20%,所以明天给小兔的精力暂时记为2*(1+0.2)=2.4。)。

4. 然后都算完后,发现明天给各个学生的精力之和不等于100了,那就归一化一下,保证精力之和是100。

5. 于是,明天又是崭新的一天。。。除了精力分配计划表改变了以外,其他并没有影响,完全重复前面的过程。

5. 就这样过了很多很多天。。。

6. 什么时候结束呢?

6. 那就是根据上级对每天的每场考试的打分,来累加每个学生在前面每天的考试结果啦(即加权的考试结果,对于上级打分低的考试,考试结果就不太重要;对于上级打分高的考试,考试结果就很重要)

6. 如果有一天,累加每个学生的考试结果后发现,诶?所有学生的累计考试结果全都达成了目标!!!即累加起来后,发现学生全都考上了目标学校!!!好了,你们毕业惹~

7. 这时,又跑过来一个没有考试目标的学生,叫小好,她问老师,“老师老师,你说我将来会上清华还是浙大呢?”

7. 老师:“很简单,你去把这一摞卷子全都做一遍,这是我们的往日考试卷。然后你全做完后,我给你按照上级以前对每张卷子含金量的打分,给你累加一下,得到最终的考试结果。这个最终的考试结果就代表了你将来会上的学校。”

v2-b8749c02a1c08a600012ae0b57b393d7_b.png

是的,上面的过程,就是机器学习的AdaBoost算法/分类器。包括了Adaboost的训练过程和分类过程。

Adaboost是集成机器学习中的典型算法,是Boosting思想的一个具体实现。通过训练并组合很多弱分类器,来加权决定分类结果。

怎么把上面的故事转成Adaboost算法呢?完成下面的概念替换:

下面映射的是算法中的实体(变量)

- 每个有目标的学生 -> 一个训练样本x_train

- 没有考试目标的学生 -> 待分类样本x_test

- 清华、浙大 -> 本任务的两个类别c0,c1

- 每天的精力分配计划表 -> 每轮迭代的样本权重向量D

- 每天选出的成功率最高的考试卷 -> 每轮迭代产生的弱分类器

- 老师计算的每场考试的成功率 -> 训练样本集的加权错误率

- 上级领导给每个考试卷打的分数 -> 每个弱分类器的决策权重α

- 经过的天数 -> 弱分类器的数量

下面映射的是算法中的过程(与故事中每一段前面的序号完全对应)

- 1. 开学第一天,平均分配精力给每个学生 -> 样本权重向量D的初始化

- 2. 每一天的教学、随堂考试、选出成功率最高的考试过程 -> 本轮迭代中训练弱分类器的过程

- 3. 上级领导给考试卷打分的过程 -> 计算当前这个弱分类器的决策权重α

- 4.老师制作明天的精力分配计划表 -> 计算下一轮迭代时的样本权重向量D

- 5. 一天天的过去 -> 不断重复上述步骤2-4.

- 6. 所有学生累计考试结果全都达成目标 -> Adaboost模型收敛,完成训练。

- 7. 给没目标的小好预测学校 -> 利用训练好的Adaboost分类器预测待分类样本的类别。

听说,写Adaboost的代码的时候,在注释中把小夕讲的这个故事写出来就不会出错了...

v2-b8749c02a1c08a600012ae0b57b393d7_b.png

最后,请手机/电脑/IPAD/投影仪屏幕前正在带学生的老师,请勿模仿本文

( ̄∇ ̄)

更多奇怪的故事,欢迎来微信订阅号【夕小瑶的卖萌屋】玩耍~(还是彩色精装版的哦)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481241.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

小冰李笛:ChatGPT在向“让你认为它有知识”的方向发展 | MEET 2023

来源:量子位衡宇 整理自 MEET2023ChatGPT技惊四座,甚至不少人认为它已经能“取代搜索引擎”。然而就在MEET2023智能未来大会上,却出现了这样一种迥然相异的观点:未来5年里,大家想要获取知识,最好的方法还是…

从前,有只小仙女叫...

从前,有只小仙女叫小音✧٩(ˊωˋ*)و✧这一篇真的不是小夕萌的技术文啦( ̄∇ ̄)今天小夕给大家推送一点好玩的东西~毕竟高中老师说过,不能只学不玩嘛( ̄∇ ̄)虽然小夕以萌著称\(//∇//)\,但是在da…

DeepMind新研究:AI也懂合纵连横

摘要人类文明的成功,植根于我们通过沟通和制定共同计划进行合作的能力。人工智能主体面临着与人类类似的问题。最近,人工智能公司 DeepMind 展示了AI如何利用沟通在桌游“强权外交”中更好地合作。研究发现,沟通主体容易受到背叛协议者的负面…

从逻辑回归到神经网络

回顾小夕在文章《逻辑回归》中详细讲解了逻辑回归模型,又在《Sigmoid与Softmax》中详细讲解了Sigmoid的实际意义(代表二类分类问题中,其中一个类别的后验概率)。至此,我们已经比较透彻的理解了逻辑回归模型假设函数(也…

华为2019年校招(20届实习)机考题python版解答与思路(2019-3-13软件题)

试题为今天考试时记下,记于此仅做学习分享。侵删。 答案思路仅供参考,肯定有更优的办法!第三题没解出来,欢迎大家评论提点! 第一题: 这道题对输入做切分(调用split()方法)后&#xf…

语言模型生成了自然界不存在的蛋白质,图灵奖得主LeCun:蛋白质编程来了

来源:药学前沿进展Meta:设计蛋白质这件事,语言模型就能干。用机器学习去研究蛋白质结构预测,吸引了众多科技大厂、科研机构的目光纷纷投入其中,这期间,他们也产出了重要成果。如在 2021 年 《Science》的十…

神经网络中的偏置项b到底是什么?

前言很多人不明白为什么要在神经网络、逻辑回归中要在样本X的最前面加一个1,使得 X[x1,x2,…,xn] 变成 X[1,x1,x2,…,xn] 。因此可能会犯各种错误,比如漏了这个1,或者错误的将这个1加到WX的结果上,导致模型出各种bug甚至无法收敛。…

【重版】朴素贝叶斯与拣鱼的故事

重版公告由于小夕之后要讲的好几篇文章要基于这一篇的知识,但是以前写的的这篇文章对朴素贝叶斯的讨论不够深入,又不值得再额外写一篇朴素贝叶斯啦,因此本文重版了以前的文章《朴素贝叶斯》。与旧版相比,新版对基础知识的讲解进行…

2022,这些国之重器让人眼前一亮!

来源:新华社2022即将收官这一年我们有许多难忘的回忆回顾,是为了更好出发我们将这一年各领域走过的壮阔征程制作成了精美的系列海报第一期让我们来看看那些让人眼前一亮的国之重器它们——上天入海!乘风破浪!贯通聚能!…

逻辑回归与朴素贝叶斯的战争

0一起走过的首先,小夕带领大家回顾一下文章《逻辑回归》、《Sigmoid与Softmax》、《朴素贝叶斯》中的几点内容,这几点内容也是本文的前置知识:1. 逻辑回归模型的表达式(假设函数):,其中。2. 逻辑回归模型本质上是二类分…

OpenAI年底上新,单卡1分钟生成3D点云,text-to 3D告别高算力消耗时代

来源:大数据文摘授权转载自HyperAI超神经作者:三羊OpenAI 年底冲业绩,半个多月前发布的 ChatGPT 广大网友还没玩明白,近日又悄么发布了另一利器--可以依据文本提示,直接生成 3D 点云的 PointE。text-to-3D:…

机器学习相关从业者如何兼顾理论与工程能力

理论与工程首先,小夕说一下自己目前对理论与工程的理解吧,这也是小夕当前研究理论和熟练工程时主要的出发点。(仅为个人思考,请勿当成真理理论注重的是学科中各个知识点的大一统,将各种散乱的算法、现象、技巧来归结到…

万字拆解!追溯ChatGPT各项能力的起源

导语一篇十分深度剖析GPT系列模型的文章,作者翻译成了中文,在这里分享给大家。来源:李rumor作者:符尧, yao.fued.ac.uk,爱丁堡大学 (University of Edinburgh) 博士生,本科毕业于北京大学与 彭昊&#xff0…

用excel做数据分析

我们先来看看某公司全国产品销售的报表(截取了部分) 某公司全国产品销售的报表通过货品销售数据案例,需反映如下结果: 货品销售情况货品交货情况销售货品结构构成货品销售区域构成货品按时交货与合格品综合评价 我们使用 excel 进…

消失了一周的小夕在玩什么啦?

啊,你们的小夕回来啦~有没有被吓到( ̄∇ ̄)0小夕在玩什么小夕,终于,在今天,把,各种deadline,完成了(Д )首先,小夕要像大家深深的说一声谢谢啦。好多天没有打开订阅号的后台…

第四届泰迪杯数据挖掘大赛

<script src"//g.alicdn.com/aliyun/goldeneye-deploy/0.0.1/static/goldeneye.js"></script> <link rel"stylesheet" href"//at.alicdn.com/t/font_422887_vrqbpml6oos.css"><!--top-header begin-->云栖社区博客问答聚…

一般化机器学习与神经网络

0前言机器学习的初学者很容易被各种模型搞得晕头转向。如果扎进各种模型的细节无法自拔的话&#xff0c;可能很难发现一般化的框架。如果你觉得神经网络是非常不同的机器学习模型&#xff0c;如果你觉得神经网络的各种新名词让你觉得这完全就是一片新天地&#xff0c;那么可能你…

扩散模型再发力!图灵奖得主Hinton团队提出:图像和视频全景分割新框架

来源&#xff1a;机器之心作者&#xff1a;Ting Chen 等 编辑&#xff1a;赵阳本文的创新点一方面在于能够在大型全景掩码上训练扩散模型&#xff0c;一方面在于可以同时适配图片和流媒体场景。全景分割是一项基本的视觉任务&#xff0c;该任务旨在为图像的每个像素指定语义标…

经典的K-means聚类算法

原理部分主要来自大牛zouxy09和trnadomeet两个人的博客&#xff1b;后面的代码详细讲解为自己精心编写 一、概述 非监督学习的一般流程是&#xff1a;先从一组无标签数据中学习特征&#xff0c;然后用学习到的特征提取函数去提取有标签数据特征&#xff0c;然后再进行分类器的训…

《Cell》发现免疫系统的“武器研发实验室”

来源&#xff1a;生物通如果B细胞是免疫系统的兵工厂&#xff0c;制造抗体来中和有害的病原体&#xff0c;那么被称为生发中心的微小生物结构就是它的武器开发设施。.淋巴结的生发中心簇充满了成熟的B细胞(红色)&#xff0c;点缀着进化程度较低的B细胞(绿色)。 如果B细胞是免…