《机器学习基石》第一周 —— When Can Machine Learn?

《机器学习基石》第一周 —— When Can Machine Learn?

news/2025/10/20 1:30:19/文章来源:https://blog.csdn.net/weixin_30383279/article/details/98780908

（注：由于之前进行了吴恩达机器学习课程的学习，其中有部分内容与机器学习基石的内容重叠，所以以下该系列的笔记只记录新的知识）

《机器学习基石》课程围绕着下面这四个问题而展开：

主要内容：

一、什么时候适合用机器学习？

二、该课程所采用的一套符号表示

三、机器学习的流程

四、感知机算法

五、学习的类型

六、机器学习的无效性

七、机器学习的可行性（在无效性的前提下加一些条件限制）

一、什么时候适合用机器学习？

对于第一点：我们学习的对象必须要存在某些显式的或者潜在的规律，否则，如果学习对象都毫无规律，那么学习到的所谓的知识（经验）也就站不住脚了。

对于第二点：这些问题难以使用某些算法或者公式明确地算出结果，假如可以，那么我们就只需要学习数学和算法就足以解决问题，又何须机器学习呢？所以机器学习就是可以用来解决这些有规律但规律又相对模糊的问题。

对于第三点：只有依靠以往大量的经历所得到的经验，才是可靠的。

二、该课程所采用的一套符号表示

三、机器学习的流程

四、感知机算法

五、学习的类型

1.根据输出y的取值类型而区别，有分类、回归、结构化学习：

2.根据（样本）输出y的有无或者有多少而区别，有监督式学习、无监督式学习、半监督式学习、增强式学习：

3.根据学习的协议而区别，有：batch leanring、online leanring、active learning：

4.根据输入x的类型而区别，有：concrete features、raw features、abstract feature。

concrete features：有具体的、形象化的含义，例如身高、点击次数等这些特征。

raw features：原始的、未经过处理的特征，例如图片的像素等。

abstract feature：没有现实含义的，如资料编号或者用户ID。

5.总结：

六、机器学习的无效性

所谓机器学习的无效性，按照个人的理解，就是：单凭从给出的数据集中学习到的规律无法应用于数据集之外的数据，或者说是：每个人都学习到了不同的规律，且这些规律对于数据集都是成立的，但是对于数据集之外的数据就不成立了，这就是机器学习的不可行性。但是，假如增加一些条件限制，机器学习就可行了。其中一个很重要的条件限制就是：样本大小，也就是数据集的大小N足够大。下节详情。

七、机器学习的可行性

1.证明机器学习可行性的式子就是Hoeffding's inequality，其中u是实际上类别0的比例（假设是二分类），v是数据集（样本）类别0的比例：

当N足够大时，v就近似等于u，这就说明了从样本集中学到的规律，就近似是真实的规律，这样就能将学习到的规律应用到数据集之外的数据了。

2.对上面的结论作更严谨的推导：

设u = Ein(h)，v = Eout(h)，其中Ein(h)为h固定时h对样本预测的错误率， Eout(h)为固定时h对测试数据(或者说所有数据)预测的错误率。

所以，如果样本集的大小N足够大，那么：

注意，当Ein(h) 约等于 Eout(h)时，并不意味着h约等于f，因为Ein(h)和 Eout(h)可能很大，这样h的预测效果就非常差了。只有保证了Ein(h)很小的情况下，才能求出最接近f的h。而各种优化算法如梯度下降、最小二乘法等，就是使得Ein(h)非常小的有力工具。

3.综上，保证机器学习可行性的条件至少有两点：

1) 样本（训练集）足够大：保证了Ein(h) 约等于 Eout(h)。

2) Ein(h)足够小：保证了Eout(h)足够小，即保证了h对所有数据的预测误差足够小。

转载于:https://www.cnblogs.com/DOLFAMINGO/p/10068538.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/364715.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

如何用纯 CSS 创作一盘传统蚊香

如何用纯 CSS 创作一盘传统蚊香

效果预览在线演示按下右侧的“点击预览”按钮可以在当前页面预览，点击链接可以全屏预览。https://codepen.io/comehope/pen/BVpvMz可交互视频教程此视频是可以交互的，你可以随时暂停视频，编辑视频中的代码。请用 chrome, safari, edge 打…

阅读更多...

LeetCode 905. 按奇偶排序数组

LeetCode 905. 按奇偶排序数组

LeetCode 905. 按奇偶排序数组转载于:https://www.cnblogs.com/hglibin/p/10794792.html

阅读更多...

java父类序列化_父类的序列化与 Transient 关键字

java父类序列化_父类的序列化与 Transient 关键字

情境：一个子类实现了 Serializable 接口，它的父类都没有实现 Serializable 接口，序列化该子类对象，然后反序列化后输出父类定义的某变量的数值，该变量数值与序列化时的数值不同。解决：要想将父类对象也序列…

阅读更多...

Java：在Runnable中处理RuntimeException

Java：在Runnable中处理RuntimeException

去年年底，我正在运行预定的任务来监视Neo4j集群，而我遇到的问题之一是有时监视会退出。我最终意识到这是因为RuntimeException被抛出到Runnable方法中，而我没有处理它。以下代码演示了该问题： import java.util.ArrayList; im…

阅读更多...

错误代码： 1231 - Variable 'sql_mode' can't be set to the value of 'NULL'

错误代码： 1231 - Variable 'sql_mode' can't be set to the value of 'NULL'

错误代码： 1231 - Variable sql_mode cant be set to the value of NULL 错误代码： 1231 - Variable sql_mode cant be set to the value of NULL 错误代码： 1231 - Variable sql_mode cant be set to the value of NULL mysql中的提示删除注…

阅读更多...

[Unity3D]Unity3D游戏开发之怪物AI

[Unity3D]Unity3D游戏开发之怪物AI

大家好。欢迎大家关注由我为大家带来的Unity3D游戏开发系列文章，我的博客地址为：http://blog.csdn.net/qinyuanpei。在上一篇文章中，我们基本上实现了一个小地图的功能，今天呢，我们来实现怪物AI，所谓怪物AI…

阅读更多...

中国第一批写java的人_中国java开源界最可爱的人们

中国第一批写java的人_中国java开源界最可爱的人们

评论# re: 中国java开源界最可爱的人们2007-12-07 15:29sitinspring如果少一些抒情,多一点实质内容,文章更耐看. 回复更多评论# re: 中国java开源界最可爱的人们[未登录]2007-12-07 15:49dennis竟然没有满江红，opendoc的意义不用多说了吧回复更多评论# re: 中…

阅读更多...

如何把握好 transition 和 animation 的时序，创作描边按钮特效

如何把握好 transition 和 animation 的时序，创作描边按钮特效

效果预览在线演示按下右侧的“点击预览”按钮可以在当前页面预览，点击链接可以全屏预览。https://codepen.io/comehope/pen/mKdzZM可交互视频教程此视频是可以交互的，你可以随时暂停视频，编辑视频中的代码。请用 chrome, safari, edge 打…

阅读更多...

使用PHREAK算法实现Drools 6性能

使用PHREAK算法实现Drools 6性能

Drools 6引入了新的惰性匹配算法。该算法的详细信息已在之前的两个博客中介绍： RIP RETE时间获得PHREAKY 基于PHREAK堆栈的评估和向后链接第一篇文章讨论了性能以及为什么算法的批处理和惰性方面难以比较。 “性能的最后一点。通常，使用PHREAK的单…

阅读更多...

02Data

02Data

1.数据从何而来 2.数据对象和属性类型数据集合的类型结构数据的重要特征数据对象属性属性类型数据属性的类型离散 vs.连续属性 3.数据的（基本）统计描述分布度量代数度量整体度量度量数据的中心趋势对称/偏斜数据 4.数据可视化 5.数据的相似…

阅读更多...

PAT 1131 Subway Map

PAT 1131 Subway Map

题目链接： https://pintia.cn/problem-sets/994805342720868352/problems/994805347523346432 思路： 说多了都是泪， Dijstra超时，采用dfs 利用map<pair<int,int>,int>，表示两个点和他们中间的地铁线号每次…

阅读更多...

专访Vue作者尤雨溪：Vue CLI 3.0重构的原因

专访Vue作者尤雨溪：Vue CLI 3.0重构的原因

1、为什么要对 Vue CLI 进行大规模修改？ 尤雨溪认为旧版本的 Vue CLI 本质上只是从 GitHub 拉取模版，这种拉模版的方式有几个问题： （1） 在单个模版里面同时支持太多选项会导致模版本身变得极其复杂和难以维护&#x…

阅读更多...

java秒杀时间与服务器时间_Javascript实现秒杀倒计时（时间与服务器时间同步）...

java秒杀时间与服务器时间_Javascript实现秒杀倒计时（时间与服务器时间同步）...

现在有很多网站都在做秒杀商品，而这其中有一个很重要的环节就是倒计时。关于倒计时，有下面几点需要注意：1.应该使用服务器时间而不是本地时间(本地时间存在时区不同、用户自行设置等问题)。2.要考虑网络传输的耗时。3.获取时间时可直接从AJAX…

阅读更多...

Java 8 Friday Goodies：本地交易范围

Java 8 Friday Goodies：本地交易范围

在Data Geekery ，我们喜欢Java。而且，由于我们真的很喜欢jOOQ的流畅的API和查询DSL ，我们对Java 8将为我们的生态系统带来什么感到非常兴奋。我们已经写了一些关于Java 8好东西的博客 ，现在我们觉得是时候开始一个新的博客系列了…

阅读更多...

Python3.5-20190501-廖老师的

Python3.5-20190501-廖老师的

python是一门解释型\脚本语言(和js特别像,如果同时学习js和python完全搅浑了.) 在运行py时候是一句一句翻译成cpu识别的机器码,所以速度比较慢.而C程序是运行前直接编译成CPU能执行的机器码，所以非常快. 学习python,就需要安装python.安装的同时会有一个解释器,就是…

阅读更多...

如何用纯 CSS 创作一个冒着热气的咖啡杯

如何用纯 CSS 创作一个冒着热气的咖啡杯

效果预览在线演示按下右侧的“点击预览”按钮在当前页面预览，点击链接全屏预览。https://codepen.io/zhang-ou/pen/xjXxoz可交互视频教程此视频是可以交互的，你可以随时暂停视频，编辑视频中的代码。请用 chrome, safari, edge 打开观看。…

阅读更多...

用keras实现基本的回归问题

用keras实现基本的回归问题

数据集介绍共有506个样本，拆分为404个训练样本和102个测试样本该数据集包含 13 个不同的特征： 人均犯罪率。占地面积超过 25000 平方英尺的住宅用地所占的比例。非零售商业用地所占的比例（英亩/城镇）。查尔斯河虚拟变量&#xf…

阅读更多...

Java：计算类的serialVersionUID

Java：计算类的serialVersionUID

在本周早些时候，我想计算可序列化类的serialVersionUID ，以便可以覆盖其toString方法而不会破坏所有内容。我遇到了Frank Kim的博客文章 ，该文章建议使用JDK附带的serialver工具。我创建了一个Maven小项目来在一个非常简单的类上测试该工…

阅读更多...

Codeforces Round #556 (Div. 1)

Codeforces Round #556 (Div. 1)

Codeforces Round #556 (Div. 1) A. Prefix Sum Primes 给你一堆1,2，你可以任意排序，要求你输出的数列的前缀和中质数个数最大。发现只有\(2\)是偶质数，那么我们先放一个\(2\)，再放一个\(1\)，接下来把\(2\)全部放掉再…

阅读更多...

FC冒险岛java版_冒险岛单机版

FC冒险岛java版_冒险岛单机版

游戏概述冒险岛单机版是一款非常好玩的横版动作RPG游戏，游戏难度很适中，冒险岛单机版采用了与其他Q版2D游戏不同的横向卷轴的移动方式，场景高低落差的设计，整个画面层次感设计算是一级，喜欢这类手柄闯关游戏的玩家快来…

阅读更多...

最新文章