[机器学习笔记] Note1--机器学习简介

阅读本文大约需要 2 分钟

本文结构:

      • 什么是机器学习
      • 监督学习(Supervised Learning)
      • 非监督学习(Unsupervised Learning)
      • 课程小结

这是学习 Andrew Ng 在 Coursea 上的机器学习课程所做的笔记。

什么是机器学习

对于机器学习,并没有一个一致认同的定义,一个比较古老的定义是由Arthur Samuel在 1959 年给出的:

机器学习研究的是如何赋予计算机在没有被明确编程的情况下仍能够学习的能力。(Field of study that fives computers the ability to learn without being explicily programmed.)

随后他编写了一个跳棋游戏的程序,并且让这个程序和其自身玩了几万局跳棋游戏,并且记录下来棋盘上的什么位置可能会导致怎样的结果,随着时间的推移,计算机学会了棋盘上的哪些位置可能会导致胜利,并且最终战胜了设计程序的 Samuel。

另一个比较现代且形式化的定义是由Tom Mitchell在 1998 年给出的:

对于某个任务T和表现的衡量P,当计算机程序在任务T的表现上,经过P的衡量,随着经验E而增长,我们便称计算机程序能够通过经验E来学习该任务。

在上述的跳棋游戏的例子中,任务 T 是玩跳棋游戏,P 是游戏的输赢,而经验E 则是一局局的游戏。

一些机器学习的应用例子:

  • 数据挖掘
  • 一些无法通过手动编程来编写的应用:如自然语言处理,计算机视觉
  • 一些自助式的程序:如推荐系统
  • 理解人类是如何学习的

监督学习(Supervised Learning)

监督学习是什么呢?

下面我们用一个房价的例子来介绍下监督学习,如下所示:

即通过给出房子面积和房价的一些数据,来预测一个新的房子面积所能卖出的房价。

所以,监督学习是指给出标记的数据集,并且已知输入和输出的关系,然后计算一个模型,可以对新的输入预测对应的输出结果。

监督学习分为两类问题,分别是回归问题和分类问题。回归问题的输出是一个连续值,比如在预测房价这个例子中,预测房价是一个回归问题,其结果是连续值。而分类问题是得到一个离散值的输出,比如同样是预测房价的例子,如果问题从预测卖出的房价变成卖出的房价是偏高还是偏低,就是属于分类问题,因为其答案可以用 0 或 1 表示高了或者低了。

课程中给出另一个例子说明分类问题,如下图所示:

问题是假设预测一个乳腺癌是否是恶性的,图中坐标轴横轴表示肿瘤的大小,纵轴表示病人的年龄,以 O 表示良性肿瘤,以X表示恶性肿瘤。所以问题就是判断是良性还是恶性肿瘤,这就是一个分类问题。

非监督学习(Unsupervised Learning)

在监督学习中,无论是回归问题还是分类问题,数据集都有一个明确的结果。

但非监督学习中,数据并没有一个结果,有的只是特征,即非监督学习要解决的问题是这些数据是否可以分成不同的组。

因此,非监督学习中典型的例子就是聚类问题。例如对一个大型的数据中心的网络传输数据情况进行分析,发现那些多数时候是在协作的计算机。

课程小结

这是第一节课程的内容,主要介绍了机器学习是什么,以及机器学习的两大学习问题–监督学习和非监督学习。

本节课程比较简单,但介绍的内容还是很重要的,后面介绍的大多数机器学习算法都属于监督学习或者非监督学习,当然实际上机器学习还不只有这两种学习问题,比如最近一两年开始热门起来的强化学习问题,以及半监督学习问题,但在吴恩达老师这门入门课程中并不会介绍这些内容。

欢迎关注我的公众号,一起交流,学习和进步!

这里写图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/409103.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

cellet 的相关线程

cellet启动了两个进程,分别是cellet-resource和cellet进程,这两个进程分别启动了一系列的线程: cellet-resource: StartExecutorReceiver ResourceInfoSender ExecutorControlReceiver 这个进程启动上述线程之后就会监控,是否其子…

mysql执行过程五步_简单五步教你搭建MySQL主从复制

环境主机:172.17.0.2从机:172.17.0.3环境:CentOS7MySQL:5.6.38目标:实现主机172.17.0.2到从机172.17.0.3基于Binlog的主从复制目前MySQL提供两种方式主从复制:基于Binlog(我们此篇就是基于Binlog的主从复制…

[机器学习笔记] Note2--单变量线性回归

继续是机器学习课程的笔记,这节介绍的是单变量线性回归算法,线性回归算法也是一个比较基础的算法。 模型表达 首先是以房屋交易问题为例,假设我们回归问题的训练集如下表所示: Size in feet2feet2(x)Price($) in 1000’s (y)21…

css格式化文本

选择字体 font-family: "Times New Roman", Times, serif; 注意:字体名称中包含多个单词要用("")括起来。 字体颜色 color:#cccccc(16进制) color: rgb(0%, 100%, 0%) 或者 color: rbg(0, 255, 0) rgb颜色,百分数表示0-2…

[线性代数]Note 1--方程组的几何解释

这是记录麻省理工学院公开课:线性代数的笔记,网址是麻省理工公开课:线性代数 第一节课说的是有关方程组的几何解释。网址是方程组的几何解释 首先是介绍方程组的几何解释,提出可以用矩阵表示,然后矩阵表示有两种表达方…

linux打印mysql堆栈_第25问:MySQL 崩溃了,打印了一些堆栈信息,怎么读?

问题在 09 问中,我们开启了 coredump 功能,在 MySQL 崩溃时获得了有用的 coredump 信息。那如果没开启 coredump,仅有 error log 中的堆栈信息,我们如何分析有效的信息?实验我们沿用 09 问中的 MySQL 崩溃的场景&#…

winform中treeview控件实现部分节点显示checkbox

用过asp.net的应该知道,要在treeview中实现上述功能可以使用ShowCheckBox 属性指定那些节点显示checkbox哪些不显示,可是winform中的treeview只提供一个ShowCheckBoxes 属性,要么全部节点显示checkbox,要不全部不显示,而指定节点没…

[机器学习笔记] Note3--多变量线性回归

继续是机器学习课程的笔记,这节课介绍的是多变量的线性回归。 多变量线性回归 多维特征 上节课介绍的是单变量的线性回归,这节课则是进一步介绍多变量的线性回归方法。 现在假设在房屋问题中增加更多的特征,例如房间数,楼层等…

mysql主键long_MySQL主键设计

[TOC]在项目过程中遇到一个看似极为基础的问题,但是在深入思考后还是引出了不少问题,觉得有必要把这一学习过程进行记录。MySQL主键设计原则MySQL主键应当是对用户没有意义的。MySQL主键应该是单列的,以便提高连接和筛选操作的效率永远也不要…

linux 常用工具

sqlitebrowser sudo apt-get install sqlitebrowser 转载于:https://www.cnblogs.com/xxhong/archive/2013/03/01/2938585.html

[机器学习笔记] Note4--逻辑回归

继续是机器学习课程的笔记,这节课会介绍逻辑回归。 分类问题 这节课会介绍的是分类问题,其结果是离散值。分类问题的例子有判断电子邮件是否是垃圾邮件;判断肿瘤是良性还是恶性;判断一次金融交易是否是欺诈等等。 首先从二元的…

华为日历怎么显示一月_华为手机日历怎么设置

大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答。设置华为手机日历的方法:1、打开“时钟”,点击右下角的设置;2、点击“日期和时间”;3、关闭“自动确定日期和时间”和“自动确定时区”…

javascript中children和childNodes的区别

javascript中children和childNodes的区别 1、childNodes:它是标准属性,它返回指定元素的子元素集合,包括HTML节点,所有属性,文本节点。 可以通过nodeType来判断是哪种类型的节点,只有当nodeType1时才是元素…

java容器集合类的区别用法_Java容器笔记(二):不同集合实现类的特点与区别...

package java.util包中的Collection相关接口和类如下图:Collection.png仅讨论Java.util包中的常见集合类,不涉及java.util的子包concurrent中的并发集合类。可以这样简单的来对待容器中集合:Collection_common.png1、 List、Set、Queue三个接…