[机器学习笔记] Note1--机器学习简介

阅读本文大约需要 2 分钟

本文结构:

      • 什么是机器学习
      • 监督学习(Supervised Learning)
      • 非监督学习(Unsupervised Learning)
      • 课程小结

这是学习 Andrew Ng 在 Coursea 上的机器学习课程所做的笔记。

什么是机器学习

对于机器学习,并没有一个一致认同的定义,一个比较古老的定义是由Arthur Samuel在 1959 年给出的:

机器学习研究的是如何赋予计算机在没有被明确编程的情况下仍能够学习的能力。(Field of study that fives computers the ability to learn without being explicily programmed.)

随后他编写了一个跳棋游戏的程序,并且让这个程序和其自身玩了几万局跳棋游戏,并且记录下来棋盘上的什么位置可能会导致怎样的结果,随着时间的推移,计算机学会了棋盘上的哪些位置可能会导致胜利,并且最终战胜了设计程序的 Samuel。

另一个比较现代且形式化的定义是由Tom Mitchell在 1998 年给出的:

对于某个任务T和表现的衡量P,当计算机程序在任务T的表现上,经过P的衡量,随着经验E而增长,我们便称计算机程序能够通过经验E来学习该任务。

在上述的跳棋游戏的例子中,任务 T 是玩跳棋游戏,P 是游戏的输赢,而经验E 则是一局局的游戏。

一些机器学习的应用例子:

  • 数据挖掘
  • 一些无法通过手动编程来编写的应用:如自然语言处理,计算机视觉
  • 一些自助式的程序:如推荐系统
  • 理解人类是如何学习的

监督学习(Supervised Learning)

监督学习是什么呢?

下面我们用一个房价的例子来介绍下监督学习,如下所示:

即通过给出房子面积和房价的一些数据,来预测一个新的房子面积所能卖出的房价。

所以,监督学习是指给出标记的数据集,并且已知输入和输出的关系,然后计算一个模型,可以对新的输入预测对应的输出结果。

监督学习分为两类问题,分别是回归问题和分类问题。回归问题的输出是一个连续值,比如在预测房价这个例子中,预测房价是一个回归问题,其结果是连续值。而分类问题是得到一个离散值的输出,比如同样是预测房价的例子,如果问题从预测卖出的房价变成卖出的房价是偏高还是偏低,就是属于分类问题,因为其答案可以用 0 或 1 表示高了或者低了。

课程中给出另一个例子说明分类问题,如下图所示:

问题是假设预测一个乳腺癌是否是恶性的,图中坐标轴横轴表示肿瘤的大小,纵轴表示病人的年龄,以 O 表示良性肿瘤,以X表示恶性肿瘤。所以问题就是判断是良性还是恶性肿瘤,这就是一个分类问题。

非监督学习(Unsupervised Learning)

在监督学习中,无论是回归问题还是分类问题,数据集都有一个明确的结果。

但非监督学习中,数据并没有一个结果,有的只是特征,即非监督学习要解决的问题是这些数据是否可以分成不同的组。

因此,非监督学习中典型的例子就是聚类问题。例如对一个大型的数据中心的网络传输数据情况进行分析,发现那些多数时候是在协作的计算机。

课程小结

这是第一节课程的内容,主要介绍了机器学习是什么,以及机器学习的两大学习问题–监督学习和非监督学习。

本节课程比较简单,但介绍的内容还是很重要的,后面介绍的大多数机器学习算法都属于监督学习或者非监督学习,当然实际上机器学习还不只有这两种学习问题,比如最近一两年开始热门起来的强化学习问题,以及半监督学习问题,但在吴恩达老师这门入门课程中并不会介绍这些内容。

欢迎关注我的公众号,一起交流,学习和进步!

这里写图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/409103.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql执行过程五步_简单五步教你搭建MySQL主从复制

环境主机:172.17.0.2从机:172.17.0.3环境:CentOS7MySQL:5.6.38目标:实现主机172.17.0.2到从机172.17.0.3基于Binlog的主从复制目前MySQL提供两种方式主从复制:基于Binlog(我们此篇就是基于Binlog的主从复制…

[机器学习笔记] Note2--单变量线性回归

继续是机器学习课程的笔记,这节介绍的是单变量线性回归算法,线性回归算法也是一个比较基础的算法。 模型表达 首先是以房屋交易问题为例,假设我们回归问题的训练集如下表所示: Size in feet2feet2(x)Price($) in 1000’s (y)21…

linux打印mysql堆栈_第25问:MySQL 崩溃了,打印了一些堆栈信息,怎么读?

问题在 09 问中,我们开启了 coredump 功能,在 MySQL 崩溃时获得了有用的 coredump 信息。那如果没开启 coredump,仅有 error log 中的堆栈信息,我们如何分析有效的信息?实验我们沿用 09 问中的 MySQL 崩溃的场景&#…

[机器学习笔记] Note3--多变量线性回归

继续是机器学习课程的笔记,这节课介绍的是多变量的线性回归。 多变量线性回归 多维特征 上节课介绍的是单变量的线性回归,这节课则是进一步介绍多变量的线性回归方法。 现在假设在房屋问题中增加更多的特征,例如房间数,楼层等…

mysql主键long_MySQL主键设计

[TOC]在项目过程中遇到一个看似极为基础的问题,但是在深入思考后还是引出了不少问题,觉得有必要把这一学习过程进行记录。MySQL主键设计原则MySQL主键应当是对用户没有意义的。MySQL主键应该是单列的,以便提高连接和筛选操作的效率永远也不要…

[机器学习笔记] Note4--逻辑回归

继续是机器学习课程的笔记,这节课会介绍逻辑回归。 分类问题 这节课会介绍的是分类问题,其结果是离散值。分类问题的例子有判断电子邮件是否是垃圾邮件;判断肿瘤是良性还是恶性;判断一次金融交易是否是欺诈等等。 首先从二元的…

java容器集合类的区别用法_Java容器笔记(二):不同集合实现类的特点与区别...

package java.util包中的Collection相关接口和类如下图:Collection.png仅讨论Java.util包中的常见集合类,不涉及java.util的子包concurrent中的并发集合类。可以这样简单的来对待容器中集合:Collection_common.png1、 List、Set、Queue三个接…

[机器学习笔记]Note5--归一化

继续是机器学习课程的笔记,这节课会介绍归一化的内容。 过拟合问题 这节课会介绍一个在机器学习过程中经常会遇到的问题–过拟合。通常,当我们有非常多的特征,我们可以学习得到的假设可能非常好地适应训练集,即代价函数可能几乎…

combobox的联动练习

老师的项目中,网站右上有四个联动的combobox,今天第一次尝试解决。外观如图: 首先第一次登陆系统时,需要分别载入4个框中的数据。通过easyui-combobox的url 属性请求php返回json数据即可,json中的value是名称&#xff…

[机器学习笔记]Note6--神经网络:表达

继续是机器学习课程的笔记,这节课会介绍神经网络的内容。 非线性假设 在之前的课程中,我们看到使用非线性的多项式能够帮助我们建立更好的分类模型。假设我们有非常多的特征,例如100个变量,我们希望用这100个特征来构建一个非线…

[机器学习笔记]Note7--神经网络:学习

继续是机器学习课程的笔记,这节课会继续介绍神经网络的内容,上一节主要是基本的介绍,以及模型表示,而本节会介绍代价函数,反向传播算法等。 神经网络代价函数 首先是有如下一个神经网络,这里将首先介绍一些…