吴恩达《机器学习》学习笔记一——初识机器学习

吴恩达《机器学习》学习笔记一

  • 一、 什么是机器学习?
  • 二、监督学习
  • 三、无监督学习

初识机器学习
这是个人学习吴恩达《机器学习》课程的一些笔记,供自己和大家学习提升。第一篇内容较少,日后继续加油。

课程链接:https://www.bilibili.com/video/BV164411b7dx?from=search&seid=5329376196520099118

一、 什么是机器学习?

机器学习一直没有一个官方固定的定义。但课中给出了两种解释,个人认为非常经典,易于理解。

定义一:Field of study that gives computers the ability to learn without being explicitly programmed.—— Arthur Samuel(1959) 即无需明确编程,就使得计算机有学习能力的研究领域。

值得一提的是,阿瑟.塞缪尔(Arthur Samuel)在此之前(1952年)研发出了第一个计算机跳棋程序,它是世界上第一个可以自主学习的程序。通过和该跳棋程序不断的下棋,使得该程序的跳棋技巧不断得到提升,最终甚至超过了人类水平,这是机器学习早期一个非常经典的案例。
跳棋示意图
定义二:A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. 即计算机程序从经验E上学习来处理任务T,且P为性能评估,如果在T上,由P衡量的性能随着经验E的学习而提高,这就是机器学习。

下面看一个课中给出的定义二的例子:
机器学习定义二举例
这是一个邮件分类问题,基于已知邮件是否为垃圾邮件的信息,来优化邮件分类系统。此处选项一:把邮件分类为垃圾或正常邮件是机器学习的T;选项二:观察你标记的邮件是垃圾还是正常是机器学习的E;选项三:正确分类邮件的数量是机器学习的P。

此外,机器学习有其分类,主要分为如下三类:

机器学习分类具体算法举例
监督学习线性回归、SVM、决策树等
无监督学习聚类、密度估计等
其他:强化学习、推荐系统等-待学习-

所以下面分别讨论了基本的监督学习和无监督学习。

二、监督学习

监督学习的特点是,学习数据都是有标注的。如经典的房价预测案例,它的数据集中数据样本不仅给出了各自的属性值,还给出了具体的房价大小,而这个房价大小就是所谓的标注,也就是需要预测的属性,模型从带有标注的数据中学习,随后对新的数据预测其标签值。如下图所示是房价预测的一个示例。
房价预测案例
图中为简单起见,只考虑了房子的一个属性:面积(feet2),而实际还需要考虑很多其他属性如:朝向、地段等。红色的×表示已知的一批带有标注的数据,要从这些数据中学习得一种模型,使得后续预测的值比较真实,红色的直线是一次函数模型,蓝色的曲线是更复杂的模型,目标都是尽可能地模拟所有数据模型选择的好坏,也会对预测有很大的影响(此处蓝色的模型看起来要比红色的好)。若已得到一个模型,则新给出一个输入如:房屋面积为750feet2,根据模型则可以得到预测房价为多少。

此外,房价预测也是回归问题的一个实例,所谓回归,就是预测值是连续值,此处房价是一个连续值,所以是一个回归问题。
与此对应,若预测值是离散的,则被称为分类问题,如上述提到的邮件分类,预测值只有垃圾邮件和正常邮件两个值。如下图所示,是根据肿瘤尺寸这个属性来对乳腺肿瘤进行分类的数据,标签值只有0(良性)和1(恶性)两种。
乳腺肿瘤分类
往往不止通过一个属性进行学习,还可能通过细胞尺寸均匀度、细胞形状均匀度、患者年龄等许多属性来进行学习。
多属性数据的分类问题

三、无监督学习

无监督学习与监督学习相对,当学习数据不带有标签时,就可以看成是无监督学习,也可以理解为没有正确答案的学习。无监督学习在做的,更多的是找出数据之间的相似相关性。如下图所示,x1和x2是数据的两个属性,数据不带有标签,无监督学习会寻找数据之间的相似性,将无标注的数据划分为一个个的簇。
无监督学习示例

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/491781.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

院士张钹:AI奇迹短期难再现 深度学习技术潜力已近天花板

来源:软件定义世界(SDX)在Alphago与韩国围棋选手李世石对战获胜三年过后,一些迹象逐渐显现,张钹院士认为到了一个合适的时点,并接受了此次的专访。张钹,计算机科学与技术专家,俄罗斯…

吴恩达《机器学习》学习笔记二——单变量线性回归

吴恩达《机器学习》学习笔记二——单变量线性回归一、 模型描述二、 代价函数1.代价函数和目标函数的引出2.代价函数的理解(单变量)3.代价函数的理解(两个参数)三、 梯度下降——求解最优参数1.梯度下降的步骤2.梯度下降的数学表达…

吴恩达《机器学习》学习笔记三——多变量线性回归

吴恩达《机器学习》学习笔记三——多变量线性回归一、 多元线性回归问题介绍1.一些定义2.假设函数二、 多元梯度下降法1. 梯度下降法实用技巧:特征缩放2. 梯度下降法的学习率三、 特征选择与多项式回归四、 正规方程法1. 一些定义2. 正规方程解的公式3. 梯度下降法和…

五大核心构成的AIoT,正在遭遇三大挑战,两条突破口外还有什么?

来源:物联网智库随着IoT与AI逐步走向融合,AIoT正将以全新的方式改变人们的生活。一、新业务需求近年来,物联网呈现突飞猛进的发展态势。根据中商情报网的数据,2018年全球物联网设备已经达到70亿台;到2020年&#xff0c…

机器学习中防止过拟合的方法总结

来自机器学习成长之路公众号 在对模型进行训练时,有可能遇到训练数据不够,即训练数据无法对整个数据的分布进行估计的时候,或者在对模型进行过度训练(overtraining)时,常常会导致模型的过拟合(…

吴恩达《机器学习》学习笔记四——单变量线性回归(梯度下降法)代码

吴恩达《机器学习》学习笔记四——单变量线性回归(梯度下降法)代码一、问题介绍二、解决过程及代码讲解三、函数解释1. pandas.read_csv()函数2. DataFrame.head()函数3. Dataframe.insert()函数课程链接: https://www.bilibili.com/video/BV…

从IoT World 2019看全球IoT九大发展趋势

来源:全球物联网观察美国时间5月14日,IoT World2019在美国硅谷圣克拉拉会议中心举行,今年的主题是“工业与IOT的交互”,从大会主题演讲内容和现场产品展示来看,随着5G的商用和人工智能技术的大面积落地,IoT…

美国一箭投放60颗卫星 马斯克组互联网“星链”

来源:新华网美国太空探索公司当地时间23日晚在美国佛罗里达州一处空军基地发射火箭,将60颗小卫星送入近地轨道。这标志着企业家埃隆马斯克组建互联网卫星群的“星链”项目迈出实质性一步,抢在电子商务巨头亚马逊公司创始人杰夫贝索斯的“柯伊…

吴恩达《机器学习》学习笔记五——逻辑回归

吴恩达《机器学习》学习笔记五——逻辑回归一、 分类(classification)1.定义2.阈值二、 逻辑(logistic)回归假设函数1.假设的表达式2.假设表达式的意义3.决策界限三、 代价函数1.平方误差函数的问题2.logistic回归的代价函数四、梯…

协方差与相关系数

定义: 协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。 期望值分别为E[X]与E[Y]的两个实随机变量X与Y之间的协方差Cov(X,Y)定义为: 如果两个变量的变化趋势一致,也就是说如果其中一…

吴恩达《机器学习》学习笔记六——过拟合与正则化

吴恩达《机器学习》学习笔记六——过拟合与正则化一、 过拟合问题1.线性回归过拟合问题2.逻辑回归过拟合问题3.过拟合的解决二、 正则化后的代价函数1.正则化思想2.实际使用的正则化三、 正则化的线性回归1.梯度下降的情况2.正规方程的情况四、 正则化的逻辑回归1.梯度下降的情…

5G时代,智能工厂迎来4大改变!

来源:亿欧网作为新一代移动通信技术,5G技术切合了传统制造企业智能制造转型对无线网络的应用需求,能满足工业环境下设备互联和远程交互应用需求。在物联网、工业自动化控制、物流追踪、工业AR、云化机器人等工业应用领域,5G技术起…

主成分分析PCA以及特征值和特征向量的意义

定义: 主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。PCA的思想是将n维特征映射到k维上…

吴恩达《机器学习》学习笔记七——逻辑回归(二分类)代码

吴恩达《机器学习》学习笔记七——逻辑回归(二分类)代码一、无正则项的逻辑回归1.问题描述2.导入模块3.准备数据4.假设函数5.代价函数6.梯度下降7.拟合参数8.用训练集预测和验证9.寻找决策边界二、正则化逻辑回归1.准备数据2.特征映射3.正则化代价函数4.…

从认知学到进化论,详述强化学习两大最新突破

来源:大数据文摘深层强化学习(deep RL)近年来在人工智能方面取得了令人瞩目的进步,在Atari游戏、围棋及无限制扑克等领域战胜了人类。通过将表征学习与奖励驱动行为相结合,深层强化学习又引发了心理学和神经科学领域的…

吴恩达《机器学习》学习笔记九——神经网络相关(1)

吴恩达《机器学习》学习笔记九——神经网络相关(1)一、 非线性假设的问题二、 神经网络相关知识1.神经网络的大致历史2.神经网络的表示3.前向传播:向量化表示三、 例子与直觉理解1.问题描述:异或XOR、同或XNOR2.单个神经元如何计算…

刚刚,科学家发现了一大堆解释人类进化的基因...

图片来源:《Nature Genetics》来源:中国生物技术网 5月27日发表在《Nature Genetics》上的一项新研究发现, 以前被认为在不同生物体中具有相似作用的数十种基因,实际上是人类独有的, 这或许有助于解释我们这个物种是如…

吴恩达《机器学习》学习笔记八——逻辑回归(多分类)代码

吴恩达《机器学习》笔记八——逻辑回归(多分类)代码导入模块及加载数据sigmoid函数与假设函数代价函数梯度下降一对多分类预测验证课程链接:https://www.bilibili.com/video/BV164411b7dx?fromsearch&seid5329376196520099118 之前笔记…

DeepMind 综述深度强化学习:智能体和人类相似度竟然如此高!

来源:AI科技评论近年来,深度强化学习(Deep reinforcement learning)方法在人工智能方面取得了瞩目的成就,从 Atari 游戏、到围棋、再到无限制扑克等领域,AI 的表现都大大超越了专业选手,这一进展…

吴恩达《机器学习》学习笔记十——神经网络相关(2)

吴恩达《机器学习》学习笔记十——神经网络相关(2)一、 代价函数二、 反向传播算法三、 理解反向传播算法四、 梯度检测五、 随机初始化1.全部初始化为0的问题2.随机初始化的思想六、 神经网络算法整体流程1.选择网络具体架构2.训练神经网络课程链接&…