机器学习笔记(五):逻辑回归

目录

1)Classification

2)Hypothesis Representation

3)Decision boundary

4)Cost function

5)Simplified cost function and gradient descent

6)Multi-class classification:One-vs-all

7)参考资料


现在我们开始学习逻辑回归算法,这是一个分类算法,很多人也把它看做机器学习算法的 Hello world!

1)Classification

在分类问题中,我们要预测的变量 y 是离散的值,我们预测的结果是否属于一个类,以下是几种常见的分类例子:

我们从二元的分类问题开始,我们将因变量可能属于的两个类分别称为 负向类和正向类。其中0表示负向类,1表示正向类。如下图所示,当预测值超过0.5时,预测为正,小于0.5是预测为负。

在线性回归中,我们预测值 y 既可能大于1也可能小于0,但在逻辑回归中我们希望输出值在0到1之间要提醒的是,虽然这叫做逻辑回归算法,但是它是分类算法,不是回归算法。

2)Hypothesis Representation

前面提到,我们希望预测值在0到1之间,但我们怎么做到呢?我们介绍一种逻辑函数:Sigmoid function。这也是我们遇到的第一个激活函数,在深度学习中,我们会遇到很多激活函数,不着急,后面遇到我们再介绍。图中 g(z)为我们的逻辑函数,右侧为它的图像,它的取值范围永远在0到1之间。g(z) 函数里的因变量为我们线性回归函数的输出值,我们只是把线性输出变成非线性输出。

我们来解释一下逻辑函数的作用,如下图它表示的是 根据选择的参数输出变量为1的可能性

3)Decision boundary

来回顾一下我们之前的假设,由 g(z) 函数图像可知,如果希望预测为1,则输入值大于等于0,反之小于0,如图所示:

我们来看两个例子,下图介绍了当希望预测为1时对应的数据集判定边界。下图对应的判定边界为一条直线,直线上方的数据判定为1,下方的数据判定为0。

下图为一个复杂的判定边界,边界为半径1的圆,圆内的判定为0,圆外侧的判定为1,这已经有点SVM核函数的概念了,我们后面会介绍到。

4)Cost function

对于任何机器学习算法,我们都要学到它对应的代价函数,回想一下,线性回归模型中,代价函数是所有模型误差的平方和。但是我们在对逻辑函数定义代价函数时,要找到使得代价函数为凸函数的函数。这里直接给出结论,如图所示,

5)Simplified cost function and gradient descent

我们来回顾一下我们之前定义的代价函数和成本函数。

我们的目标是使成本函数最小。

我们还是使用梯度下降法,但你会发现,逻辑回归梯度下降法求得的公式和线性回归函数的形式上一模一样。但要注意的是,这里的预测函数h_{\theta}(x)是不一样的,逻辑回归里多了一个逻辑函数因为它要求输出值在0到1之间

6)Multi-class classification:One-vs-all

我们前面介绍的都是二元分类,这里我们介绍多分类问题:

多分类问题,我们可以训练多个分类器,预测每一个分类器的输出值,以最大输出值对应的分类为它的预测值

7)参考资料:

资料为网易云课堂吴恩达老师的课件。

吴恩达机器学习 - 网易云课堂

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/440124.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

xrdp完美实现Windows远程访问Ubuntu 16.04

前言: 在很多场景下,我们需要远程连接到Linux服务器(本文是Ubuntu),传统的连接主要分为两种。 第一种:通过SSH服务(使用xshell等工具)来远程访问,编写终端命令,不过这个是无界面的&a…

机器学习笔记(六):正则化

目录 1)The problem of overfitting 2)Cost function 3)Regularized linear regression 4)Regularized logistic regression 我们已经学习了线性回归和逻辑回归算法,已经可以有效解决很多问题,但是在实…

Hbase单节点安装

zookeeper单节点部署 实验环境 操作系统:Ubuntu 16.04 Hadoop:Hadoop 2.7.5 Zookeeper:zookeeper 3.4.12 Java:java version 1.8.0 到/install-package目录下查看hbase安装包 #>ls /install-package本文中用的是hbase-1…

机器学习笔记(七):神经网络:表示

目录 1)Non-linear hypotheses 2)Model representation 1 3)Model representation 2 4)Examples and intuitions 1 5)Examples and intuitions 2 6)Multi-class classification 1)Non-lin…

ROS入门_1.10 理解ROS服务和参数

目录 ROS Services使用rosservice rosservice listrosservice typerosservice call Using rosparam rosparam listrosparam set and rosparam getrosparam dump and rosparam load 本教程假设从前一教程启动的turtlesim_node仍在运行,现在我们来看看turtlesim提供了…

1.Introduction and Evaluation

感谢七月在线罗老师和吴同学! 最近报了七月在线的《推荐系统实战》班,根据上课资料和思维导图整理了这篇笔记! 1)推荐系统介绍 思维导图如下,其中需要掌握的是推荐系统存在的前提:信息过载和用户需求不明…

【ZOJ - 2968 】Difference Game (贪心,思维模拟)

题干: Now you are going to play an interesting game. In this game, you are given two groups of distinct integers and C coins. The two groups, named Ga and Gbrespectively, are not empty and contain the same number of integers at first. Each time…

使用 rqt_console 和 roslaunch

Description:本教程介绍如何使用 rqt_console 和 rqt_logger_level 进行调试,以及如何使用 roslaunch 同时运行多个节点。早期版本中的 rqt 工具并不完善,因此,如果你使用的是“ROS fuerte”或更早期的版本,请同时参考 这个页面 学…

机器学习必备宝典-《统计学习方法》的python代码实现、电子书及课件

本文转自微信公众号:机器学习初学者 原创: 机器学习初学者 机器学习初学者 6天前 《统计学习方法》可以说是机器学习的入门宝典,许多机器学习培训班、互联网企业的面试、笔试题目,很多都参考这本书。本站根据网上资料用python复现…

【2019牛客暑期多校训练营(第一场) - H】XOR(线性基,期望的线性性)

题干: 链接:https://ac.nowcoder.com/acm/contest/881/H 来源:牛客网 Bobo has a set A of n integers a1,a2,…,ana1,a2,…,an. He wants to know the sum of sizes for all subsets of A whose xor sum is zero modulo (1097)(1097). F…

机器学习入门必备的13张“小抄”(附下载)

目录 1)TensorFlow 2)Keras 3)Neural Networks 4)Numpy 5)Scipy 6)Pandas 7)Scikit-learn 8)Matplotlib 9)PythonForDataScience 最近在github上发现了很有用的…

吴恩达机器学习作业(1):线性回归

目录 1)导入相关库和数据 2)代价函数 3)批量梯度下降 4)绘制线性模型 前阵子在网易云课堂学习了吴恩达老师的机器学习课程,今天结合网上资料,用Python实现了线性回归作业,共勉。建议大家使…

ROS导航之参数配置和自适应蒙特卡罗定位

我们的机器人使用两种导航算法在地图中移动:全局导航(global)和局部导航(local)。这些导航算法通过代价地图来处理地图中的各种信息,导航stack使用两种costmaps http://www.cnblogs.com/zjiaxing/p/5543386.html存储环…

吴恩达机器学习作业(2):多元线性回归

目录 1)数据处理 2)代价函数 3)Scikit-learn训练数据集 4)正规方程 练习1还包括一个房屋价格数据集,其中有2个变量(房子的大小,卧室的数量)和目标(房子的价格&#…

机器学习笔记(八):神经网络:学习

目录 1)Cost function 2)Backpropagation algorithm 3)Backpropagation intuition 4) Gradient checking 5)Random initialization 6)Putting it together 注:吴恩达老师的机器学习课程对反向传播算…

吴恩达机器学习作业(3):逻辑回归

目录 1)数据处理 2)sigmoid函数 3)代价函数 4)梯度下降 5)预测函数 我们首先做一个练习,问题是这样的:设想你是大学相关部分的管理者,想通过申请学生两次测试的评分&#xff0c…

机器学习笔记(九):应用机器学习的建议

目录 1)Deciding what to try next 2)Evaluating a hypothesis 3)Model selection and training/validation/test sets 4)Diagnosing bias vs. variance 5)Regularization and bias/variance 6)Learn…

【洛谷 - P1231 】教辅的组成(网络流最大流,拆点)

题干: 题目描述 蒟蒻HansBug在一本语文书里面发现了一本答案,然而他却明明记得这书应该还包含一份练习题。然而出现在他眼前的书多得数不胜数,其中有书,有答案,有练习册。已知一个完整的书册均应该包含且仅包含一本书…

机器学习笔记(十):机器学习系统的设计

目录 1)Prioritizing what to work on:Spam classification example 2)Error analysis 3)Error metrics for skewed classes 4)Trading off precision and recall 5)Data for machine learning 下面将学习到在构建…

【洛谷 - P1345 [USACO5.4]】奶牛的电信(网络流最小割,拆点)

题干: 题目描述 农夫约翰的奶牛们喜欢通过电邮保持联系,于是她们建立了一个奶牛电脑网络,以便互相交流。这些机器用如下的方式发送电邮:如果存在一个由c台电脑组成的序列a1,a2,...,a(c),且a1与a2相连,a2与…