吴恩达机器学习笔记(二) —— Logistic回归

 

主要内容:

一.回归与分类

二.Logistic模型即sigmoid function

三.decision boundary 决策边界

四.cost function 代价函数

五.梯度下降

六.自带求解函数

七.多分类问题

 

 

一.回归与分类

回归:用于预测,输出值是连续型的。例如根据房子的大小预测房子的价格,其价格就是一个连续型的数。

分类:用于判别类型,输出值是离散型的(或者可以理解为枚举型,其所有的输出值是有限的且已知的),例如根据肿瘤的大小判断其是恶行肿瘤还是良性肿瘤,其输出值就是0或1。

 

二.Logistic模型即sigmoid function

1.logistic模型可很好地应用于分类问题上,它可以解决二分类以及多分类问题。其基础是利用sigmoid function进行二分类。

sigmoid function:

其图像如下:

可以看得出,g(z)的至于为(0,1),且当z<-2.5时,g(z)非常接近0;当z>2.5时,g(z)非常接近1。因此该函数非常适用于做二分类。

2.为了将其应用到二分类问题上,需要对其做一下变形:

即:

(从讲义中直接截图的,把hΘ(x)改成hΘ(z)就对了)

其中,hΘ(z)的值就是y=1(y表示输出值是哪一类)的概率,1-hΘ(z)就是y=0的概率。

当hΘ(z)>=0.5时,可断定y=1;当hΘ(z)<0.5时,可断定y=0。

 

三.decision boundary 决策边界

1.我们知道了当hΘ(z)>=0.5时,y=1;当hΘ(z)<0.5时,y=0。那怎么判断hΘ(z)的值是大于还是小于0.5呢?

可知,当hΘ(z)>=0.5时,z>=0; hΘ(z)<0.5时, z<0。

由于z = Θ'x,所以:当hΘ(z)>=0.5时,Θ'x>=0; hΘ(z)<0.5时, Θ'x<0。

所以我们最主要的工作就是判断Θ'x是大于0还是小于0,而由于Θ'x的值决定着不同的类别,因此,函数 f(x) = Θ'x 也就成为了划分两个不同类别的分界线(或者叫超平面,因为可以是多维的)。

2.看以下例子:

这里的z即f(x) = x1+x2-3,当f(x)>=0时,即 位于直线上面的那一部分属于类别1,位于直线下面的那一部分为类别0。

此例子的决策边际是线性的,但还可以是非线性的,如下:

决策边界为 f(x) = x1^2 + x2^2 - 1,即一个单位圆。当f(x)>=0时,即在圆以外的部分属于类别1;当f(x)<0,在圆以内的部分为类别0。

上面介绍的两个例子都是只有两个属性,即x1和x2,当属性为三个或者更多时,决策边界就为一个平面或者是超平面,总之能把空间一分为二就行了。

3.综上:z = 0即为决策边界,位于z>0一边的为类别1,位于z<0一边的为类别0。

 

 

四.cost function 代价函数

明白了决策边界是怎么工作,之后就是最重要的就是找出决策边界,也就是通过学习,得出参数Θ(其中特征x需要预先对数据进行判断,然后再选择合适的类型,就如上面圆的那个例子,或者说把所有参数的组合都列出来)。

整理一下接下来的工作:

1.选择的模型为:

 

2.通过数据集,训练出Θ。

所以,就要确定一下这个模型的代价函数了:

其图像为:

            

可知,当hΘ(x)-->0,但实际值y=1时,代价接近无穷大;当hΘ(x)-->1时,实际值y=1时,代价接近0。即判断错误的代价很高,而判断正确的代价几乎为0,所以作为代价函数是很合适的。

其中,我们可以把y=0和y=1的两种情况合并到一条公式当中:

所以,整体的代价函数为:

将其向量化:

 

 

五.梯度下降

有了代价函数J(Θ)之后,就可以用梯度下降来求出Θ了。

迭代的伪代码:

,即:

 向量化后:

这里有个高数的问题,对J(Θ)求导貌似不太直观,那就动手试一试:

 

 

六.自带求解函数

用法如下:

需要自己实现costFunction函数,其中(t)的意思是:costFunction中参数t是initial_theta,即把initial_theta带入到t中。

其返回值为求出的解,即最优解theta和在此条件下的损失值。

(这个函数没用过,不太清楚,日后再尝试一下)

 

七.多分类问题

当类别多于两个时,仍然可以使用logistic回归对其进行分类,这种方法就是:One-vs-all,俗称“一对多”。

思路:枚举每一种类别,找出其与剩下类别的决策边界,即通过数据集,训练出每一类别与其他类别的hΘ(x)函数。假如用n+1个类别,就用n+1个hΘ(x)函数。当输入一个x时,就将其带入带每一个hΘ(x)函数中,取最大值的那个函数,就是x所对应的分类。

如下:

(训练出n+1个hΘ(x)函数)

(概率最大的那个,便是它所在的分类)

 

转载于:https://www.cnblogs.com/DOLFAMINGO/p/9304992.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/570640.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

弹出选择文件夹的对话框 BROWSEINFO 的用法【MFC】

以下是在vs2008中编译通过的代码&#xff0c;代码注释详细。要实现的功能是点击“浏览”按钮&#xff0c;即弹出选择文件夹的对话框。并将选择的文件夹或文件路径显示在MessageBox中。 void CMFC_TrojanKillerDlg::OnBnClickedButton1() {// TODO: 在此添加控件通知处理程序代码…

HDU 3709 Balanced Number(数位DP)题解

思路&#xff1a; 之前想直接开左右两边的数结果爆内存... 枚举每次pivot的位置&#xff0c;然后数位DP&#xff0c;如果sum<0返回0&#xff0c;因为已经小于零说明已经到了pivot右边&#xff0c;继续dfs只会越来越小&#xff0c;且dp数组会炸 注意一下一些细节&#xff1a;…

regini.exe使用方法

创建一个名称test 类型reg_dword 数据1 如果是只有那会默认以类型reg_sz创建 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Run\ys test reg_dword 1 2。注册表键数值 [更改的权限] 例如: HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Run…

不断的感悟、不断的学习、不断的成长

学习思想、勤于实践 学习目的、看靶放箭 学习总结、不断提升 --------------------------------------------------------------------------------------------------------------                        爱学习、勤学习 爱看书、勤看书       …

汇编指令大全

[数据传送指令] 一、通用数据传送指令 1、传送指令 MOV (move) 指令的汇编格式&#xff1a;MOV DST,SRC 指令的基本功能&#xff1a;(DST)<-(SRC) 将原操作数(字节或字)传送到目的地址。 指令支持的寻址方式&#xff1a;目的操作数和源操作数不能同时用存储器寻址方式&…

深度优先搜索----poj 1321棋盘问题

题目描述 棋盘问题 Time Limit: 1000MS Memory Limit: 10000KTotal Submissions: 63237 Accepted: 30234Description 在一个给定形状的棋盘&#xff08;形状可能是不规则的&#xff09;上面摆放棋子&#xff0c;棋子没有区别。要求摆放时任意的两个棋子不能放在棋盘中的同一行或…

计算机寄存器及标志位详解

以下是计算机内部寄存器阵列图&#xff1a; 以下FR控制标志位及其含义&#xff1a; 1. CF 进位标识位 进行加减运算时, 如果最高二进制位产生进位或错位, CF则为1, 否则为0. 程序设计中, 常用条件转移指令JC, JNC指令据此标志位实现转移 2. PF 奇偶标志位 操作结果…

NOIP 2010 引水入城

P1514 引水入城 题目描述 在一个遥远的国度&#xff0c;一侧是风景秀美的湖泊&#xff0c;另一侧则是漫无边际的沙漠。该国的行政区划十分特殊&#xff0c;刚好构成一个 NN 行 \times MM 列的矩形&#xff0c;如上图所示&#xff0c;其中每个格子都代表一座城市&#xff0c;每座…

关于IE8的SCODEF和 CREDAT

这里提供一些信息供理解IE8中的松散耦合处理方式。 由于IE8的LCIE更新&#xff0c; 现在比较难知道当前的tab是哪个iexplore.exe在处理。 如果你在用vista以上的系统&#xff0c; 任务管理器里有两列可以提供信息&#xff0c;分别是 commandline 和 pid&#xff0c; 如果这两列…

Cacls命令使用格式

Cacls命令使用格式如下&#xff1a; Cacls filename [/T] [/E] [/C] [/G user:perm] [/R user [...]] [/P user:perm [...]] [/D user [...]] Filename——显示访问控制列表&#xff08;以下简称ACL&#xff09;&#xff1b; /T——更改当前目录及其所有子目录中指定文件的 ACL…

前段mui框架初识

由于需要了解了一下mui框架&#xff0c;感觉没有想象的那么好 mui引入过后就要生成他自己的滚动条 而且 不能获取页面的高度 非屏幕的高度 mui上拉加载是会有卡顿现象的 &#xff0c; 这段代码执行完之后会有比较严重的手机段拖动卡顿现象 解决办法 给他设置滚动系数&#…

attrib指令

attrib 指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的 写保护 . 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.…

mysql创建表时反引号的作用

试用navicat工具查看现网mysql建表语句时&#xff0c;发现表名和字段名都是反引号引起来的 CREATE TABLE tab_notice_title_tv (i_id int(11) NOT NULL AUTO_INCREMENT,c_opcom_key varchar(32) DEFAULT NULL,c_view_type int(11) DEFAULT 1 COMMENT 平台类型,1:标清,2:高清,c_…

关于 Unity 版本升级后可能会引起偶发光照图错乱的问题

近期项目遇到一个奇怪的问题&#xff0c;使用 Unity 2017 版本升级后&#xff0c;团队中某些人的机器光照图总是不正确&#xff0c;而有的人是正确的&#xff0c;一直不知道为什么。 为了查到这个奇怪问题的原因&#xff0c;首先查看了美术的在 Max 中的导出设置&#xff0c;虽…

解决LSP问题导致无法上网

判断LSP是否损坏&#xff0c;以及修复方式的微软网址&#xff1a; http://support.microsoft.com/?scidkb%3Bzh-cn%3B811259 Winsock LSP全称Windows Socket Layered Service Provider(分层服务提供商)&#xff0c;它是Windows底层网络Socker通信需要经过的大门。一些流氓软件…

关于(int argc char **argv)

演示使用opencv显示一幅图片&#xff1a; #include <iostream> #include <core/core.hpp> #include <highgui/highgui.hpp> using namespace std; using namespace cv; void main(int argc,char **argv) {Mat imageimread(argv[1]);imshow("Lena",…

HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\PendingFileRenameOperations

函数MoveFileEx(szDstFile, NULL, MOVEFILE_DELAY_UNTIL_REBOOT);实际上是对注册表中HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\PendingFileRenameOperations键进行修改&#xff0c;让操作系统在下一次启动后&#xff0c;AutoChk运行后&#xff0c…

【微信支付坑】

&#xff08;1&#xff09;每次去生成预支付时的订单号必须是不一样的--生成了没有支付 再次去支付要注意 &#xff08;2&#xff09;退款使用支付时支付异步返回&#xff08;微信订单号&#xff1a;transaction_id&#xff09; 转载于:https://www.cnblogs.com/fyandy/p/93324…

sc.exe 详解

sc.exe是一个命令行下管理本机或远程主机服务的工具,他的功能是非常强大的, 下面我们来讲讲他的一些常用的基本用法: 你可以在命令行下键入sc.exe/?获得帮助. 我们以在本机为例. 1.SC的基本格式: sc <server> [command] [service name] <option1> <optio…

Pytorch中的Batch Normalization操作

之前一直和小伙伴探讨batch normalization层的实现机理&#xff0c;作用在这里不谈&#xff0c;知乎上有一篇paper在讲这个&#xff0c;链接 这里只探究其具体运算过程&#xff0c;我们假设在网络中间经过某些卷积操作之后的输出的feature map的尺寸为4322 4为batch的大小&…