逻辑回归

逻辑回归

二分类情况

对于二分类问题,在线性可分的情况下,试图构建一个判别式 W ′ X ′ + b {W'X'+b} WX+b,为了便于操作将判别式增广为 W X {WX} WX
W x i = { > 0 , x i ∈ w 1 , Y = 1 < 0 , x i ∈ w 2 , Y = 0 {Wx_i}=\begin{cases} \ >0, \quad x_i \in w_1,Y=1\\ <0, \quad x_i \in w_2,Y=0 \end{cases} Wxi={ >0,xiw1,Y=1<0,xiw2,Y=0
为了将其表示为概率的方式我们对概率建模,将其缩放为 [ 0 , 1 ] [0,1] [0,1]的范围上,所以我们利用sigmoid函数 1 1 + e − x \frac{1}{1+e^{-x}} 1+ex1

由此我们设分类为 w 1 w_1 w1的概率为
P ( Y = 1 ∣ x ) = 1 1 + e − W x P(Y=1|x)=\frac{1}{1+e^{-Wx}} P(Y=1∣x)=1+eWx1
设:
P ( Y = 1 ∣ x i ) = P ( x i ) P ( Y = 0 ∣ x i ) = 1 − P ( x i ) P(Y=1|x_i)=P(x_i)\\ P(Y=0|x_i)=1-P(x_i) P(Y=1∣xi)=P(xi)P(Y=0∣xi)=1P(xi)
由此构建似然函数:
L ( W ) = ∏ [ P ( x i ) ] y i [ 1 − P ( x i ) ] ( 1 − y i ) L(W)=\prod[P(x_i)]^{y_i}[1-P(x_i)]^{(1-y_i)} L(W)=[P(xi)]yi[1P(xi)](1yi)

对似然函数取对数:
I n ( L ( W ) ) = ln ⁡ ( ∏ [ P ( x i ) ] y i [ 1 − P ( x i ) ] ( 1 − y i ) ) = ∑ ( ln ⁡ ( [ P ( x i ) ] y i ) + ln ⁡ ( [ 1 − P ( x i ) ] ( 1 − y i ) ) ) = ∑ ( y i ln ⁡ ( [ P ( x i ) ] ) + ( 1 − y i ) ln ⁡ ( [ 1 − P ( x i ) ] ) ) = ∑ [ y i ⋅ W x i − ln ⁡ ( 1 + e W x i ) ] \begin{aligned} In(L(W)) &=\ln(\prod[P(x_i)]^{y_i}[1-P(x_i)]^{(1-y_i)})\\ &=\sum (\ln([P(x_i)]^{y_i})+\ln([1-P(x_i)]^{(1-y_i)}))\\ &=\sum ({y_i}\ln([P(x_i)])+{(1-y_i)}\ln([1-P(x_i)]))\\ &=\sum[y_i\cdot Wx_i-\ln(1+e^{Wx_i})] \end{aligned} In(L(W))=ln([P(xi)]yi[1P(xi)](1yi))=(ln([P(xi)]yi)+ln([1P(xi)](1yi)))=(yiln([P(xi)])+(1yi)ln([1P(xi)]))=[yiWxiln(1+eWxi)]
为了最大化似然,即最小化似然的负数

使似然除以样本总数n(减少梯度爆炸出现的概率),再乘以-1(将求最大值问题转化为求最小值问题
J ( W ) = − 1 N ∑ ( ln ⁡ ( [ P ( x i ) ] y i ) + ln ⁡ ( [ 1 − P ( x i ) ] ( 1 − y i ) ) ) J(W)=-\frac{1}{N}\sum (\ln([P(x_i)]^{y_i})+\ln([1-P(x_i)]^{(1-y_i)})) J(W)=N1(ln([P(xi)]yi)+ln([1P(xi)](1yi)))
采用梯度下降的方法:
∂ J ( W ) ∂ W = − 1 N ∑ ( y i − P ( x i ) ) x i \frac{\partial J(W)}{\partial W}=-\frac{1}{N}\sum (y_i-P(x_i))x_i WJ(W)=N1(yiP(xi))xi
更新 W W W:
W k + 1 = W k − α ∂ J ( W ) ∂ W , k 为迭代次数 , α 为学习率 W^{k+1}=W^{k}-\alpha\frac{\partial J(W)}{\partial W},\quad k为迭代次数,\alpha为学习率 Wk+1=WkαWJ(W),k为迭代次数,α为学习率
∣ ∣ W k + 1 − W k ∣ ∣ ||W^{k+1}-W^{k}|| ∣∣Wk+1Wk∣∣小于阈值时或者当 k k k达到最大迭代次数时停止迭代。

逻辑回归是在线性回归的基础上加了一个 Sigmoid 函数(非线形)映射,使得逻辑回归称为了一个优秀的分类算法。本质上来说,两者都属于广义线性模型,但他们两个要解决的问题不一样,逻辑回归解决的是分类问题,输出的是离散值,线性回归解决的是回归问题,输出的连续值。

多分类问题

为了实现多分类,我们引入一个softmax函数: softmax ( x i ) = e x i ∑ j e x j \text{softmax}(x_i) = \frac{e^{x_i}}{\sum_j e^{x_j}} softmax(xi)=jexjexi来代替Sigmoid函数,同构建模型: Y = W X i Y=WX_i Y=WXi,其中 Y Y Y为一个列向量,第 i i i个数表示第 i i i个类别的概率。

其中修改损失函数:
J ( W ) = − 1 n [ ∑ i = 1 n ∑ j = 1 k 1 { j ( i ) = j } ⋅ log ⁡ ( e W x i ∑ l = 1 k e W x i ) ] J(W)=-\frac{1}{n}\left[\sum_{i=1}^n\sum_{j=1}^k 1_{\{j^{(i)}=j\}}\cdot\log (\frac{e^{Wx_i}}{\sum_{l=1}^k e^{Wx_i}})\right] J(W)=n1[i=1nj=1k1{j(i)=j}log(l=1keWxieWxi)]
其中 1 { j ( i ) = j } 1_{\{j^{(i)}=j\}} 1{j(i)=j}表示第 i i i类分类正确时为1,否则为0, k k k为类别数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/124399.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PyTorch入门学习(六):神经网络的基本骨架使用

目录 一、引言 二、创建神经网络骨架 三、执行前向传播 一、引言 神经网络是深度学习的基础。在PyTorch中&#xff0c;可以使用nn.Module类创建自定义神经网络模型。本文将演示如何创建一个简单的神经网络骨架并执行前向传播操作。 二、创建神经网络骨架 首先&#xff0c…

Spring Boot 优雅配置yml配置文件定义集合、数组和Map

一、value 获取配置文件 在平时的yml配置文件中&#xff0c;我们经常使用到配置基本数据类型的字符串&#xff0c;比如配置日志文件的写法如下&#xff1a; # 配置日志输出级别 logging:# 指定logback配置文件的位置 config: classpath:logback-spring.xml# 文件日志要输出的路…

SpringBoot可以连接RabbitMQ集群吗 ?

目录 一、SpringBoot可以连接RabbitMQ集群吗&#xff1f;二、springboot连接到rabbitmq集群可以负载均衡吗&#xff1f;三、SpringBoot既然可以配置负载均衡&#xff0c;为什么还需要Haproxy做负载均衡&#xff1f; 一、SpringBoot可以连接RabbitMQ集群吗&#xff1f; Spring …

Java14-16新特性

目录 一、Java14新特性 1、instanceof模式匹配 2、友好的空指针(NullPointerException)提示 3、record类型 二、Java15新特性 1、Sealed Classes 2、CharSequence新增方法 3、TreeMap新增方法 4、文本块 5、无需配置环境变量 三、Java16新特性 1、包装类构造方法的…

Sketch mac 98.3(矢量绘图设计软件)

Sketch是一款专为Mac设计的矢量图形编辑软件&#xff0c;被广泛应用于UI/UX设计、网页设计、移动应用设计等领域。Sketch提供了各种工具和功能&#xff0c;包括绘图、图形设计、排版等&#xff0c;可以帮助设计师轻松地创建高质量的矢量图形和模型。Sketch的主要特点包括&#…

Git基础命令实践

文章目录 简介git的安装配置git的安装git的配置 git使用的基本流程创建版本库时光机穿梭版本回退工作区和暂存区管理修改撤销修改删除文件 远程仓库添加远程库从远程库克隆 总结 简介 本文主要记录了我在学习git操作的过程&#xff0c;以及如何使用GitHub。建议先参考廖雪峰的…

测试环境内存溢出排查过程

基本信息 客户名称&#xff1a;xxx 产品名称&#xff1a; 版本号&#xff1a; 问题分类&#xff1a;编码问题 环境类型&#xff1a;实体机 问题现象 保险公司测试环境爆内存&#xff0c;机器挂掉。总共64g的内存&#xff0c;在没有开始测试tomcat部署war包前内存使用率为25%左…

debian和ubuntu

Debian和Ubuntu是两种流行的Linux发行版&#xff0c;它们之间有密切的关系&#xff0c;但也存在一些重要的区别。 关系&#xff1a; Ubuntu是基于Debian创建的。这意味着Ubuntu使用与Debian相同的APT包管理系统&#xff0c;并共享来自Debian库中的大量包和库。 区别&#xf…

提升管理文件效率:批量删除文件名中的特殊符号

在文件管理的过程中&#xff0c;我们经常会遇到文件名中包含特殊符号的情况&#xff0c;这些符号可能会干扰文件的正常运行&#xff0c;特别是在一些特定的软件或系统中。因此&#xff0c;为了提高文件管理的效率和文件的可读性、可操作性&#xff0c;我们需要对这些特殊符号进…

[BUUCTF NewStarCTF 2023 公开赛道] week4 crypto/pwn

再补完这个就基本上完了. crypto RSA Variation II Schmidt-Samoa密码系统看上去很像RSA,其中Npqq, 给的eN给了d from secret import flag from Crypto.Util.number import *p getPrime(1024) q getPrime(1024)N p*p*qd inverse(N, (p-1)*(q-1)//GCD(p-1, q-1))m bytes…

Web3 治理实践探讨:如何寻找多元化发展路径?

Web3 领域变革正崭露头角&#xff0c;而社区治理开始成为行业热议话题。Web3 项目如何探寻多元化建设的解困路径&#xff0c;究竟是治理模型的精进成为首要问题&#xff0c;还是吸纳更多资金与组织教育培训&#xff0c;让开发者成为项目建设的中坚力量&#xff1f;本期 TinTinW…

Panda3d 介绍

Panda3d 介绍 文章目录 Panda3d 介绍Panda3d 的安装Panda3d 的坐标系统介绍Panda3d 的运行Panda3d 加载一个熊猫父节点和子节点之间的关系 验证Panda3d 的坐标系统X 轴的平移Y 轴的平移Z 轴的平移X 轴的旋转Y 轴的旋转Z 轴的旋转 Panda3D是一个3D引擎:一个用于3D渲染和游戏开发…

Docker Consul概述及构建

Docker Consul概述及构建 一、Consul概述1.1、什么是Consul1.2、consul 容器服务更新与发现1.3、服务注册与发现的含义1.4、consul-template概述1.5、registrator的作用 二、consul部署2.1、环境配置2.2、在主节点上部署consul2.3 、配置容器服务自动加入nginx集群2.3.1、安装G…

LSTM-Based Anomaly Detection of Process Instances Benchmark and Tweaks翻译

论文《LSTM-Based Anomaly Detection of Process Instances Benchmark and Tweaks》翻译 LSTM-Based Anomaly Detection of Process Instances Benchmark and Tweaks翻译

使用AWS Lambda函数的最佳实践!

主题 函数代码 函数配置 指标和警报 处理流 安全最佳实践 有关 Lambda 应用程序最佳实践的更多信息&#xff0c;请参阅 Serverless Land 中的 Application design。 函数代码 从核心逻辑中分离 Lambda 处理程序。这样您可以创建更容易进行单元测试的函数。在 Node.js 中…

IDEA 使用技巧

文章目录 语言支持简化编写 有问题&#xff0c;可暂时跳过 个人常用快捷键插件主题插件功能插件 碰到过的问题 除了一些在Linux上用vim开发的大佬&#xff0c;idea算是很友好的集成开发工具了&#xff0c;功能全面&#xff0c;使用也很广泛。 记录一下我的 IDEA 使用技巧&#…

Android WMS——WM窗口管理(八)

我们在 ViewRootImpl 分析中,已经对 WindowManager 的功能有一个大致了解,这里再来详细看一下 WindowManager 是如何管理 Window 的。 一、WindowManager WindowManager 所提供的功能很简单,常用的只有三个方法,即添加 View,更新 View,和删除 View。这三个方法定义在 Vi…

OSPF综合实验

一、实验拓扑 二、实验需求 1、R4为ISP&#xff0c;其上只配置IP地址&#xff1b;R4与其他所直连设备间均使用公有IP&#xff1b; 2、R3-R5、R6、R7为MGRE环境&#xff0c;R3为中心站点&#xff1b; 3、整个OSPF环境IP基于172.16.0.0/16划分&#xff1b;除了R12有两个环回&a…

分类预测 | Matlab实现KOA-CNN-BiLSTM-selfAttention多特征分类预测(自注意力机制)

分类预测 | Matlab实现KOA-CNN-BiLSTM-selfAttention多特征分类预测&#xff08;自注意力机制&#xff09; 目录 分类预测 | Matlab实现KOA-CNN-BiLSTM-selfAttention多特征分类预测&#xff08;自注意力机制&#xff09;分类效果基本描述程序设计参考资料 分类效果 基本描述 1…

DVWA-SQL Injection SQL注入

概念 SQL注入&#xff0c;是指将特殊构造的恶意SQL语句插入Web表单的输入或页面请求的查询字符串中&#xff0c;从而欺骗后端Web服务器以执行该恶意SQL语句。 成功的 SQL 注入漏洞可以从数据库中读取敏感数据、修改数据库数据&#xff08;插入/更新/删除&#xff09;、对数据…