逻辑斯谛回归模型

逻辑斯谛回归模型

news/2025/10/18 10:42:11/文章来源:https://blog.csdn.net/weixin_30521161/article/details/99307716

逻辑斯谛回归模型是研究因变量为二分类或多分类观察结果与影响因素之间的关系的一种概率型非线性回归模型。逻辑斯谛回归系数通过最大似然估计得到。Logistic函数如下：

式中x为

这里是输入变量的n个特征，然后按照Logistic函数形式求出。

假设有n个独立变量的向量，设条件概率在x条件下y发生的概率（假设y=1为y发生）。则Logistic函数表示为：

同理，在x条件下y不发生的概率为：

Logistic回归都是围绕Logistic函数展开的，如何求解是Logistic回归模型的主要问题，采用的最大似然估计来求解这组参数。

假设有m个观测样本，观测值分别为，设为给定条件下的概率，同理的概率为，得到一个观测值得概率为：

因为各观测样本间相互独立，于是得到似然函数：

对似然函数取对数：

现要求向量使的最大，其中：

要求的最大似然估计，我们需要确定似然函数存在局部极大值。因此，对似然函数求偏导后得：

由多元函数极值的必要条件可知，若多元函数在一点取得极值，且一阶偏导存在，则该点处所有一阶偏导为0。由此，可以得出n+1个方程，如下：

由此方程解出的不一定是似然函数的极值，需要通过Hessian矩阵来判断得出的解是否为似然函数的极值。

Hessian矩阵是一个多元函数的二阶偏导构成的方阵，描述了函数的局部曲率。对一个多元函数，如果他的二阶偏导都存在，那么Hessian矩阵如下：

通过Hessian矩阵，我们可以判断一点M处极值的三种情况：

如果是正定矩阵，则临界点M处是一个局部极小值；
如果是负定矩阵，则临界点M处是一个局部极大值；
如果是不定矩阵，则临界点M处不是极值。

对于中的n+1个方程，要求Hessian矩阵，先要求似然函数的二阶偏导，即：

则似然函数的Hessian矩阵为

设有矩阵X、A：

则似然函数的Hessian矩阵可表示为：

显然，矩阵A是负定的，则可以证明H也是负定的，说明似然函数存在局部极大值。因此，可以使用牛顿迭代法（Newton's Method）来求。

对一元函数，使用牛顿迭代法来求零点。假设要求的解，首先选取一个点作为迭代起点，通过下面的式子进行迭代，直到达到指定精度为止。

由此，有时起始点选择很关键，如果函数只存在一个零点，那么这个起始点选取就无关重要。对已Logistic回归问题，Hessian矩阵对于任意数据都是负定的，所以说极值点只有一个，初始点的选取无关紧要。

因此，对于上述Logistic回归的似然函数，令：

则由可以得到如下的迭代式子：

由于Hessian矩阵是负定的，将矩阵A提取一个负号，得：

然后Hessian矩阵变为

这样，Hessian矩阵就是对称正定的了。那么牛顿迭代式变为：

现在，关键是如何快速并有效的计算，即解方程组。由于是对称正定的，可以使用Cholesky矩阵分解法来解。

若对称正定，则存在一个对角元为正数的下三角矩阵，使得成立。对于，可以通过以下步骤求解：

求的Cholesky分解，得到
求解，得到
求解，得到

现在的关键问题是对进行Cholesky分解。假设：

通过比较两边的关系，首先由

再由

这样，得到了矩阵的第一列元素。假设，已经算出了的前列元素，通过

可以得出

进一步由

最终：

这样便通过的前列求出了第列，一直递推下去即可求出。这种方法称为平方根法。

利用上述方法需要进行开方，这有可能损失精度和增加运算量，为了避免开方，将Cholesky分解进行改进，即：

其中：是单位下三角矩阵，为对角均为正数的对角矩阵。把这一分解叫分解。设：

则对于，求解步骤变为：

求的分解，得到
求解，得到
求解，得到

对比两边元素，可以得到：

由此可以确定和的公式如下：

牛顿迭代法

Cholesky分解

MatrixOperation是一个有关矩阵加、减、乘以及特殊矩阵求逆的一个类。

转载于:https://www.cnblogs.com/reddatepz/p/4496362.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/471996.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

mysql监控平台怎么做_MySQL监控平台的构建方法

mysql监控平台怎么做_MySQL监控平台的构建方法

MySQL监控平台的构建方法发布时间：2020-05-23 14:13:12来源：亿速云阅读：159作者：鸽子概述对于MySQL的监控平台，相信大家实现起来有很多了：基于天兔的监控，还有基于zabbix相关的二次开发。相信很…

阅读更多...

查看宝塔面板账号密码命令_宝塔面板升级到最新版图文教程

查看宝塔面板账号密码命令_宝塔面板升级到最新版图文教程

往期教程：宝塔面板教程（1）基于云服务器搭建宝塔面板教程最全详解宝塔面板教程（2）宝塔面板添加WordPress站点详细图文教程宝塔面板教程（3）基于宝塔面板成功配置网站SSL安全证书宝塔面板教程&…

阅读更多...

python 对象引用、可变性和垃圾回收

python 对象引用、可变性和垃圾回收

文章目录1. 变量是标签2. 元组的相对不可变性3. 默认浅复制4. 函数的参数作为引用时5. del 和垃圾回收6. 弱引用7. 一些可能的坑！！！learn from 《流畅的python》 1. 变量是标签 >>> a [1, 2, 3] >>> b a >>&g…

阅读更多...

关于原型的一点总结

关于原型的一点总结

原型（prototype）无疑是JavaScript中一个十分重要的概念，围绕着原型所涉及的原型链继承、内建对象扩展，JS表现出独特的面向对象特性。 1.什么是原型每个JS的函数对象中都有一个默认的prototype属性，它指向的就是这个函数…

阅读更多...

python canopen_Python canopener包_程序模块 - PyPI - Python中文网

python canopen_Python canopener包_程序模块 - PyPI - Python中文网

用于打开文件的python便利函数canopener(filename, moder)。本地文件的行为与open()：>>> canopener(local_file.txt)url也可以作为文件名传递并打开进行读取。urllib2.urlopen()是在封面下使用的，因此它具有同等的支持：>>>…

阅读更多...

python自动化pdf报告_[Python] 自动化办公 PDF提取文字、表格、图片

python自动化pdf报告_[Python] 自动化办公 PDF提取文字、表格、图片

转载请注明：陈熹 chenx6542foxmail.com (简书号：半为花间酒)若公众号内转载请联系公众号：早起Python本例可以学到的知识点：使用 pdfplumber 提取 PDF 中的文字和表格使用 fitz 提取 PDF 中的图片之前我们已经详细介绍了批量 PDF 文…

阅读更多...

天池在线编程最长AB子串（哈希）

天池在线编程最长AB子串（哈希）

文章目录1. 题目2. 解题1. 题目描述给你一个只由字母’A’和’B’组成的字符串s，找一个最长的子串，要求这个子串里面’A’和’B’的数目相等，输出该子串的长度。这个子串可以为空。 s的长度n满足 2<n<1000000。示例样例1 输入: s…

阅读更多...

Tomcat 打开一闪而过

Tomcat 打开一闪而过

转载于:https://www.cnblogs.com/super90/p/4504326.html

阅读更多...

java怎么递归_Java的递归、如何与流相结合

java怎么递归_Java的递归、如何与流相结合

递归技术需求：扫描D:\test所有子文件夹及子子文件夹下的.jpg文件。我们如果用循环来做这件事，我们不知道循环的结束条件，也不知道到底有多少层，所以比较麻烦。我们可以用一种新的思想：递归。递归举例：从前有…

阅读更多...

假设有搅乱顺序的一群儿童成一个队列_数据结构与算法系列之栈amp;队列（GO）...

假设有搅乱顺序的一群儿童成一个队列_数据结构与算法系列之栈amp;队列（GO）...

以下完整代码均可从这里获取栈栈的基本概念「后进先出、先进后出就是典型的栈结构」。栈可以理解成一种受了限制的线性表，插入和删除都只能从一端进行当某个数据集合只涉及在一端插入和删除数据，并且满足后进先出、先进后出的特性，就应该首选…

阅读更多...

python 自定义类（特殊方法）

python 自定义类（特殊方法）

文章目录1. 对象表示形式2. 可散列的类3. 私有属性的利弊4. __slots__ 类属性节省空间5. 覆盖类属性learn from 《流畅的python》 from array import array import mathclass Vector2D:typecode d # 类属性def __init__(self, x, y):self.x float(x)self.y float(y)classm…

阅读更多...

网络知识

网络知识

http://www.cnblogs.com/dawen/archive/2011/05/18/2050358.html http://www.cnblogs.com/daoluanxiaozi/p/3274925.html转载于:https://www.cnblogs.com/webundle/p/4505782.html

阅读更多...

datagridview 动态插入图片_挑战一张照片制作动态PPT背景

datagridview 动态插入图片_挑战一张照片制作动态PPT背景

在PPT中，要做出好看的页面动画效果，常常需要用很多图片和装饰元素。而如果你手头的素材只有一张照片，如何才能快速做出好看的PPT背景效果呢？本期内容，我们就来一起挑战，使用一张照片，制作PPT动态…

阅读更多...

sed搜索某行在行末追加_示范sed指定某行插入追加和全局替换

sed搜索某行在行末追加_示范sed指定某行插入追加和全局替换

有时候会有这样的需求，在指定的行后面或者是前面追加一行，这个时候可以使用sed来完成，具体用法如下a\ 在指定的行后面追加一行b\ 在指定的行前面追加一行使用指定的行号追加内容，在使用行号的过程中，需要注意的问题有以…

阅读更多...

LeetCode 1941. 检查是否所有字符出现次数相同

LeetCode 1941. 检查是否所有字符出现次数相同

文章目录1. 题目2. 解题1. 题目给你一个字符串 s ，如果 s 是一个好字符串，请你返回 true ，否则请返回 false 。如果 s 中出现过的所有字符的出现次数相同 ，那么我们称字符串 s 是好字符串。示例 1： 输入&…

阅读更多...

java初学者定远期目标_JAVA题，新手求解

java初学者定远期目标_JAVA题，新手求解

展开全部类图设计：类设计：package car;public class Car {private String id;private String name;public void setId(String id) {this.id id;}public void setName(String name) {this.name name;}/*** 获取汽车编e69da5e6ba9062616964757a686964616…

阅读更多...

LeetCode 1942. 最小未被占据椅子的编号（set）

LeetCode 1942. 最小未被占据椅子的编号（set）

文章目录1. 题目2. 解题1. 题目有 n 个朋友在举办一个派对，这些朋友从 0 到 n - 1 编号。派对里有无数张椅子，编号为 0 到 infinity 。当一个朋友到达派对时，他会占据编号最小且未被占据的椅子。比方说，当一个朋友到达时…

阅读更多...

python哪本书好看_python入门看哪本书好

python哪本书好看_python入门看哪本书好

推荐几本适合python初学者的书。《Python编程从入门到实战》本书中涵盖的内容是比较精简的，没有艰深晦涩的概念，最重要的是每个小结都附带有”动手试一试”环节，学编程最佳的方式就是多动手、多动脑。很多初学者看完书之后不知道下一步怎么办…

阅读更多...

java mysql geo_GEO数据库简介

java mysql geo_GEO数据库简介

为了支持公共使用和散布基因表达数据，NCBI开始了基因表达汇编(GEO)计划。GEO是努力建立一个基因表达数据仓库和在线资源，用于从任何物种或人造的来源检索基因表达数据。来自microarray，高密度寡核苷酸array(HAD)，杂交膜(filter)和…

阅读更多...

对每个小组的评论和建议

对每个小组的评论和建议

1、极速蜗牛：总体上已经有了一个小游戏的基本轮廓，虽然还没有达到预期的效果，但是能看到他们的进度。不过这次我们只看到了一直在反弹，对于一个游戏来说，娱乐性是很重要的，但是在这个游戏中我们没有看到很大…

阅读更多...

最新文章