1. sigmoid函数
逻辑回归算法的拟合函数,叫做sigmoid函数:
函数图像如下(百度图片搜到的图):
sigmoid函数是一个s形曲线,就像是阶跃函数的温和版,阶跃函数在0和1之间是突然的起跳,而sigmoid有个平滑的过渡。
从图形上看,sigmoid曲线就像是被掰弯捋平后的线性回归直线,将x轴的取值范围(-无穷,+无穷)映射到函数值y的(0,1)之间,更适宜表示预测的概率,即事件发生的“可能性” 。
2. 逻辑回归出现的场景
2.1 研究线性回归
当我们研究相关性的时候,经常遇到线性关系,y与x为连续性变量,建立多元线性回归模型。
2.2 遇到离散或者分类算法
有时候我们不是研究线性关系,而是研究是否取到红球,是否会变胖,是否会下单这样的分类或者离散问题。y为0/1离散变量时,不连续,上面的线性方程右侧是连续型,左侧现在变成离散型,无法建立线形回归模型。因此需要对方程进行logistic变化,或者叫做logistic映射。
2.3 logistic映射
利用sigmoid函数,将上面的公式进行logistic映射:
- 理解sigmoid函数:当z取值越大,无穷大,越小,y越接近于1,反之,越接近于0。
- 理解带入z后的sigmoid函数:右侧是一个关于x的线性函数,x在(-无穷,+无穷)之间任意取值;左侧y是关于x的函数值,可以映射到[0,1]之间,也就是说我们现在利用逻辑回归将线性函数和分类/离散之间的关系解决了。
- 理解变形后的函数:根据上一篇最大似然估计,变形后的函数公式有利于去参数β。
3. 逻辑回归的概念
多重线性回归模型要求因变量是连续型的正态分布变量,且自变量与因变量呈线性关系。当因变量是分类变量,且自变量与因变量不呈线性关系时,就不能确足多重线性回归模型的适用条件。此时,处理该类问题常用Logistic回归模型。Logistic回归分析属于非线性回归,它是研究因变量为二项分类或多项分类结果与某些影响因素之间关系的一种多重回归分析方法。
Logistic Regression 虽然被称为回归,但其实际上是分类模型,并常用于二分类。Logistic 回归的本质是:假设数据服从这个分布,然后使用极大似然估计做参数的估计。
本文用易于理解的方式介绍逻辑回归的概念,希望了解更多的推荐阅读 【机器学习】逻辑回归(非常详细) - 知乎
参考文档:
逻辑回归和优势比:大厂数据分析高频面试-逻辑回归和优势比2
最大似然和Logistics: 用人话讲明白逻辑回归Logistic regression - 知乎
logistics:【机器学习】逻辑回归(非常详细) - 知乎
logistics:经典Logistic回归:原理、计算步骤以及应用 - 知乎