logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。然后通过logistic回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是胃癌的危险因素。同时根据该权值可以根据危险因素预测一个人患癌症的可能性。
1、逻辑回归是用来做什么的呢?
回答:用来解决二分类问题
2、专业术语:
样本:就是一行一行数据,采集数据
特征:类似于mysql中的列
标签列:又叫做结果列
3、回归和分类的区别?
通过输出结果可以判断出是连续问题,还是离散问题 。
回归模型的输出是连续的
分类模型输出的是离散的
4、案例(左分类,右回归)
5、逻辑回归公式
逻辑回归=线性回归+sigmoid函数br
其实就是我们数学中的一条直线,让现实数据,尽可能均匀落到该线的两侧,来实现正常分布
6、如何把回归编程分类?
在该图中,将x<=14划分为一类。x>14分为另为一类,实现二分类问题。
7、Sigmoid函数
上图为Sigmoid函数曲线图,x=0的位置可以将数据y=0.5,得到数据二分类。
8、Sigmoid函数作用
9、逻辑回归公式
10、判断算法好坏-损失函数
11、评价二分类模型
混淆矩阵、召回率、精确率、准确率
TP/TN/FP/FNT:TrueF :falseP:positiveN:Negativebr
11.1、准确率(accucry)
准确率(accucry)=总样本中预测对了多少?br
案例:
11.2、精确率(procision)
精确率(procision)=预测为正的样本中实际为正的有多少?br
案例:
11.3、召回率(Recall)
召回率(Recall)=实际为正的样本中有多少被预测为正了br
案例:
11.4、F1计算公式
F1就是为了让一个评价指标里,既能体现查准率,又能体现召回率而出现的公式br