本节,我们用线性回归为例子,回顾一些基本概念
6.1 相关性
相关性的取值范围是-1 到 1,越接近 1 或者-1 代表越相关,越接近 0 则越不相关。相关系数大于 0 称为正相关,小于 0 称为负相关。
假如 A 与 B 正相关,则是说 A(B)会随着 B(A)的增大而增大,减小而减小。假如 A 与 B 负相关,则是说 A(B)会随着 B(A)的增大而减小,减小而增大。皮尔逊系数就是常用的相关性方法。
6.2 什么是线性回归
顾名思义,就是用一种线性关系进行回归。回归与分类都属于有监督学习,分类预测的是一个类别,而回归预测的是一个数值,例如房价、天气的温度、股票的走势。
线性关系 f(x)可以定义为
向量的表示方式为
其中 w 为权重,是一个列向量,b 是一个偏移项。这个 f(x)就是我们说的线性回归模型。我们对 f(x)的训练,就是获得 f(x)中的 w 与 b。
我们可不可以把线性回归模型用于分类问题呢?答案是可以的,只需要把回归方程 f(x)输出加一个 sigmoid 函数就可以了。