3.相关分析:描述的是两个数值变量间关系的强度。(两个数值型变量之间的关系)
(1)图表表示:散点图
(2)衡量关系强度指标:相关系数r。
(r的取值为-1到 +1,-1代表两个变量是完全的负线性相关关系,+1代是完全的正线性相关关系,0代表两个变量不存在线性相关关系,越接近1两个变量的关系强度越高。)
4.回归分析:描述的是一个或多个自变量的变化是如何影响因变量的一种方法。(两个数值型变量之间的关系)
(1)回归分析的核心价值在于“预测”,即通过对历史数据的分析,构建可以预测未来因变量值的数学公式。
(2)公式:因变量=斜率*自变量+截距(y=β1*x+ β0)
(3)拟合优度度量:R^2
①R^2的取值介于0~1之间,越接近1,表明x与y之间的线性关系对预测,值的贡献越大,拟合程度就越好。
②具体操作方法:Excel的“数据”菜单栏-数据分析-回归
Multiple R(相关系数r);
RSquare(判定系数R^2); 一般用于单个自变量
Adjusted R Square(调整后的判定系数 R^2); 一般用于多个自变量
标准误差(用回归方程预测因变量y时预测了误差的大小,各数据点越靠近回归直线,标准误差越小,回归方程进行的预测也就越准确)。
5.方差分析(分类型变量与数值型变量之间的关系)
(1)用途:可用于判断渠道、性别、年龄等对广告效果的影响强度;利用对多个样本的方差的分析,得出总体均值是否相等的判定。
(2)判断
方法一:F值判断是否显著影响,F大于Fa则显著影响;
方法二:P值小于a,则显著影响;
(3)具体操作方法:Excel的“数据”菜单栏-数据分析-方差分析(单因子选单因子方差分析)
(4)例子