文章目录
- 1.回归分析
- 2. 逻辑回归
- 3. 聚类分析
- 4. 判别分析
- 5. 主成分分析
- 6. 因子分析
- 7. 对应分析
1.回归分析
- 数据量要多,样本总量n越大越好——>保证拟合效果更好,预测效果越好
- 一般n>40/45较好
- 方法
- 建立回归模型 yi=β0+β1i+……+βkxki+εi
- 所估计的公式写出来
- 把数据带进去求回归系数【通过最小二乘估计求出β^是多少】
- 【部分】检验回归系数β1,β2……βk是否为0,系数显著说明自变量x显著
- 若βi=0,说明回归方程不受xi所影响,简化回归方程
- 【整体】检验回归方程
- 0<r^2<=1【R2越接近1模型越好,R2小一定不好 】
- 方差分析
- Sig【p值】越小越好 Sig<0.01较为显著
- 预测未来
- 建立回归模型 yi=β0+β1i+……+βkxki+εi
εi一般是iid的,表示相互独立且同分布,~N(σ,σ^2)
2. 逻辑回归
- 因变量是属性变量,分类变量,至少有一个变量是连续的
- 模型
3. 聚类分析
- 系统聚类法【样本少的情况】
不断缩减类的个数,且选择的标准不唯一- 对样品聚类
- 对变量聚类
4. 判别分析
- 选择的标准唯一,有监督的学习
5. 主成分分析
- 目的:降维!!使变量减少
- 取出一部分主成分【例:y1,y2,y3】
- 用取出的主成分对y做回归
- 估计y1,y2,y3前的系数因子a1,a2,a3
- 对系数解读主成分中自变量x几占比较大【多使用因子分析】
6. 因子分析
- 通过相关矩阵大部分元素都>0.3,相关系数较大
- 写出因子模型,再分析
7. 对应分析
- 横纵坐标都看作分类的变量