可决系数
可决系数(coefficient of determination)
如果样本回归线对样本观测值拟合程度越好,各样本观测点与回归线靠得越近,由样本回归做出解释的离差平方和与总离差平方和越相近;反之,拟合程度越差,相差越大。
可决系数的计算式:
可决系数可以作为综合度量回归模型对样本观测值拟合优度的度量指标。
可决系数是测定多个变量间相关关系密切程度的统计分析指标,它也是反映多个自变量对因变量的影响程度。可决系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。可决系数的取值范围在0到1之间,它是一个非负统计量。随着抽样的不同而不同,既是随样本而变动的统计量。
拟合优度
拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。
度量拟合优度的统计量是可决系数(亦称确定系数)R。
R的取值范围是[0,1]。R的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R的值越接近0,说明回归直线对观测值的拟合程度越差。
R衡量的是回归方程整体的拟合度,是表达因变量与所有自变量之间的总体关系。R等于回归平方和在总平方和总所占的比率,即回归方程所能解释的因变量变异性的百分比。实际值与平均值的总误差中,回归误差与剩余误差是此消彼长的关系。因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度。
统计上定义剩余误差除以自由度n – 2所得之商的平方根为估计标准误。为回归模型拟合优度的判断和评价指标,估计标准误显然不如判定系数R。R 是无量纲系数,有确定的取值范围 (0—1),便于对不同资料回归模型拟合优度进行比较;而估计标准误差是有计量单位的,又没有确定的取值范围,不便于对不同资料回归模型拟合优度进行比较。
拟合优度检验
主要是运用判定系数和回归标准差,检验模型对样本观测值的拟合程度。
当解释变量为多元时,要使用调整的拟合优度,以解决变量元素增加对拟合优度的影响。
拟合优度检验是检验来自总体中的一类数据其分布是否与某种理论分布相一致的统计方法。 eg. 一个总体可分为r类,现从该总体获得了一批分类数据,现在需要我们从这些分类数据中出发,去判断总体各类出现的概率是否与已知的概率相符。譬如要检验一颗骰子是否是均匀的,那么可以将该骰子抛掷若干次,记录每一面出现的次数,从这些数据出发去检验各面出现的概率是否都是1/6.
http://baike.baidu.com/view/2021095.htm
http://baike.baidu.com/view/657906.htm
http://baike.baidu.com/view/557339.htm