数据计算_先分组平均再加总平均与直接整体平均的差异
例如:
现有 A, B, C, D, E, F, G, H 共 8 组数据。
A: 16619
B: 12922
C: 15946
D: 13096
E: 13647
F: 13700
G: 13703
H: 12430
其整体平均的值为:
Average of ABCDEFGH: (16619 + 12922 + 15946 + 13096 + 13647 + 13700 + 13703 + 12430) / 8 = 14008 (四舍五入)
如果分成 ABC
, DEFG
, H
三组平均, 再加总平均, 其值为:
Average of ABC: (16619 + 12922 + 15946) / 3 = 15162 (四舍五入)
Average of DEFG: (13096 + 13647 + 13700 + 13703) / 4 = 13537 (四舍五入)
Average of H: 12430 / 1 = 12430(Average of ABC + Average of DEFG + Average of H) / 3 = (15162 + 13537 + 12430) / 3 = 13710 (四舍五入)
可见, 直接整体平均的值四舍五入后为 14008
, 先分组平均, 再加总平均的值四舍五入后为 13710
, 两种方法的平均值并不相等, 这是为什么呢?
先分组平均, 再加总平均若要与直接整体平均的值相同, 需要每组数据个数相同
例如现有 6 个数: 2, 4, 6, 1, 8, 9, 其平均值为
# 直接整体求平均。
(2 + 4 + 6 + 1 + 8 + 9) / 6 = 5
把这 6 个数分成两组, 每组 3 个数, 先分组求平均, 再加总平均:
# 先分组求平均。
( 2 + 4 + 6) / 3 = 4
( 1 + 8 + 9) / 3 = 6# 再加总求平均。
( 4 + 6 ) / 2 = 5
这样一来, 先分组平均, 再加总平均与直接整体平均的值是相同的。
在统计学中, 可以用频率来求平均值
同样基于这组数据:
A: 16619
B: 12922
C: 15946
D: 13096
E: 13647
F: 13700
G: 13703
H: 12430
切分为 “样本”: ABC
, DEFG
, H
其 “样本均值”: 15162.33
, 13537
, 12430
其 “频数”: 3
, 4
, 1
其 “频率”: 3/8
, 1/2
, 1/8
使用 样本均值 * 频率
再汇总的方法来求其总体平均值:
15162 × (3/8) + 13537 × (1/2) + 12430 × (1/8) = 14008
总结
以上就是关于 数据计算 先分组平均再加总平均与直接整体平均的差异 的全部内容。
更多内容可以访问我的代码仓库:
https://gitee.com/goufeng928/public
https://github.com/goufeng928/public