数据处理中的中心化,就是将原数据减去平均值,得到新的数据,新的数据的平均值为0。
假设原数据是x(x可以是多维的),其平均值是,新的数据,那么新数据的平均值是为0的。下面证明下:
假设数据的数量是N,那么
举例:设数据是2维的,原数据是(x,y),中心化以后的数据是(x2,y2):
x | y | x2 | y2 | ||
10 | 8 | 9.75 | 8.375 | ||
6 | -5 | 5.75 | -4.625 | ||
-2 | 3 | -2.25 | 3.375 | ||
-12 | -16 | -12.25 | -15.625 | ||
1 | 0 | 0.75 | 0.375 | ||
0 | 6 | -0.25 | 6.375 | ||
2 | 2 | 1.75 | 2.375 | ||
-3 | -1 | -3.25 | -0.625 | ||
平均值 | 0.25 | -0.375 | 0 | 0 |