现代统计学奠基人之一、英国统计学家费希尔(Fisher)曾把抽样分布、参书估计和假设检验看作统计推断的三大中心内容。
统计学中,需要研究统计量的性质,并评价一个统计推断的优良性,而这些取决于其抽样分布的性质,所以,抽样分布是统计学中的重要内容。
统计学中常见的抽样分布有4种:正态分布、卡方分布、t分布、F分布,后面三大分布都是在正态分布的基础上推导出来的。
正态分布
正态分布是最重要的一种分布,其分布曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形。
自然界中很多现象都是符合正态分布,比如:
- 人的身高,特别高和特别矮的人都是少数,中等身材的占大多数。
- 一个班的成绩,特别低和特别高的都是少数,处于中间状态的占大多数。
正态分布的概率密度函数为:
其中,μ为均值,σ为标准差。
当μ=0,σ=1时,相应的正态分布N(0,1)称为标准正态分布。
通过Python可以很容易地绘制出标准正态分布的分布曲线图。
from pylab import mplmpl.rcParams['font.sans-serif'] = ['FangSong'] # 指定默认字体mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题import numpy as npfrom scipy import statsimport matplotlib.pyplot as pltmu=0sigma=1x=np.arange(-5,5,0.1)y=stats.norm.pdf(x,0,1)plt.plot(x,y)plt.title("正态分布曲线:$mu$=%.1f,$sigma^2$=%.1f" % (mu,sigma))plt.ylabel("概率密度