一、误差思维(只要有估计,就会有误差)
1.误差永远存在,并且不可避免。
2.多次测量用平均值的统计方式取得结果,尽量避免偶然因素的影响。
二、置信区间(误差范围)
1.统计学最核心思想:用样本信息估计总体信息。
2.点估计:这个总体中的一个样本平均值就是对总体平均值的一次点估计。
3.置信水平:表示置信区间包含总体平均值的概率是多大。
4.置信区间:由样本统计量所构造的总体参数的估计区间。
三、小样本和大样本的抽样分布的不同
1.当样本大小n=30的时候,已经接近正态分布,才符合中心极限定理。
2.大样本:n>30,符合正态分布;小样本:n<30,符合T分布。
四、计算大样本置信区间
1.假如进行全国人口普查,想知道全国成年男性的平均身高,利用样本信息估计总体信息,
假设收集到的样本信息为100人。
2.求样本的平均值和标准误差
第一步:
第二步:计算标准误差
第三步:
1.置信水平越高,区间越宽,置信区间包含总体平均值概率越大。
2.常用的置信水平是95%。
3.根据正态分布经验,有95%的样本平均值会落在2个标准误差范围内。
第四步:
1.距离平均值几个标准误差就叫标准分(z)
1.利用标准正态分布表(标准分与概率数值的对应关系),知道标准分的情况下可以快速查找对应的概率值,反之一样。
五、计算小样本置信区间
第一步:
假如想知道某新药a对神经的反应时间,找10只老鼠做样本实验。
第二步:
计算标准误差
第三步:
1.样本大小n=10,自由度df=n-1=9
2.根据置信水平和自由度求出t值。
第四步:
六、什么是自由度?
1.自由度是指在不影响给定限制条件的情况下,可以自由变换信息的数量。
2.可以将自由度看做估算其他信息时可有的独立的信息数量。
例子: