目录
1 从正态分布说起
1.1 正态分布的定义
1.2 正态分布的名字
1.3 正态分布的广泛,和基础性
2 正态分布的公式和图形
2.1 正态分布
2.2 标准正态分布
3 正态分布的认识的3个层次
3.1 第1层次:个体的某个属性的样本值,服从正态分布
3.2 第2层次:抽样的误差,服从正态分布
3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!
正态分布的本质就是概率
4 正态分布的特点
4.1 正态分布是客观的
4.2 万物不齐(从结果上看)
4.3 公平只是过程上的公平,而不能保证结果上的公平
4.4 钟形曲线,无限延申和逼近
4.5 中庸
4.6 动态平衡
4.7 规律是可用的,顺规律办事
4.7.1 不同的规律
4.7.2 使用规律
5 正态分布与标准值 ,概率
5.1 正态分布
5.2 正态分布的核心参数(所谓的6δ六西格玛)
5.3 关于标准值
5.4 关于标准正态分布
5.5 标准化数值得目的
正态分布,概率论都是一种世界观
1 从正态分布说起
1.1 正态分布的定义
正态分布(Normal distribution),又称为常态分布或高斯分布,通常记作。其中, 是正态分布的数学期望(均值), 是正态分布的方差。μ = 0,σ = 1的正态分布被称为标准正态分布 [1]。
1.2 正态分布的名字
- 正态分布 :Normal distribution
- 自然分布
- 常态分布
-
高斯分布
1.3 正态分布的广泛,和基础性
- 正态分布,在自然界广泛存在
- 无论是宏观的世界,还是很多微观的研究
- 因此,正态分布也称为了大家心里对概率估计的一个基础。
- 比如
- 我们假设一个我们不知道的事件:包含2个基本事件,我们默认为是1:1,也就是50%概率
- 我们对于一个我们不知道的随机变量 ,我们会默认这个随机变量是符合正态分布的规律的
2 正态分布的公式和图形
2.1 正态分布
2.2 标准正态分布
- 期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。
3 正态分布的认识的3个层次
3.1 第1层次:个体的某个属性的样本值,服从正态分布
- 比如某个属性,
- 按照样本的数据,横轴全部展开,为数值/数值区间
- 根据不同的数值/数值区间,统计其频度,作为Y坐标
- 可以看到,这个属性的频度图,就符合正态分布的曲线形状
3.2 第2层次:抽样的误差,服从正态分布
- 比如某个属性,每次抽样100个数据,统计每次抽样的平均值
- 连续抽样50次,
- 横轴是这50次的平均值
- 纵轴是这些平均值的频度/出现次数
- 也是符合正态分布的
3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!
正态分布的本质就是概率
- 标准正态分布曲线
- 在 -1标准差,+1标准差内,发生的概率是68%
- 在 -2标准差,+2标准差内,发生的概率是95%
- 在 -3标准差,+3标准差内,发生的概率是99%
4 正态分布的特点
4.1 正态分布是客观的
- 世界是客观的,是不以人们的意志想法为转移的
- 大地与山川,喷泉也是一个钟形曲线
- 世界观是多样的,且可能在不同的情境下有用,比如地心说在日常的小范围围观环境下很实用。但是研究宇宙得用日心说。但是正态分布是我们遇到很多随机的对象都符合的一种分布类型。
4.2 万物不齐(从结果上看)
- 万物不齐
- 万物应该是按正态分布/自然分布的居多,所以一定是钟形曲线,大地也是平地+山峦
- 喷泉也是一个钟形曲线
- 因为万物不齐,所以需要单独的去认识每个事物。
- 反之,否则之需要单独认识1个事物就可以认识整体了,这对于现实认知,显然是荒谬的。
- 庄子:理想? 希望万物齐一
- 孟子:事实求是,认为万物不齐。
- 万物不齐天地事,大道之行是中庸。
4.3 公平只是过程上的公平,而不能保证结果上的公平
- 结果的正确/正义无法保证
- 只能从过程的正确/正义上去保证
- 反而从辩证的角度看,正是因为,过程是公平的随机,结果才是不公平的
4.4 钟形曲线,无限延申和逼近
- 正态分布/自然分布也说了这个问题,一定是中间大,两头小。
- 从标准正态分布曲线上看,而且钟形曲线是无限的,趋近两边的极限无限接近但是永远无限延申下去,理论上可以覆盖所有情况。但是概率确是无限小。
- 中间的比例是最高的,这个是基于正态分布来说
- 越到两边,占比越少,只至长尾
4.5 中庸
- 中间的比例是最高的,这个是基于正态分布来说
- 中间这个值,很可能就是均值,且因为占比高,更具有代表性,
- 越道两边,占比越少,只至长尾
- 同样的X轴宽度下/标准差长度下,中间的聚集目的更高,面积大/概率高。两边概率低。
- 而且如果不引入其他变量,那么正态分布的均值,就是预测将来发生值最好的值!
4.6 动态平衡
- 钟形曲线,从顶上到两边,都是曲线,是不稳定的,不是静态平衡,只能是动态平衡。
- 逆水行舟,不进则退。
4.7 规律是可用的,顺规律办事
4.7.1 不同的规律
- 天之道,损有余而补不足
- 人之道,损不足而补有余
- 这是两种规律,规律是相对客观的,不变的,需要遵循,且可以利用模仿的。
- 人们自发的,都是按照人之道而行事的。
- 而人们也可以行天道,按天道的规律做事。从而对抗人之道的规律和结果。
4.7.2 使用规律
- 从使用规律上来说,人定胜天,是人可以利用规律,我是这么理解的
5 正态分布与标准值 ,概率
5.1 正态分布
正态分布(Normal distribution),又称为常态分布或高斯分布,通常记作。其中, 是正态分布的数学期望(均值), 是正态分布的方差。μ = 0,σ = 1的正态分布被称为标准正态分布 [1]。
5.2 正态分布的核心参数(所谓的6δ六西格玛)
- 第1: 均值
- 第2: 标准差(sqrt-方差)
- 第3: 隐藏参数:概率
- 概率就是把属于正态分布的样本值标准化后的图形了
- 隐藏的面积就是概率,和面积一一对应。
- 第3个概率,也被称为3δ原则,或者什么六西格玛原则:就是6δ。(听起来很高大上,实际就是正态分布)
5.3 关于标准值
- 标准值=( x-u)/sd ,即以sd为量纲
- 标准值,其实就是概率了,或者可以一一对应为概率了
- 标准值,就是用 标准差来横向每个数值与 均值得距离,是n个多少个标准差。
5.4 关于标准正态分布
- 标准正态分布,其实就是上面说的标准值的分布曲线。
5.5 标准化数值得目的
- 是为了去除量纲得影响。
- 标准值也是
- 通过这种标准值得公式操作
- 所有的数值,最后都是相关一套坐标系:标准正态分布的相同的量纲比较。