目录
- 1. 孔多塞陪审团定理和多样性预测定理
- 2. 分类模型
- 3. 适当的模型粒度
- 4. 一对多
- 更高的幂
- 超级油轮
- 身体质量指数
- 代谢率
- 女性CEO
- 5. 多模型思维
1. 孔多塞陪审团定理和多样性预测定理
-
孔多塞陪审团定理(Condorcet jury theorem)
-
从一个解释多数规则长处的模型中推导出来的
-
通过构建多个模型并使用多数规则,将比只使用其中一个模型更加准确
-
依赖于**世界状态(state of world)**的概念,它是对所有相关信息的完整描述
-
如果许多模型都导致相似的结果,那我们就得到了一个强有力的定理,它基本上不受模型细节的影响
-
我们的真理就是若干独立的谎言的交集
-
当许多模型都给出了相同的分类时,我们会信心大增
-
-
多样性预测定理(Diversity prediction theorem)
- 用于给出数值预测或估值的模型
- 它量化了模型的准确性和多样性对所有模型平均准确性的贡献
多模型误差 = 平均模型误差 − 模型预测的多样性 ( M ‾ − V ) 2 = ∑ i = 1 N ( M i − V ) N − ∑ i = 1 N ( M i − M ‾ ) N M i : 模型 i 的预测 M ‾ : 模型的平均值 V : 真值 多模型误差 = 平均模型误差-模型预测的多样性 \\ (\overline{M} - V) ^ 2 = \sum_{i=1}^{N}\frac{(M_i - V)}{N} - \sum_{i=1}^{N}\frac{(M_i - \overline{M})}{N} \\ M_i:模型i的预测 \\ \overline{M}:模型的平均值 \\ V:真值 多模型误差=平均模型误差−模型预测的多样性(M−V)2=i=1∑NN(Mi−V)−i=1∑NN(Mi−M)Mi:模型i的预测M:模型的平均值V:真值
-
相反类型的误差会相互抵消
-
两个模型的误差相互抵消,模型的平均值将比任何一个模型更加准确
-
即使两个模型预测值都太高,这些预测值的平均误差仍然不会比两个高预测值的平均误差更糟
-
群体的智慧(Wisdom of crowds):任何多样性的模型的集合将比其普遍成员的预测更加准确
2. 分类模型
-
将世界状态划分为不相交的
-
对世界分类的10个范畴
- 实体(substance)
- 数量(quantity)
- 地点(location)
- 状态(positioning)
- ···
-
相关属性的数量限制了不同类别的数量。因此也就限制了有用模型的数量
-
分类模型
- 存在一组世界的对象或状态,每个对象或状态都由一组属性定义,每个属性都有一个值
- 根据对象的属性,分类模型 M M M将对象或状态划分为一个有限的类别 { S 1 , S 2 , ⋅ ⋅ ⋅ , S n } \{S_1,S_2,···,S_n\} {S1,S2,⋅⋅⋅,Sn},然后给每个类别赋值 { M 1 , M 2 , ⋅ ⋅ ⋅ , M n } \{M_1,M_2,···,M_n\} {M1,M2,⋅⋅⋅,Mn}
-
虽然增加模型可以提高准确性,但是在已经拥有了一定数量的模型之后再继续添加模型,每个模型的边际贡献就会下降
-
如果能构建出多个多样性的、准确的模型,我们就可以做出准确的预测和估值,并选择正确的行动
3. 适当的模型粒度
-
通过简化,我们可以应用逻辑来解释现象、交流思想、并探索各种各样的可能性
-
我们拥有的数据越多,模型就越精细
-
创造过多的类别会导致对数据的过度拟合,而过度拟合会破坏对未来事件的预测
-
分类误差(Categorization error):每个类别中,数据均值的误差
- 与类别数量成正比
-
估值误差(Valuation error):估计均值的误差
- 与类别数量成反比
-
模型误差分解定理(model error decomposition theorem)
偏差 − 方差权衡( b i a s − v a r i a n c e t r a d e − o f f ) 模型误差 = 分类误差 + 估值误差 ∑ x ∈ X ( M ( x ) − V ( x ) ) 2 = ∑ i = 1 n ∑ x ∈ S i ( V ( x ) − V i ) 2 + ∑ i = 1 n ( M i − V i ) 2 M ( x ) : 数据点 x 的模型值 M i : 类别 S i 的模型值 V ( x ) : 数据点 x 的实际值 V i : 类别 S i 的实际值 偏差-方差权衡(bias-variance trade-off) \\ 模型误差 = 分类误差 + 估值误差 \\ \sum_{x\in{X}}(M(x)-V(x))^2 = \sum_{i=1}^n\sum_{x\in{S_i}}(V(x)-V_i)^2 + \sum_{i=1}^n(M_i-V_i)^2 \\ M(x):数据点x的模型值 \\ M_i:类别S_i的模型值 \\ V(x):数据点x的实际值 \\ V_i:类别S_i的实际值 \\ 偏差−方差权衡(bias−variancetrade−off)模型误差=分类误差+估值误差x∈X∑(M(x)−V(x))2=i=1∑nx∈Si∑(V(x)−Vi)2+i=1∑n(Mi−Vi)2M(x):数据点x的模型值Mi:类别Si的模型值V(x):数据点x的实际值Vi:类别Si的实际值
4. 一对多
- 我们不能随便拿起一个模型就将它应用到任何情境之中,但是,大多数模型都是灵活的
更高的幂
超级油轮
- 设邮轮为一个长方体,且宽和高为 S S S,长度为 8 S 8S 8S
- 则表面积为 34 S 2 34S^2 34S2,体积为 8 S 3 8S^3 8S3
- 表面积决定成本,体积决定收益
体积 表面积 = 8 S 3 34 S 2 ≈ S 4 \frac{体积}{表面积} = \frac{8S^3}{34S^2} \approx \frac{S}{4} 表面积体积=34S28S3≈4S
- 随着 S S S的增长,盈利能力呈线性增长
身体质量指数
- 设人体为一个近似完美的立方体,且1立方米立方体的重量为 M M M,身高为 H H H
B M I = M H 3 H 2 = H M BMI = \frac{MH^3}{H^2} = HM BMI=H2MH3=HM
- 此时模型有2个缺陷
- 身高本应与肥胖无关
- 肌肉发达是肥胖的对立面
- 解决方法
- 添加参数 d d d表示一个人的“深度”(前胸到后背的厚度)
- 添加参数 w w w表示一个人的“宽度”
B M I = H ∗ ( d H ) ∗ ( w H ) ∗ M H 2 = d w H M BMI = \frac{H * (dH) * (wH) * M}{H^2} = dwHM BMI=H2H∗(dH)∗(wH)∗M=dwHM
代谢率
- 设小鼠和大象皆为一个近似完美的立方体,且身体由 1 c m 3 1cm^3 1cm3的细胞组成,小鼠表面积为 14 c m 2 14cm^2 14cm2,体积为 3 c m 3 3cm^3 3cm3,大象表面积为 57600 c m 2 57600cm^2 57600cm2,体积为 864000 c m 3 864000cm^3 864000cm3
小鼠 : 表面积 体积 = 14 c m 3 3 c m 3 ≈ 5 大象 : 表面积 体积 = 57600 c m 3 864000 c m 3 ≈ 1 15 小鼠: \frac{表面积}{体积} = \frac{14cm^3}{3cm^3} \approx 5 \\ 大象: \frac{表面积}{体积} = \frac{57600cm^3}{864000cm^3} \approx \frac{1}{15} 小鼠:体积表面积=3cm314cm3≈5大象:体积表面积=864000cm357600cm3≈151
- 小鼠每立方厘米的细胞,就有 5 c m 2 5cm^2 5cm2的体表皮肤来散热
- 大象每立方厘米的细胞,仅有 1 15 c m 2 \frac{1}{15}cm^2 151cm2的体表皮肤来散热
- 综上,小鼠散热的速度是大象的 75 75 75倍
女性CEO
- 设成为一名CEO,至少要升职 15 15 15次
- 并且升职时会出现有利于男性的偏差,即男性的升职率略高于女性,则设两个概率分别为 50 % 50\% 50%和 40 % 40\% 40%
男性 : ( 50 % ) 15 = 0.000030517578125 女性 : ( 40 % ) 15 = 0.000001073741824 男性 女性 = 0.000030517578125 0.000001073741824 ≈ 30 男性: (50\%)^{15} = 0.000030517578125 \\ 女性: (40\%)^{15} = 0.000001073741824 \\ \frac{男性}{女性} = \frac{0.000030517578125}{0.000001073741824} \approx 30 男性:(50%)15=0.000030517578125女性:(40%)15=0.000001073741824女性男性=0.0000010737418240.000030517578125≈30
- 差异的累计最终成为非常巨大的差异
5. 多模型思维
- 成功的一对多思维取决于创造性地调整假设和构建新的类比,以便将为某个特定目的而开发的模型应用到新的领域
- 要成为一个多模型思考者,需要的不仅仅是数学能力,更需要的是创造力