不考虑两点距离的情况下,3维空间中的两点最多只有7种位置关系。3条边,3条面对角线,1条体对角线。现在向4*4*4的3维空间中随机的扔2个石子,比较7种结构的占比。
得到表格为
1 | 96 | 0.0476 |
2 | 96 | 0.0476 |
3 | 288 | 0.1429 |
4 | 288 | 0.1429 |
5 | 864 | 0.4286 |
6 | 288 | 0.1429 |
7 | 96 | 0.0476 |
其中1,2,7占比都是4.76%是3条边,3,4,6占比相同为14.29%是3条面对角线,而5占比最大为42.86%是体对角线。7种情况共64*63/2=2016种。
1=2=7<3=4=6<5
所以随机的向4*4*4的空间里扔2个石子,最有可能是按照结构5的方式分布。
为验算这一结论,用计算机模拟,随机的在64个格子中选两个,并判断这两个格子属于7种结构中的哪个,分别随机扔了100次,1000次,2000次,得到数据
100 | % | 1000 | % | 2000 | % | |||
1 | 2 | 0.02 | 33 | 0.033 | 109 | 0.0545 | ||
2 | 4 | 0.04 | 49 | 0.049 | 81 | 0.0405 | ||
3 | 15 | 0.15 | 163 | 0.163 | 263 | 0.1315 | ||
4 | 17 | 0.17 | 132 | 0.132 | 291 | 0.1455 | ||
5 | 43 | 0.43 | 436 | 0.436 | 877 | 0.4385 | ||
6 | 13 | 0.13 | 142 | 0.142 | 280 | 0.14 | ||
7 | 6 | 0.06 | 45 | 0.045 | 99 | 0.0495 |
实验数据和计算数据很一致。所以这意味着如果在4*4*4的空间中有2个粒子在完全随机的运动,则任意时刻观察这两个粒子的相对位置关系应该都有42.86%的概率是按照结构5分布。
神经网络收敛的过程总可以理解为是在某一空间中寻找特定结构的过程,如果搜索的空间形状恰好是一个立方体,而要搜索的结构又刚好是结构5,这个网络理论上就应该比搜索结构1更快,更容易收敛,迭代次数更小。因为结构5在搜索空间的占比就是最大的。在相同空间中不同结构的占比是天然不同的,搜索难度也不同。所以假设迭代次数反比于结构在空间中的分布概率。