2 | 2 | 2 | 1 | 2 | 2 |
2 | 2 | 2 | 1 | 2 | 2 |
2 | 2 | 2 | 1 | 2 | 2 |
3 | 3 | 3 | x | 3 | 3 |
2 | 2 | 2 | 1 | 2 | 2 |
2 | 2 | 2 | 1 | 2 | 2 |
在平面上有一个点x,再增加一个点,1+1的操作把平面分成了3部分2a1,2a2,2a3,3部分的比值是
2a1 | 2a2 | 2a3 |
5 | 25 | 5 |
0.143 | 0.714 | 0.143 |
如果平面是正方形,改变平面的尺寸会改变3部分的比值,但是2a1和2a3占比一定同样多。也就是在正方形的平面上找到2a1和2a3的概率一定是一样的。
如果希望2a1和2a3出现的概率不一致,一个可能的办法就是改变平面的形状,在一个瘦长的锥形区域出现2a1的概率就要大些
0 | |||||
0 | 2a1 | 15 | 0.714 | ||
0 | 2a2 | 5 | 0.238 | ||
0 | 2a3 | 1 | 0.048 | ||
0 | |||||
0 | 0 |
比如在这个L形的区域内,有6*5/2=15个2a1,有5个2a2,有1个2a3占比为71.4%,23.8%,4.8%。2a1>2a2>2a3这意味着在整个L形的区域内找到2a1要容易些。
( A, B )---3*30*2---( 1, 0 )( 0, 1 )
对于二值化二分类网络,当B全为0时,如果训练集的图片数量大于点的数量,迭代次数2a1>2a2>2a3
n=5 | 迭代次数 | n=4 | 迭代次数 | n=3 | 迭代次数 | |||||||||
2a1 | 0 | 0 | 0 | 48757 | - | - | - | 38566.2 | 1 | - | - | 28553.7 | ||
0 | 0 | 0 | 48757 | 1 | - | - | 38566.2 | - | - | - | 28553.7 | |||
0 | 0 | 0 | 48757 | 1 | - | - | 38566.2 | 1 | - | - | 28553.7 | |||
0 | 0 | 1 | 48757 | - | - | - | 38566.2 | |||||||
0 | 0 | 1 | 48757 | |||||||||||
↓ | ↓ | ↓ | ||||||||||||
2a2 | 0 | 0 | 0 | 66503.84 | 1 | - | - | 52243.5 | - | - | - | 37970.4 | ||
0 | 0 | 0 | 66503.84 | - | - | - | 52243.5 | - | 1 | - | 37970.4 | |||
0 | 0 | 0 | 66503.84 | - | - | - | 52243.5 | 1 | - | - | 37970.4 | |||
0 | 1 | 0 | 66503.84 | - | - | 1 | 52243.5 | |||||||
0 | 0 | 1 | 66503.84 | |||||||||||
↓ | ↓ | ↓ | ||||||||||||
2a3 | 0 | 0 | 0 | 85401.86 | - | - | - | 67787.4 | - | - | - | 50456.3 | ||
0 | 0 | 0 | 85401.86 | - | - | - | 67787.4 | - | - | - | 50456.3 | |||
0 | 0 | 0 | 85401.86 | - | - | - | 67787.4 | 1 | - | 1 | 50456.3 | |||
0 | 0 | 0 | 85401.86 | 1 | - | 1 | 67787.4 | |||||||
0 | 1 | 1 | 85401.86 |
这和在L形区域内寻找这3个特征的难度刚好是成正比的,寻找的难度越小迭代次数越小。也就是假设所谓收敛过程就是在一个瘦长的锥形区域内,用权重随机寻找特征结构的过程。因为搜索范围是一个不对称的锥形,所以对称的两个结构的迭代次数都不同,扁平结构的迭代次数总是更大些。
计算机验算这组数据,向L形区域内随机扔2个石子,运行了500,1000,5000次
500 | 1000 | 5000 | ||||||
2a1 | 350 | 0.7 | 715 | 0.72 | 3571 | 0.71 | ||
2a2 | 115 | 0.23 | 239 | 0.24 | 1184 | 0.24 | ||
2a3 | 35 | 0.07 | 46 | 0.05 | 245 | 0.05 |
实验数据和计算数据一致。