1.计算机认识图像的方式:都是数字。例如一个 128X128 的3通道的图片 是由 128X128X3个数字 组成的。
2.面临的难点:一幅图可以说明。
3.分类器
A:Nearest Neighbor Classifier:与CNN无关,但是可以帮助我们理解一下分类器。仅用标签比较。
L1 distance:d1(I1,I2)=相减求和,
L2 distance:d2(I1,I2)=相减平方,求和 开方。
B:k - Nearest Neighbor Classifier :找出代表性的,K是寻找能够代表标签的数目。这样的话就更加具有抵抗性。减轻无关东西的影响。
KNN 与 NN的比较
参数k的选择
超参数的概念:不是利用l1范数 ,L2范数。用点积等其他方法来决定的参数。
测试集是不能用来参与调优的。
从训练集中抽取一部分调优,称为验证集(validation set)、、
交叉验证:如果训练集太小,把训练集分成5分,交叉训练。
3.1分类器的优缺点:测试时间不够短,
需要记住所有的训练数据,与测试数据比较,这样子就很浪费空间。需要将测试数据一个一个比较,计算量大、、