刚刚看一个帖子的时候发现了AI识别中一个可以利用到其它场景的的一个通用处理步骤:
人脸矫正。
人脸识别过程:
1.首先识别到关键的人脸部分,经过一个粗筛过程,把目标物的脸部图样先抓出来。
2.然后,因为人脸的水平,垂直角度是可变的,所以第二部,它会把人脸强制归正,归一化到平视,摄像头正向前置,人脸的尺寸也缩放到与人脸库中的人脸尺寸相当的地步。
3.开始最简单的特征点位比对。
并且注意,第2步运算是可逆的矩阵运算,就是把正面照贴合到任何一个角度和姿态。所以,这就是换脸的技术路径。通过上述方法可以把人脸数据库里任何人的脸与原始图片做无缝贴合——换掉你的脸。
看到的原始信息:https://blog.csdn.net/m0_68662723/article/details/134402072
这涉及到专利吗?感觉很像是一个专利。
它不仅仅可以用于图像识别,事实上,它可以用在各类物体的计算机视觉识别方面。那个关键点检测和矫正环节,并不需要所有的特征点位参与运算,只是几个非常粗的点,用于对边界范围内的可疑物体实现投影,旋转和缩放这个过程,将其转换为标准机位的标准尺寸的图片。一旦对齐到标准机位和标准尺寸,而后就可以提取更多的特征点位并和数据库内的大量人脸图片做逐一比对了。
为什么yolov3选择406这个分辨率呢?因为此时各个特征坐标点的bit数在512*512 = 0x40000。2.5字节,另外,可能也考虑了卷积运算的复杂度,可能刚好落在float的区间。然后就是当前算力的约束。
按照原始链接的分享人提供的信息,人脸的特征值复杂度大概是在256字节这个量级。