网络大厂 AI研究团队近日在最新的Pixel相机中,于无快门模式Photobooth新增亲吻侦测功能,当用户亲吻自己的爱人时,相机会自动捕捉这一瞬间。网络大厂过去是藉由Photobooth模式,让用户更简单地成功自拍,不管是一个人、情侣或是团体照,都能够自动捕捉到最好的画面。网络大厂表示,要拍出一张好的团体自拍照其实不太容易,为了能够降低自拍的困难,网络大厂研究团队将自动摄影技术带到Pixel手机上,一旦用户进入Photobooth模式并按下快门键,系统将会自动在相机稳定,且同时确保拍摄对象有好表情的时候拍摄。
在一系列的Pixel相机功能中,网络大厂于Photobooth加入了Top Shot和肖像(Portrait )模式,来让用户尽可能拍出最好的照片,有别于针对后置镜头专用硬件优化的肖像模式,Photobooth则是针对前置镜头进行优化,为了建置Photobooth,网络大厂必须克服3项挑战:如何在团体中正确辨识好内容、如何计算按下快门捕捉最佳时刻的时间,以及如何制作视觉动画帮助用户了解Photobooth看见的画面。首先,网络大厂研究团队建立了用来理解好内容的模型,Photobooth仰赖两个不同的模型来捕捉好的画面,一个是脸部表情模型,另一个则是检测用户何时亲吻的模型,网络大厂与摄影师合作,整理了5个应该触发自动拍摄的关键表情:微笑、伸舌头、亲吻(或是都嘴)、鼓起脸颊和警喜的表情,接着,网络大厂训练神经网络针对这些表情进行分类。
相机系统自动辨识表情的下一步,就是要控制快门,用户使用Photobooth模式按下快门后,系统会根据上述的模型辨识结果,针对画面内容给予基本的质量评估分数,第一阶段会将不好的画面过滤掉,像是闭眼睛、讲话、动作模糊、侦测脸部表情失败等,Photobooth会暂时分析表情的信心值,来侦测拍照对象在照片中的表现,第一阶段若成功通过,每一帧会受到更细化的分析,来产生整体的评分结果。整体的画面评分考虑因素包含脸部表情质量和亲吻分数,由于亲吻侦测模型是针对整个画面来执行,侦测输出的结果可直接用于全画面的分数值,而脸部表情模型是针对个别被摄者表情输出结果,Photobooth利用attention模型将侦测到的表情,透过迭代的方式计算出表情质量的代表值,以及每个脸的权重,网络大厂指出,权重相当重要,举例来说,权重能够强调画面的前方区域,模型接着会为画面的表现质量,计算出一个通用的分数。内容相关来源:sbf胜博网址 http://tpmanager.org.tw/
最后,模型计算出的影像质量分数,被用来触发快门,为了找出拍摄出最佳质量的瞬间,快门控制算法保留了观察画面的短缓冲区,若一个画面的质量分数比缓冲区之后的分数高,系统才会保存该张照片,而缓冲区的时间也足够短暂,让使用者认为Photobooth是实时的回馈。由于自拍时使用者使用的是前置镜头,能够与屏幕上呈现的画面互动,网络大厂也在Photobooth模式中加入了视觉的指引,当用户要拍照时,屏幕上方会出现一个直方图案,当照片质量增加时,该直方图案的尺寸也会变大,藉由这样可视化的方式,协助用户理解机器学习算法看见和捕捉的画面,该直方图案的长度被分为4段,一是无法辨识清楚的脸部,二是可辨识脸部但是使用者并没有看向镜头,三则是有看镜头但是没有出现上述5种关键表情,最后则是有看向镜头且出现关键表情,长条指示图案会随着照片质量变动,当到达高质量分数时,Photobooth就会拍下并保存照片。
转载于:https://blog.51cto.com/13220658/2380209