opencv相机标定和人头姿态估计案例

前言

头部驱动除了之前关注的表情驱动外,还有眼球驱动和头部方向驱动。本博客基于opencv官方文档和部分开源代码来研究如何基于人脸关键点获取头部的朝向。

国际惯例,参考博客:

opencv:Camera Calibration and 3D Reconstruction

opencv:Real Time pose estimation of a textured object

cv.solvePnP位姿估计旋转向量精度分析

头部姿态估计原理及可视化

重磅!头部姿态估计「原理详解 + 实战代码」来啦!

相机矩阵(Camera Matrix)

Python cv2.decomposeProjectionMatrix方法代码示例

face_landmark

head-pose-estimation

Face-Yaw-Roll-Pitch-from-Pose-Estimation-using-OpenCV

talking-head-anime-demo

OpenVtuber

相机标定理论

几种坐标系

先看从opencv官网中扒下来的两幅图,代表针孔相机模型(pinhole camera model)

在这里插入图片描述

其中涉及到几种坐标系:

  • 世界坐标系:一个固定不变的坐标系,原点通常固定不变,右图的www坐标系
  • 相机坐标系:相机在世界坐标系下的姿态,右图的ccc坐标系
  • 图像坐标系:成像平面,图中的x-y坐标轴,其原点是相机的光轴与成像平面的胶垫
  • 像素坐标系:最终图像,图中的u-v坐标轴,原点在左上角,就跟opencv输出的图片一样,左上角代表(0,0)(0,0)(0,0)像素位置。

图像坐标系和像素坐标系横轴和纵轴方向一致,但是单位不同,一个是物理单位,一个是像素单位,一般有一个对应的缩放关系,代表一个像素在成像平面上的大小。

针孔相机的目标就是把3D坐标点PwP_wPw利用透视变换(perspective transformation)投影到图像平面上,得到对应像素ppp。其中PwP_wPwppp都在齐次坐标系下表示。

无畸变情况下,针孔相机的投影变换可以表示为:
sp=A[R∣t]Pws\ p=A[R|t]P_w s p=A[Rt]Pw
其中PwP_wPw为世界坐标系下的3D坐标点,ppp是图像平面上的2D像素点,AAA是相机内参矩阵,RRRttt分别描述了世界坐标系到相机坐标系的旋转和平移变换,sss是任意尺度的投影变换(非相机模型的参数,其实就是图像坐标系到像素坐标系的变换系数)。

世界坐标系到相机坐标系

旋转-平移矩阵[R∣t][R|t][Rt]是投影变换(projective transformation)和齐次变换(homogeneous transformation)的乘积。

维度为(3,4)(3,4)(3,4)投影变换可以将相机坐标系里的3D坐标映射到成像平面的2D坐标,并且在归一化的相机坐标系x′=XcZcx'=\frac{X_c}{Z_c}x=ZcXcy′=YcZcy'=\frac{Y_c}{Z_c}y=ZcYc下表示出来
Zc[x′y′1]=[100001000010][XcYcZc1]Z_c\begin{bmatrix} x'\\ y'\\1 \end{bmatrix}=\begin{bmatrix} 1&0&0&0\\ 0&1&0&0\\ 0&0&1&0 \end{bmatrix}\begin{bmatrix} X_c\\Y_c\\Z_c\\1 \end{bmatrix} Zcxy1=100010001000XcYcZc1
而齐次变换通常在相机外参RRRttt中体现出来,代表世界坐标系到相机坐标系的变换,因此给定一个世界坐标系下的点PwP_wPw,那么相机坐标系下的对应点为:
Pc=[Rt01]PwP_c=\begin{bmatrix} R&t\\0&1 \end{bmatrix}P_w Pc=[R0t1]Pw
这个齐次变换一般就是由一个(3,3)的旋转矩阵和一个(3,1)的平移向量组成:
[Rt01]=[r11r12r13txr21r22r23tyr31r32r33tz0001]\begin{bmatrix} R&t\\0&1 \end{bmatrix}=\begin{bmatrix} r_{11}&r_{12}&r_{13}&t_x\\ r_{21}&r_{22}&r_{23}&t_y\\ r_{31}&r_{32}&r_{33}&t_z\\ 0&0&0&1 \end{bmatrix} [R0t1]=r11r21r310r12r22r320r13r23r330txtytz1
因此
[XcYcZc1]=[r11r12r13txr21r22r23tyr31r32r33tz0001][XwYwZw1]\begin{bmatrix} X_c\\Y_c\\Z_c\\1 \end{bmatrix}=\begin{bmatrix} r_{11}&r_{12}&r_{13}&t_x\\ r_{21}&r_{22}&r_{23}&t_y\\ r_{31}&r_{32}&r_{33}&t_z\\ 0&0&0&1 \end{bmatrix}\begin{bmatrix} X_w\\Y_w\\Z_w\\1 \end{bmatrix} XcYcZc1=r11r21r310r12r22r320r13r23r330txtytz1XwYwZw1
结合投影变换和齐次变换,就可以得到将世界坐标系下3D点映射到归一化相机坐标系下的成像平面下2D点的变换:
Zc[x′y′1]=[R∣t][XwYwZw1]=[r11r12r13txr21r22r23tyr31r32r33tz][XwYwZw1]Z_c\begin{bmatrix} x'\\y'\\1 \end{bmatrix}=[R|t]\begin{bmatrix} X_w\\Y_w\\Z_w\\1 \end{bmatrix}=\begin{bmatrix} r_{11}&r_{12}&r_{13}&t_x\\ r_{21}&r_{22}&r_{23}&t_y\\ r_{31}&r_{32}&r_{33}&t_z \end{bmatrix}\begin{bmatrix} X_w\\Y_w\\Z_w\\1 \end{bmatrix} Zcxy1=[Rt]XwYwZw1=r11r21r31r12r22r32r13r23r33txtytzXwYwZw1
其中x′=XcZcx'=\frac{X_c}{Z_c}x=ZcXcy′=YcZcy'=\frac{Y_c}{Z_c}y=ZcYc

相机坐标系到像素坐标系

相机内参矩阵AAA通常用K表示,用于将相机坐标系下的3D坐标点投影到像素坐标系中。
p=APcp=AP_c p=APc
通常相机内参矩阵AAA包含了以像素为单位的焦距fxf_xfxfyf_yfy,以及靠近图像中心的原点(cx,cy)(c_x,c_y)(cx,cy)
A=[fx0cx0fycy001]A= \begin{bmatrix} f_x & 0 & c_x \\ 0&f_y&c_y\\ 0&0&1 \end{bmatrix} A=fx000fy0cxcy1
所以
s[uv1]=[fx0cx0fycy001][XcYcZc]s\begin{bmatrix} u\\v\\1 \end{bmatrix}=\begin{bmatrix} f_x & 0 & c_x \\ 0&f_y&c_y\\ 0&0&1 \end{bmatrix}\begin{bmatrix} X_c\\Y_c\\Z_c \end{bmatrix} suv1=fx000fy0cxcy1XcYcZc
相机内参,顾名思义只与相机自身有关,与外部环境无关,所以一次标定以后,只要你不动焦距,就可以永久使用。

总结:世界坐标系到像素坐标系

将内外参矩阵放在一起就能把sp=A[R∣t]Pws\ p=A[R|t]P_ws p=A[Rt]Pw重写成:
s[uv1]=[fx0cx0fycy001][r11r12r13txr21r22r23tyr31r32r33tz][XwYwZw1]s\begin{bmatrix} u\\v\\1 \end{bmatrix}=\begin{bmatrix} f_x&0&c_x\\ 0&f_y&c_y\\ 0&0&1\\ \end{bmatrix}\begin{bmatrix} r_{11}&r_{12}&r_{13}&t_x\\ r_{21}&r_{22}&r_{23}&t_y\\ r_{31}&r_{32}&r_{33}&t_z \end{bmatrix}\begin{bmatrix} X_w\\Y_w\\Z_w\\1 \end{bmatrix} suv1=fx000fy0cxcy1r11r21r31r12r22r32r13r23r33txtytzXwYwZw1
如果Zc≠0Z_c\neq0Zc=0,那么
[uv]=[fxXc/Zc+cxfyYc/Zc+cy]\begin{bmatrix} u\\v \end{bmatrix}= \begin{bmatrix} f_xX_c/Z_c+c_x\\ f_yY_c/Z_c+c_y \end{bmatrix} [uv]=[fxXc/Zc+cxfyYc/Zc+cy]
其中
[XcYcZc]=[R∣t][XwYwZw1]\begin{bmatrix} X_c\\Y_c\\Z_c \end{bmatrix}=[R|t]\begin{bmatrix} X_w\\Y_w\\Z_w\\1 \end{bmatrix} XcYcZc=[Rt]XwYwZw1
就得到最开始描述的左图中的u-v坐标系映射模型了。

【注】上述理论是基于畸变参数为0的情况下,关于不为零的时候,请自行查阅opencv官方文档描述或者其他资料。

头部姿态估计

理论

通过内外参矩阵可以将世界坐标系下的3维点映射到成像平面,那么同理,可以利用相机内参、世界坐标系的3D点、成像平面的2D点,找到世界坐标系到相机坐标系的旋转和平移(外参矩阵)。

在做头部姿态估计的时候,我们仅仅知道人脸关键点,其它信息一无所知,那么应该怎么求解呢?

通过后五篇参考博客的源码分析,大致流程就是:

  • 建立一个虚假的3D头模,找到几个人脸关键点的3D坐标
  • 假定当前相机的内参矩阵和畸变系数
  • 利用solvePnP求解平移向量和旋转向量
  • 利用decomposeProjectionMatrix将旋转向量转换为欧拉角

其中solvePnP的函数描述如下:

retval, rvec, tvec	=	cv.solvePnP(objectPoints, imagePoints, cameraMatrix, distCoeffs[, rvec[, tvec[, useExtrinsicGuess[, flags]]]]	)

输入参数:

  • objectPoints:世界坐标系下的3D坐标
  • imagePoints:2D投影坐标
  • cameraMatrix:相机内参矩阵
  • distCoeffs:畸变系数

输出:

  • rvec:旋转向量,可使用Rodrigues转换为旋转矩阵
  • tvec:平移向量

其中decomposeProjectionMatrix的函数描述如下:

cameraMatrix, rotMatrix, transVect, rotMatrixX, rotMatrixY, rotMatrixZ, eulerAngles	=	cv.decomposeProjectionMatrix(	projMatrix[, cameraMatrix[, rotMatrix[, transVect[, rotMatrixX[, rotMatrixY[, rotMatrixZ[, eulerAngles]]]]]]]	)

输入参数:

  • projMatrix:维度为(3,4)(3,4)(3,4)的投影矩阵PPP

返回参数:

  • cameraMatrix:内参矩阵
  • rotMatrix:外部旋转矩阵
  • transVect:外部平移矩阵
  • rotMatrixX:绕x轴旋转的矩阵
  • rotMatrixY:绕y轴旋转的矩阵
  • rotMatrixZ:绕z轴旋转的矩阵
  • eulerAngles:旋转欧拉角

实现

例如最后一个参考博客中的源码解析分别为:

  • 预加载3D人脸关键点模型

    首先预加载一个3D人脸关键点模型,源码提供了人脸的39个关键点,我提取了其中12个关键点,关键点坐标如下:

    array([[ 29.64766 ,  10.      ,  66.01275 ],[126.870285,  10.      ,  66.01275 ],[ 60.359673,  34.85047 ,  44.13414 ],[ 25.144653,  33.933437,  39.87654 ],[ 96.15827 ,  34.85047 ,  44.13414 ],[131.37329 ,  33.933437,  39.87654 ],[ 78.25897 ,  88.78672 ,  67.6343  ],[ 50.51882 , 109.59447 ,  50.48531 ],[ 78.25897 , 105.25116 ,  67.04956 ],[105.99912 , 109.59447 ,  50.48531 ],[ 78.25897 , 119.950806,  60.976673],[ 78.25897 , 162.94363 ,  40.70434 ]], dtype=float32)
    

    原始39个关键点与对应提取的12个关键点在2D图像上的位置关系如下:

    在这里插入图片描述

  • 提取真实人脸关键点

    利用opencv或者HRNet模型,提取真实图像中的2D人脸关键点,可参考之前换脸的博客,或者去我github上找源码也可以,效果如下:

    在这里插入图片描述

  • 计算朝向
    首先创建内参矩阵:

    H,W = img.shape[0],img.shape[1]
    matrix = np.array([[W,0,W/2.0],[0,W,H/2.0],[0,0,1]])
    

    然后求解外参矩阵,调用solvPnP函数求解旋转向量和平移向量

    _,rot_vec,trans_vec = cv2.solvePnP(obj[pick_model,...].astype("float32"),points[pick_dlib,...].astype("float32"),matrix,None,flags=cv2.SOLVEPNP_DLS)
    

    将旋转向量和平移向量组合成外参矩阵的形式

    rot_mat = cv2.Rodrigues(rot_vec)[0]
    pose_mat = cv2.hconcat((rot_mat, trans_vec))
    

    最后将旋转向量转换为欧拉角:

    
    euler_angle = cv2.decomposeProjectionMatrix(pose_mat)[-1]
    

    可视化效果如下:

在这里插入图片描述

后记

结果有时候受到你初始模型的影响,所以建议多找些源码测试一下,找到一个合适的3D模型使用。而且在驱动卡通角色时候,由于建模和游戏引擎的原因,坐标系可能不同,因而欧拉角也要做适当的变换,比如我的项目基于python和unity交互的卡通角色肢体和表情驱动(深度学习)中关于表情驱动部分的实验。

完整的python实现放在微信公众号的简介中描述的github中,有兴趣可以去找找。同时文章也同步到微信公众号中,有疑问或者兴趣欢迎公众号私信。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/246553.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

卡通角色表情驱动系列二

前言 之前介绍了使用传统算法求解BS系数的表情驱动方法,其中提到过的三种方法之一是基于网格形变迁移做的,那么这篇文章就是对《Deformation Transfer for Triangle Meshes》做表情驱动的解析。 国际惯例,参考博客: 论文原文《…

UE自带重定向原理

UE自带重定向方法验证 核心源码在VS的解决方案中的位置: UE4\Source\Developer\AssetTools\Private\AssetTypeActions\AnimSequence.cpp中第3237行RemapTracksToNewSkeleton函数 跳转方法 AssetTypeActions_AnimationAsset.cpp的RetargetNonSkeletonAnimationHa…

【caffe-Windows】caffe+VS2013+Windows无GPU快速配置教程

前言 首先来一波地址: happynear大神的第三方caffe:http://blog.csdn.net/happynear/article/details/45372231 Neil Z大神的第三方caffe:https://initialneil.wordpress.com/2015/01/11/build-caffe-in-windows-with-visual-studio-2013-…

【caffe-Windows】caffe+VS2013+Windows+GPU配置+cifar使用

前言 国际惯例,先来波地址: CUDA WIN7:链接:http://pan.baidu.com/s/1nvyA3Qp 密码:h0f3 官方网址:https://developer.nvidia.com/cuda-toolkit CUDA WIN10:链接:http://pan.baidu.com/s/1…

【一些网站的收集】包含机器学习深度学习大牛主页等

数学概念部分 旋转矩阵、欧拉角、四元数的比较 欧拉角和四元数的表示 四元数与旋转 B样条曲线 非常好的概率统计学习的主页 误差方差偏差 编程语言学习 C#编程视频 OpenGL编程NeHe OpenGL官网 OpenGL“我叫MT“纯手工3D动画制作之1——基础介绍 【强大】非常好的Op…

c#将像素转换为页面单位

转自:http://blog.csdn.net/zhuzhao/article/details/3553100 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Text; using System.Windows.Forms; using System.Drawing…

世界坐标和页面坐标

在进行绘图时必须考虑这两种坐标。 世界坐标是整个区域的坐标,而页面坐标是可视区的坐标。这两种坐标是通过滚动条来体现出来的。 页面坐标的原点始终是窗口可视区的坐上角,世界坐标的原点始终不变,这两种坐标和VC中的屏幕坐标和客户坐标很…

常用坐标系统

1. 设备坐标系与屏幕坐标系设备坐标(Device Coordinate)又称为物理坐标(Physical Coordinate),是指输出设备上的坐标。通常将屏幕上的设备坐标称为屏幕坐标。设备坐标用对象距离窗口左上角的水平距离和垂直距离来指定对…

华为2014校园招聘的机试题目

华为2014校园招聘的机试题目和2013年的完全一样。 一、题目描述(60分): 通过键盘输入一串小写字母(a~z)组成的字符串。请编写一个字符串过滤程序,若字符串中出现多个相同的字符,将非首次出现的字符过滤掉。 比如字符串…

C++ 命名空间

1. 什么是命名空间 在编程语言中,命名空间是一种特殊的作用域,它包含了处于该作用域中的所有标示符,而且其本身也是由标示符表示的。命名空间的使用目的是为了将逻辑相关的标示符限定在一起,组成相应的命名空间,可使整…

安装好hadoop集群后,报错如下n org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /data/hadoop-roo

master错误: n org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /data/hadoop-root-namenode-master.log._COPYING_ could only be replicated to 0 nodes instead of minReplication (1). There are 0 datanode(s) running and no node(s) ar…

hadoop学习1 java操作HDFS

1、创建目录 package hdfs.operation;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;public class MakeDir {public static void main(String[] args) throws IOExceptio…

hadoop学习2 记录配置hadoop环境的那些坑

1、在你的学习阶段,记住先关闭防火墙。 centos: systemctl stop firewalled.service2、windows本地配置eclipse,远程调测阶段:第一: 还是先关闭防火墙第二: 本地配置文件位置放对第三: 配置的时…

hadoop学习3 查找块的位置

1、hadoop会以块的形式存储在HDFS系统。通过命令可以查看所在节点和块的位置: [rootmaster softpackage]# hadoop fs -put scala-2.10.4.tgz /[rootmaster softpackage]# hadoop fsck /scala-2.10.4.tgz -files -locations -blocksDEPRECATED: Use of this script …

hadoop学习4 调测错误备案

0、An internal error occurred during: "Map/Reduce location status updater". java.lang.NullPointerException解决方法: 关闭防火墙1、Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/yarn/util/Apps解决方…

hadoop学习5 搭建storm集群

参阅: http://www.cnblogs.com/freeweb/p/5179410.html 非常感谢 注意集群的启动顺序以及概念。 [rootmaster bin]# ./storm ui >> /dev/null & [4] 8076 [rootmaster bin]# jps 7930 nimbus 8076 core 3667 SecondaryNameNode 3480 NameNode 7626 Qu…

hadoop学习6 运行map reduce出错

1、一直处理running状态 2、 at com.sun.proxy.$Proxy14.submitApplication(Unknown Source) at org.apache.hadoop.yarn.client.api.impl.YarnClientImpl.submitApplication(YarnClientImpl.java:253) at org.apache.hadoop.mapred.ResourceMgrDelegate.submitApplication(Re…

kafka学习-环境搭建

1、几行命令 ./kafka-console-consumer.sh --zookeeper 192.168.86.133:2181,192.168.86.132:2181,192.168.86.134:2181 --topic shuaige --from-beginning ./kafka-console-producer.sh --broker-list 192.168.86.133:9092,192.168.86.132:9092,192.168.86.134:9092 --topic…

java基础之HashTable和HashMap的区别

1、类继承关系 public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable public class Hashtable<K,V> extends Dictionary<K,V> implements Map<K,V>, Cloneable, java.io.Serializable …

java基础之ConcurrentHashMap

1、基础不牢固&#xff0c;请问接口里面怎么有方法&#xff1f; 这个和一般的方法有啥区别&#xff1f; public interface ConcurrentMap<K, V> extends Map<K, V> {/*** {inheritDoc}** implNote This implementation assumes that the ConcurrentMap cannot* con…