人体姿态估计是计算机视觉领域的一个重要研究领域。它涉及估计人体上的独特点,也称为关键点。在这篇博文中,我们将讨论一种在包含人类的图像上查找关键点的算法,称为Keypoint-RCNN。该代码是使用 Pytorch 使用Torchvision库编写的。
假设您想要建立一名私人健身教练,可以通过分析身体关节的姿势来指导您采取正确的身体姿势。这就是姿势估计发挥作用的地方。
关键点检测的思想是检测图像中的兴趣点或关键位置。这些可能是:
- 面部标志(如鼻尖、眼角、面部边界等)
- 或人的身体关节(肩膀、手腕、脚踝)
- 或图像中的角点和斑点
从 RCNN 到 Mask-RCNN
- 这一切都始于 RCNN(基于区域的卷积神经网络)演变成 Fast-RCNN,然后是 Faster-RC