人体姿态估计库 mediapipe

在jetson-nx上文件夹中的whl包就能安装了,在PC的windows上直接pip install mediapipe就能安装

  • whl包参考 零基础入门Jetson Nano——MediaPipe双版本(CPU+GPU)的安装与使用_mediapipe gpu-CSDN博客

目录

1  全身姿态检测

1.1  基本使用

1.2  关键点分析

1.2.1  确定对应关系

1.2.2  通过对应关系判断

1.3  搭配摄像头使用

2  手部姿态检测

2.1  基本使用

2.2  关键点分析

2.2.1  确定对应关系

2.2.2  通过对应关系判断

2.3  搭配摄像头使用


 

1  全身姿态检测

1.1  基本使用

import cv2
import mediapipe as mp
from PIL import ImageFont,ImageDraw,Imagemp_drawing = mp.solutions.drawing_utils
mp_pose = mp.solutions.pose
pose = mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5)image = cv2.imread('right_foot_aboard.jpg')
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
# image = cv2.cvtColor(cv2.flip(image, 1), cv2.COLOR_BGR2RGB)# To improve performance, optionally mark the image as not writeable to
# pass by reference.
image.flags.writeable = False
results = pose.process(image)# Draw the pose annotation on the image.
image.flags.writeable = True
image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)
mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS)pose.close()
cv2.imshow('MediaPipe Pose', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

1.2  关键点分析

1.2.1  确定对应关系

我们可以对识别到的点进行操作,比如检测左侧脚尖在上,还是右脚脚尖在上,也就是32点和31点哪一个在y轴值更小

首先打印一下result

一共是33个点,我们看最后的31和32

我们可以根据图与结果分析出来下面几个信息

  • x轴和y轴以图像的左上角为原点,值越大越靠右或靠下。z轴以屏幕为原点,值越小距离屏幕越远
  • x,y,z是比例值。x估计是与图像宽的比例,y估计是与图像高的比例,z不知道
  • visibility是可见度,值越大越可见,值越小说明可能被遮挡

1.2.2  通过对应关系判断

我们可以通过遍历拿到 左脚、右脚脚尖与图像的比例,然后把他们进行比较

我们换一张图测试一下

1.3  搭配摄像头使用

import cv2
import mediapipe as mp
from PIL import ImageFont, ImageDraw, Imagemp_drawing = mp.solutions.drawing_utils
mp_pose = mp.solutions.pose
pose = mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5)cap = cv2.VideoCapture(0)
while True:ret, frame = cap.read()if ret:image = cv2.cvtColor(cv2.flip(frame, 1), cv2.COLOR_BGR2RGB)image.flags.writeable = Falseresults = pose.process(image)image.flags.writeable = Trueimage = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS)cv2.imshow("capture", image)k = cv2.waitKey(1)if k == ord(' ') :break
# 关闭视频捕获器
cap.release()
# 销毁所有窗口
cv2.destroyAllWindows()
pose.close()

测试过在jetson-nx上用GPU是流畅的。在PC上CPU(CPU与内存配置如下图)是流畅的(GPU没测)

2  手部姿态检测

参考 JetBot手势识别实验_from jetbot import robot-CSDN博客

2.1  基本使用

import cv2
import mediapipe as mp# 初始化MediaPipe Hands模块
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(static_image_mode=True,max_num_hands=2,min_detection_confidence=0.5,min_tracking_confidence=0.5)mp_drawing = mp.solutions.drawing_utils  # 用于绘制关键点的工具# 读取图片
image_path = '1.jpg'  # 这里替换为你的图片路径
image = cv2.imread(image_path)if image is None:print("Cannot find the image.")
else:# 将图像从BGR转换为RGBimage_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# 处理图像,检测手部results = hands.process(image_rgb)# 将图像从RGB转回BGR以显示image_bgr = cv2.cvtColor(image_rgb, cv2.COLOR_RGB2BGR)# 绘制手部关键点if results.multi_hand_landmarks:for hand_landmarks in results.multi_hand_landmarks:mp_drawing.draw_landmarks(image_bgr, hand_landmarks, mp_hands.HAND_CONNECTIONS)# 显示图像cv2.imshow('Hand Detection', image_bgr)cv2.waitKey(0)  # 等待按键cv2.destroyAllWindows()# # 可选:保存输出图像# output_image_path = 'path_to_your_output_image.jpg'  # 输出文件的路径# cv2.imwrite(output_image_path, image_bgr)# print("Output image is saved as", output_image_path)# 释放资源
hands.close()

2.2  关键点分析

2.2.1  确定对应关系

与全身姿态用法相同了,我们简单说一下

results.multi_hand_landmarks[0]可能会有直接变成列表的方法,我这里就直接用正则取了

import cv2
import mediapipe as mp
import rep = re.compile(r'landmark {\n  x: .*\n  y: .*\n  z: .*\n}')
# 初始化MediaPipe Hands模块
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(static_image_mode=True,max_num_hands=2,min_detection_confidence=0.5,min_tracking_confidence=0.5)mp_drawing = mp.solutions.drawing_utils  # 用于绘制关键点的工具# 读取图片
image_path = '1.jpg'  # 这里替换为你的图片路径
image = cv2.imread(image_path)if image is None:print("Cannot find the image.")
else:# 将图像从BGR转换为RGBimage_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# 处理图像,检测手部results = hands.process(image_rgb)# print()id = 0for result in p.findall(str(results.multi_hand_landmarks[0])):print('id',id)id = id + 1print(result)print()# 将图像从RGB转回BGR以显示image_bgr = cv2.cvtColor(image_rgb, cv2.COLOR_RGB2BGR)# 绘制手部关键点if results.multi_hand_landmarks:for hand_landmarks in results.multi_hand_landmarks:mp_drawing.draw_landmarks(image_bgr, hand_landmarks, mp_hands.HAND_CONNECTIONS)cv2.imshow('Hand Detection', image_bgr)cv2.waitKey(0)  # 等待按键cv2.destroyAllWindows()hands.close()

我们重点关注食指,通过点位图来看不是8就16

对比图像来看,食指的顶点应该过图像的一半,所以16不符合。之后考虑8,观察其他点与8点的y值可以看出8点比其他的点的y值要小,基本可以断定8点就是食指的顶点

2.2.2  通过对应关系判断

我们比如要判断食指是否伸展,那么就判断 |8的y-0的y| 是否大于 |7的y-0的y|

  • 上面这个条件仅考虑手掌面对摄像头或背对摄像头的情况,不考虑手掌冲上或冲下的情况

import cv2
import mediapipe as mp
import rep = re.compile(r'y: (.*)')
# 初始化MediaPipe Hands模块
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(static_image_mode=True,max_num_hands=2,min_detection_confidence=0.5,min_tracking_confidence=0.5)mp_drawing = mp.solutions.drawing_utils  # 用于绘制关键点的工具# 读取图片
image_path = '6.jpg'  # 这里替换为你的图片路径
image = cv2.imread(image_path)if image is None:print("Cannot find the image.")
else:# 将图像从BGR转换为RGBimage_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# 处理图像,检测手部results = hands.process(image_rgb)y_list = p.findall(str(results.multi_hand_landmarks[0]))if abs(float(y_list[8])-float(y_list[0]))>abs(float(y_list[7])-float(y_list[0])):print('食指伸展')else:print('食指不伸展')# 将图像从RGB转回BGR以显示image_bgr = cv2.cvtColor(image_rgb, cv2.COLOR_RGB2BGR)# 绘制手部关键点if results.multi_hand_landmarks:for hand_landmarks in results.multi_hand_landmarks:mp_drawing.draw_landmarks(image_bgr, hand_landmarks, mp_hands.HAND_CONNECTIONS)cv2.imshow('Hand Detection', image_bgr)cv2.waitKey(0)  # 等待按键cv2.destroyAllWindows()hands.close()

换一张图测一下

如果要通过5个手指的判断手势是有点复杂的,而且mediapipe也不一定准,所以不建议通过mediapipe做手势识别

2.3  搭配摄像头使用

注意在代码中把static_image_mode改为False

import cv2
import mediapipe as mpmp_hands = mp.solutions.hands
hands = mp_hands.Hands(static_image_mode=False,max_num_hands=2,min_detection_confidence=0.5,min_tracking_confidence=0.5)mp_drawing = mp.solutions.drawing_utilscap = cv2.VideoCapture(0)
while True:ret, frame = cap.read()if ret:image_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)results = hands.process(image_rgb)image_bgr = cv2.cvtColor(image_rgb, cv2.COLOR_RGB2BGR)if results.multi_hand_landmarks:for hand_landmarks in results.multi_hand_landmarks:mp_drawing.draw_landmarks(image_bgr, hand_landmarks, mp_hands.HAND_CONNECTIONS)cv2.imshow("capture", image_bgr)k = cv2.waitKey(1)if k == ord(' '):breakcap.release()
cv2.destroyAllWindows()

测试环境与全身姿态检测相同,运行流畅。在nx中会出现下面两个warning,就结果来看问题不大

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/867146.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Oracle Database 23ai新特性:增加聚合函数对INTERVAL数据类型支持

在Oracle早期的版本,聚合函数和分析函数MIN/MAX 就支持了INTERVAL 数据类型。但是,当我们使用SUM或AVG函数对INTERVAL 数据类型进行运算时,就会报错。 随着Oracle Database 23ai 的发布,增加了 AVG 以及 SUM 函数对INTERVAL 数据…

VirtualBox 安装 Ubuntu Server24.04

环境: ubuntu-2404-server、virtualbox 7.0.18 新建虚拟机 分配 CPU 核心和内存(根据自己电脑实际硬件配置选择) 分配磁盘空间(根据自己硬盘实际情况和需求分配即可) 设置网卡,网卡1 负责上网&#xff0c…

零代码复现SCI!P trend+多模型控制混杂一站式搞定!

今天给大家带来的复现内容是CHARLS数据库的一篇横断面研究文章,文章统计方法部分包括了①基线差异性分析、②线性趋势分析计算P trend、③多模型线性回归控制混杂因素。 这些统计方法风暴统计统统一站式搞定,零代码操作,新手小白也可以轻松上…

linux 发送报文的几种方式

使用nc连接服务并发送16进制:echo -e 7E7E026020000263002002101000010001B7C7 | xxd -r -p |nc 172.16.0.42 20004 telnet 发送报文:1.telnet > open host port > 7E7E026020000263002002101000010001B7C7 socat 方式: echo sdfsdfsdf…

IDEA创建Spring项目无法使用Java8的解决方案

文章目录 一,创建Project,无法选择Java81,无法选择Java82,选择JDK17报错 二,原因分析1,Spring Boot将来会全力支持Java17,不再维护支持Java8的版本 三,解决方案1,使用国内…

构建基于Spring Boot的数据分析平台

构建基于Spring Boot的数据分析平台 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 在当今信息化时代,数据是企业和组织的重要资产。构建一个高效…

Cross Debugging with GDB: Embedded Linux

This is suitable for environments with limited resources and insufficient memory, to avoid out-of-memory errors caused by running gdb. The uclibc platform does not yet support this functionality. 文章目录 Install gdb-multiarch on PCRun gdbserver on DUTPre…

三级_01_网络系统结构与设计的基本原则

1.下列关于RPR技术的描述中,错误的是()。 RPR与FDDI一样使用双环结构 在RPR环中,源节点向目的节点成功发出的数据帧要由目的节点从环中收回 RPR环中每一个节点都执行MPLS公平算法 RPR环能够在50ms内实现自愈 2.下列关于RPR技术的描述中,…

Vue项目使用mockjs模拟后端接口

文章目录 操作步骤1. 安装 mockjs 和 vite-plugin-mock2. 安装 axios3. 创建mock路径4. 配置 viteMockConfig5. 编写第一个mock接口6. 创建 createProdMockServer7. 配置 axios8. 编写请求接口9. 在页面中使用 操作步骤 1. 安装 mockjs 和 vite-plugin-mock vite-plugin-mock …

springboot的健身房预约管理系统-计算机毕业设计源码75535

目录 1 绪论 1.1 选题背景与意义 1.2国内外研究现状 1.3论文结构与章节安排 1.4开发技术 1.4.1 Java技术 1.4.2MVVM模式 1.4.3B/S结构 1.4.4SpringBoot框架 1.4.5 Mysql数据库 2系统分析 2.1 可行性分析 2.1.1经济可行性 2.1.2技术可行性 2.1.3操作可行性 2.2 系…

SpringBoot 自定义异常返回数据格式

Spring Boot 默认异常处理 当我们用 spring boot 开发接口是,当遇到异常时返回的数据格式是如下形式的 {"timestamp": "2024-07-06T02:48:55.79100:00","status": 404,"error": "Not Found","path":…

在 Windows 上安装移动应用和Amazon Appstore

https://support.microsoft.com/zh-cn/windows/在-windows-上安装移动应用和amazon-appstore-f8d0abb5-44ad-47d8-b9fb-ad6b1459ff6c

【Linux】GNU是什么

GNU是一个自由软件项目,其全称是“GNUs Not Unix!”,由理查德斯托曼(Richard Stallman)于1983年发起。GNU项目的目标是创建一个完全自由的操作系统,包括一整套完全自由的软件工具,以取代Unix系统。这里的“…

matlab 花瓣线绘制

matlab 花瓣线绘制 clc,clear,close all; % 创建一个范围内的 x 和 y 值 x linspace(-1.5, 1.5, 100); y linspace(-1.5, 1.5, 100);% 创建一个网格来表示 x 和 y 值的组合 [X, Y] meshgrid(x, y);% 计算方程的左边和右边的值 LHS1 X.^2 Y.^2; RHS1 X.^4 Y.^4;LHS2 X.…

接口对接json

public AjaxResult zhihuiya(RequestBody ZlRecord zlRecord) {//查看用户或者部门有没有下载次数SysUser user SecurityUtils.getLoginUser().getUser();ZlCount zlCount newLabelMapper.selectUserCount(user.getUserId());if (ObjectUtils.isEmpty(zlCount)){ZlCount zlCo…

vue2-vue3响应式原理

我们先来看一下响应式意味着什么?我们来看一段代码: m有一个初始化的值,有一段代码使用了这个值;那么在m有一个新的值时,这段代码可以自动重新执行; let m 20 console.log(m) console.log(m * 2)m 40上…

计算机网络-IP组播基础

一、概述 在前面的学习交换机和路由协议,二层通信是数据链路层间通信,在同一个广播域间通过源MAC地址和目的MAC地址进行通信,当两台主机第一次通信由于不清楚目的MAC地址需要进行广播泛洪,目的主机回复自身MAC地址,然后…

【语音识别算法】深度学习语音识别算法与传统语音识别算法的区别、对比及联系

深度学习语音识别算法与传统语音识别算法在理论基础、实现方式、性能表现等方面存在显著区别,同时也有一些联系。下面将从几个方面详细比较这两种方法,并给出应用实例和代码示例。 一、理论基础与实现方式 1.传统语音识别算法: 特征提取&a…

【Android】ADB 使用指南

ADB 使用指南 Android Debug Bridge (ADB) 是一个功能强大的命令行工具,可以让你直接与连接的 Android 设备进行通信。它可以用于多种用途,包括安装和调试应用程序、传输文件、执行命令等。本指南将介绍 ADB 的基本使用方法和常用命令。 安装 ADB 在 …

MySQL数据库树状结构查询

一、树状结构 MySQL数据库本身并不直接支持树状结构的存储,但它提供了足够的灵活性,允许我们通过不同的方法来模拟和实现树状数据结构。具体方法看下文。 数据库表结构: 实现效果 查询的结果像树一样 二、使用 以Catalog数据表&#xff0c…