简易机器学习笔记(十一)opencv 简易使用-人脸识别、分类任务

前言

前段时间摸了下机器学习,然后我发现其实openCV还是一个很浩瀚的库的,现在也正在写一篇有关yolo的博客,不过感觉理论偏多,所以在学yolo之前先摸一下opencv,简单先写个项目感受感受opencv。

流程

openCV实际上已经有一个比较完整的模型了,下载在haarcascades

这里我们下haarcascade_frontalface_default.xml以备用。

在做人脸识别的时候流程就比较简单了

  1. 读取图片
  2. 创建Haar级联器
  3. 图片转灰度图(可以不转,转了能更快而已)
  4. 通过Haar级联分类器来检测人脸面部特征,返回faces结构
  5. 使用openCV的接口,在原图上框选出结果,并展示

编码

这里代码偏简单,就不过多介绍了

import numpy as np
import cv2img = './faces/lena.bmp'
#脸部Haar级联器
facer_path = './faces/haarcascade_frontalface_default.xml'
facer = cv2.CascadeClassifier(facer_path)img = cv2.imread(img)gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#执行人脸识别#现在可以使用Haar级联分类器来检测人脸和其他面部特征faces = facer.detectMultiScale(gray,1.35,3)for(x,y,w,h) in faces:cv2.rectangle(img,(x,y),(x+w,y+h),(0,0,255),2)roi_img = img[y:y+h, x:x+w]cv2.imshow('img', img)
cv2.waitKey()

结果:
在这里插入图片描述

进阶

且不看运行的结果如何,但从结果你就可以看出来,这里只是把人脸从图片中框出来了。但这还不够,我们实际上不仅希望你可以把人脸圈出来,还希望能把人脸分类,比如A是A,B是B这样。

OpenCV提供了3种人脸识别方法,分别是Eigenfaces、Fisherfaces和LBPH。这3种方法都是通过对比样本的特征最终实现人脸识别。因为这3种算法提取特征的方式不一样,侧重点不同,所以不能分出孰优孰劣,只能说每种方法都有各自的识别风格。 OpenCV为每一种人脸识别方法都提供了创建识别器、训练识别器和识别3种方法,这3种方法的语法非常相似。我这里只简单说说Eigenfaces怎么调用,至于其他的两种读者感兴趣可以自己去搜索。

Eigenfaces人脸识别器

Eigenfaces也叫作“特征脸”。Eigenfaces通过PCA(主成分分析)方法将人脸数据转换到另外一个空间维度做相似性计算。在计算过程中,算法可以忽略一些无关紧要的数据,仅识别一些具有代表性的特征数据,最后根据这些特征识别人脸。 开发者需要通过以下3种方法完成人脸识别操作。

(1)通过cv2.face.EigenFaceRecognizer_create()方法创建Eigenfaces人脸识别器,其语法如下:

recognizer = cv2.face.EigenFaceRecognizer_create(num_components, threshold)

参数说明:

num_components:可选参数,PCA方法中保留的分量个数,建议使用默认值。

threshold:可选参数,人脸识别时使用的阈值,建议使用默认值。

返回值说明:

recognizer:创建的Eigenfaces人脸识别器对象。

(2)创建识别器对象后,需要通过对象的train()方法训练识别器。建议每个人都给出2幅以上的人脸图像作为训练样本。train()方法的语法如下:

recognizer.train(src, labels)

对象说明:

recognizer:已有的Eigenfaces人脸识别器对象。 参数说明:

src:用来训练的人脸图像样本列表,格式为list。样本图像必须宽、高一致。

labels:样本对应的标签,格式为数组,元素类型为整数。数组长度必须与样本列表长度相同。样本与标签按照插入顺序一一对应。

(3)训练识别器后可以通过识别器的predict()方法识别人脸,该方法对比样本的特征,给出最相近的结果和评分,其语法如下:

label, confidence = recognizer.predict(src)

对象说明:

recognizer:已有的Eigenfaces人脸识别器对象。 参数说明:

src:需要识别的人脸图像,该图像宽、高必须与样本一致。 返回值说明:

label:与样本匹配程度最高的标签值。

confidence:匹配程度最高的信用度评分。评分小于5000匹配程度较高,0分表示2幅图像完全一样。 下面通过一个实例来演示Eigenfaces人脸识别器的用法。

确定流程

最后我们来确定一下流程:

  1. 读取数据
  2. 创建特征脸识别器
  3. 输入图片和labels开始训练
  4. 输入需要识别的人脸图像
  5. 得到输出

我这里把我的训练集整理了以下,名称打在前面。我这里照片是我自己找的,具体的图片训练集大伙可以自己去设定。

在这里插入图片描述

具体代码如下,代码的功能可以参考注释

import numpy as np
import cv2
import osface_path = './faces'
photos = list()
labels = list()# 设置期望的图像大小
desired_size = (811, 843)
#定义labels
names = {"0":"mengzi","1":"qy","2":"lx","3":"qq"}
# 从当前路径中读取到所有的file
for root, dirs, files in os.walk(face_path):for file in files:if '.xml' in file:continueimg_path = os.path.join(root, file)img = cv2.imread(img_path, 0)# 图片需要设置到期望大小,因为模型输入的图片大小都必须是统一值,否则会无法训练img_resized = cv2.resize(img, desired_size) # 根据图片的人脸,对应到names,插入到labels  if 'mengzi' in file: # 读取图像并调整大小 labels.append(0)elif 'qy' in file:labels.append(1)elif 'lx' in file:labels.append(2)elif 'qq' in file:labels.append(3)else:continuephotos.append(img_resized)#创建人脸识别器
recognizer = cv2.face.EigenFaceRecognizer_create()
recognizer.train(photos, np.array(labels))# 读取测试图像并调整大小
target = cv2.imread(face_path + '/test5.jpg', 0)
target_resized = cv2.resize(target, desired_size)#输出待识别对象
label, confidence = recognizer.predict(target_resized)print('confidence = ' + str(confidence))
print(names[str(label)])

结果

这里代码其实也能看得出,最后之能输出图片中人物的label和执行度,这样我们倒是完成了一个分类的工作。但是这里有个问题,就是我们不仅仅需要分类,还需要知道人脸的具体位置。

结合Haar级联器和Eigenfaces人脸识别器实现人脸划分

前言

刚刚说了两种,一个是划分区域,一个是打标签,那么能不能即划分区域,又打上标签呢?当然是可以的,接下来就简单说说怎么做。

流程

实际上流程就是把两个模式结合起来,先使用Haar级联器划分出脸部区域,然后再用Eigenfaces人脸识别器去检查分出的脸部区域的对象名称,然后将标签放在图片上即可。

  1. 加载Haar级联分类器
  2. 读取文件并训练Eigenfaces人脸识别器
  3. 读取目标图片
  4. 通过Haar级联分类器扫描得到目标图片中的所有人脸框
  5. 对所有人脸框使用Eigenfaces人脸识别器进行识别
  6. 画上方框,并打上标签

代码

代码如下:

import numpy as np
import cv2
import os# 加载Haar级联分类器
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')
face_path = './faces'
photos = list()
labels = list()# 读取学习图片
desired_size = (811, 843)
names = {"0":"mengzi","1":"qy","2":"lx","3":"qq","4":"ch"}
for root, dirs, files in os.walk(face_path):for file in files:if '.xml' in file:continueimg_path = os.path.join(root, file)img = cv2.imread(img_path, 0)img_resized = cv2.resize(img, desired_size)if 'mengzi' in file: # 读取图像并调整大小 labels.append(0)elif 'qy' in file:labels.append(1)elif 'lx' in file:labels.append(2)elif 'qq' in file:labels.append(3)elif 'ch' in file:labels.append(4)else:continuephotos.append(img_resized)# 训练人脸识别器
recognizer = cv2.face.EigenFaceRecognizer_create()
recognizer.train(photos, np.array(labels))
# 读取测试图像
target = cv2.imread(face_path + '/test_ch.jpg')
target_gray = cv2.cvtColor(target, cv2.COLOR_BGR2GRAY)# 检测人脸
faces = face_cascade.detectMultiScale(target_gray, scaleFactor=1.2, minNeighbors=5, minSize=(30, 30))# 对于每个检测到的人脸
for (x, y, w, h) in faces:# 在原图上绘制矩形框出人脸cv2.rectangle(target, (x, y), (x+w, y+h), (255, 0, 0), 2)# 提取人脸区域并调整到期望大小face_region = target_gray[y:y+h, x:x+w]face_resized = cv2.resize(face_region, desired_size)# 使用EigenFaceRecognizer进行预测label, confidence = recognizer.predict(face_resized)# 将识别的名字和置信度打印在图像上方cv2.putText(target, f'{names[str(label)]} - {confidence:.2f}', (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (36,255,12), 2)# 显示图像
cv2.imshow('Face Recognition', target)
cv2.waitKey(0)
cv2.destroyAllWindows()

测试结果:
虽然打了马赛克,但是实际上结果是可以置信的。在这里,还可以根据置信程度来对不同的人脸进行筛选,比如不想要的脸或者置信程度不高的脸可以再进行舍弃。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/627527.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Go interface基础

接口类型是对其它类型行为的概括与抽象。通过使用接口,我们可以写出更加灵活和通用的函数,这些函数不用绑定在一个特定的类型实现上。 很多面向对象的语言都有接口这个概念,Go 语言的接口的独特之处在于它是隐式实现。换句话说,对…

maven导入无法拉取所需依赖

maven导入无法拉取所需依赖 1.原因2.解决搞定收工&#xff01; 1.原因 公司使用的是gradle&#xff0c;配置的私有云&#xff0c;maven里面配置私有云完全使用不了&#xff0c;无论配置国内还是国外的&#xff0c;导入的项目报错拉不到jar包。 <mirror><id>mirro…

数据资本:数字经济时代的新力量

在当今的数字经济时代&#xff0c;数据已成为一种新的资本形式&#xff0c;具有巨大的价值和影响力。数据资本的概念也应运而生&#xff0c;它指的是以数据为基础的经济活动中所产生的价值和收益。本文将探讨数据资本的概念、特点以及其对经济和社会的影响以及未来发展趋势。 …

Dhcp中继ensp

拓扑图 <Huawei>system-view [Huawei]sysname SW1 [SW1]vlan batch 10 20 [SW1]int e0/0/1 #配置access接口 [SW1-Ethernet0/0/1]port link-type access [SW1-Ethernet0/0/1]port default vlan 10 [SW1-Etherne…

[C#]利用paddleocr进行表格识别

【官方框架地址】 https://github.com/PaddlePaddle/PaddleOCR.git 【算法介绍】 PaddleOCR表格识别是PaddlePaddle开源项目中的一个强大功能&#xff0c;它利用深度学习技术实现了对各类表格的高精度识别。PaddleOCR表格识别能够处理各种复杂的表格&#xff0c;包括但不限于…

【语音助手】语音识别框架的简单介绍

文章目录 ASR 框架常见的ASR框架用于嵌入式领域的ASR框架 NLP 框架常用NLP框架用于嵌入式领域的NLP框架 TTS 框架常见的TTS 框架用于嵌入式领域的TTS 框架 ASR&#xff1a;语音识别&#xff08;ASR&#xff09;是一种将语音信号转换为文本的技术。NLP&#xff1a;自然语言处理。…

cartopy,一个非常好用的 Python 库!

更多资料获取 &#x1f4da; 个人网站&#xff1a;ipengtao.com 大家好&#xff0c;今天为大家分享一个非常好用的 Python 库 - cartopy。 Github地址&#xff1a;https://github.com/SciTools/cartopy 地图数据可视化在许多领域中都是至关重要的&#xff0c;无论是用于气象学…

IDEA2023的激活与安装(全网最靠谱,最快捷的方式)

前言&#xff1a; 相信很多小伙伴已经开始了java的学习之旅&#xff0c;想要更快乐的学习当然少不了IDEA这个得力的开发工具软件。但是IDEA是付费的&#xff0c;免费版功能有太少&#xff0c;怎么才能既免费&#xff0c;又能使用上正式版呢&#xff01;当然还是激活啦&#xf…

json 读取中文、保存为中文的json文件

pycharm 打开的json文件 通过代码读取中文文件 保存中文的json文件&#xff1a; import jsonwith open(garbage_classification.json,encodingutf-8-sig,moder) as f:data json.load(f) # print(data) {0: 可回收物_金属食品罐, 1: 其他垃圾_PE塑料袋, 2: 其他垃圾_污损塑…

设备树下Led驱动实验-向设备树文件添加Led设备节点

一. 简介 前面简单学习了设备树文件的内容&#xff0c;语法&#xff0c;以及如何向设备树文件中添加设备节点信息。学习了驱动开发时&#xff0c;会使用到的设备树常用OF操作函数。本文我们就开始第一个基于设备树的 Linux 驱动实验-LED驱动实现。 本文具体学习在设备树文件添…

vlc播放rtsp视频流

简单记录一下项目中用到的浏览器内嵌vlc播放rtsp视频流 首先使用object标签&#xff0c;关于object标签的介绍&#xff0c;放一张图 页面设置 <object class"vlc-box" ref"vlc" type"application/x-vlc-plugin"windowless"true"pl…

redis原理(五)数据安全之主从复制

本篇介绍主从复制来保障Redis的数据安全。

yum仓库和nfs

目录 一、yum 1.1.yum概述 1.2.yum实现过程 1.3.yum配置文件 1.4.仓库设置文件/etc/yum.repos.d/*.repo 1.5.yum命令 二、NFS 2.1.NFS介绍 2.2.NFS特点 2.3.NFS优势 2.4.NFS原理 2.5.NFS共享存储服务 一、yum 1.1.yum概述 基于RPM包构建的软件更新机制 可以自动…

推荐三个非常好用的视频转文字工具

在处理视频文件时&#xff0c;有时我们需要将视频中的语音内容转换为文字形式&#xff0c;以便于整理、编辑或搜索。传统的视频转文字方法往往需要耗费大量时间和人力&#xff0c;而且准确度难以保证。现在&#xff0c;有了水印云等视频转文字神器&#xff0c;我们可以快速、准…

JS | JS调用EXE

JS | JS调用EXE 网上洋洋洒洒一大堆文章提供,然我还是没找打合适的方案: 注册表方案做了如下测试(可行但是不推荐?): 先,键入文件名为 myprotocal.reg 的注册表,并键入一下信息: Windows Registry Editor Version 5.00[HKEY_CLASSES_ROOT\openExe] //协议名…

开发知识付费系统源码详解:搭建内容付费平台的完整指南

本篇文章&#xff0c;小编将继续讲解如何开发知识付费系统&#xff0c;并通过详细的源码解析为您提供搭建内容付费平台的完整指南。 一、技术选型 在搭建知识付费系统之前&#xff0c;首先需要选择适合项目的技术栈。我们将详细介绍前后端技术的选择&#xff0c;包括数据库、…

C#编程-了解进程的通信

了解进程的通信 逻辑上一个应用程序内的所有线程都包含在进程内。这是应用程序运行的操作系统单元。进程是程序的一个运行实例。运行时在同一计算机内或通过网络的进程间通信被称为进程内通信。要允许进程间通信,需要使用特殊的技术和机制。 考虑一个您打文档的场景。您使用…

什么是希尔伯特曲线

参考&#xff1a; https://zhuanlan.zhihu.com/p/96729071?ivk_sa1024320u&utm_id0 https://observablehq.com/mbostock/visualizing-order Conclusion n 阶的希尔伯特曲线是从 [0,1] 区间到[0,1][0,1]平面区域的映射 , 把 0 和1 映射到区域左下角和右下角: (0)(0,0), (0…

bclinux升级ssh openssh-9.5p1

bclinux升级ssh_openssh-9.5 资源下载&#xff1a;https://download.csdn.net/download/qq_41210783/88750470 #!/bin/bash # cp /etc/pam.d/sshd /etc/pam.d/sshd.bak >/dev/null 2>&1 cp /etc/ssh/sshd_config /etc/ssh/sshd_config.bak >/dev/null 2>&am…

快速知识付费平台搭建,一分钟搭建你的专属知识服务平台

产品服务 线上线下课程传播 线上线下活动管理 项目撮合交易 找商机找合作 一对一线下交流 企业文化宣传 企业产品销售 更多服务 实时行业资讯 动态学习交流 分销代理推广 独立知识店铺 覆盖全行业 个人IP打造 独立小程序 私域运营解决方案 公域引流 营销转化 …