开源计算机视觉库opencv-python详解

开源计算机视觉库opencv-python详解

      • OpenCV-Python的核心功能:
      • 安装OpenCV-Python:
      • 使用OpenCV-Python的基本步骤:
      • OpenCV-Python的高级应用:
      • 注意事项:
      • OpenCV-Python的高级应用示例:
        • 1. 人脸识别
        • 2. 目标跟踪
        • 3. 特征匹配
      • 注意事项:
      • 深度学习集成示例:
        • 1. 使用OpenCV和TensorFlow进行物体检测
        • 2. 使用OpenCV进行实时人脸识别
      • 结束语:

OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库。OpenCV-Python是其Python接口,结合了OpenCV C++ API和Python语言的特点,使得在Python中实现高效、强大的计算机视觉任务变得简单。

OpenCV-Python的核心功能:

  1. 图像处理:包括图像滤波、几何变换、颜色空间转换、直方图处理等。
  2. 视频分析:涉及运动估计、背景减除、对象跟踪等。
  3. 2D和3D特征工具:用于特征检测、描述和匹配。
  4. 相机校准和3D重建:包括立体匹配和结构从运动中恢复。
  5. 机器学习:包括常用的机器学习算法,如SVM、决策树、Boosting等。
  6. 深度学习:与TensorFlow、Caffe等深度学习框架集成,用于图像识别、目标检测等。
  7. 高级视觉:例如SLAM(Simultaneous Localization and Mapping)、光流等。

安装OpenCV-Python:

在Python环境中,通常可以使用pip进行安装:

pip install opencv-python

如果需要包含OpenCV的contrib模块,可以使用:

pip install opencv-contrib-python

使用OpenCV-Python的基本步骤:

  1. 导入库
import cv2
  1. 读取和显示图像
image = cv2.imread('image.jpg')
cv2.imshow('Image', image)
cv2.waitKey(0)
cv2.destroyAllWindows()
  1. 处理图像
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
  1. 保存图像
cv2.imwrite('gray_image.jpg', gray_image)
  1. 处理视频
cap = cv2.VideoCapture('video.mp4')
while True:ret, frame = cap.read()if not ret:breakgray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)cv2.imshow('Video', gray_frame)if cv2.waitKey(1) & 0xFF == ord('q'):break
cap.release()
cv2.destroyAllWindows()

OpenCV-Python的高级应用:

  • 人脸识别:使用Haar级联进行人脸检测。
  • 目标跟踪:使用Meanshift或Camshift算法跟踪视频中的对象。
  • 特征匹配:使用SIFT、SURF等算法进行特征提取和匹配。
  • 图像分割:使用阈值、边缘检测、区域生长等方法进行图像分割。
  • 机器学习:利用OpenCV中的机器学习模块进行图像分类、回归等任务。

注意事项:

  • OpenCV-Python默认使用BGR格式读取和显示图像,而不是RGB格式。
  • 在使用OpenCV处理图像时,颜色空间转换是一个常见的步骤。
  • 对于不同的计算机视觉任务,可能需要安装额外的库或模块。
    OpenCV-Python因其强大的功能和易用性,被广泛应用于学术研究和工业项目中。随着深度学习在计算机视觉领域的快速发展,OpenCV-Python也在不断集成新的深度学习模型和算法。

OpenCV-Python的高级应用示例:

1. 人脸识别

OpenCV提供了预训练的Haar级联分类器,可以用于检测图像中的人脸。以下是一个简单的示例:

import cv2
# 加载Haar级联分类器
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')
# 读取图像
img = cv2.imread('group_photo.jpg')
# 转换为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 检测人脸
faces = face_cascade.detectMultiScale(gray, 1.1, 4)
# 为每个检测到的人脸画矩形
for (x, y, w, h) in faces:cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
# 显示结果
cv2.imshow('Detected Faces', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
2. 目标跟踪

OpenCV中的Meanshift和Camshift算法可以用于跟踪视频中的移动对象。

import cv2
# 初始化视频捕获对象
cap = cv2.VideoCapture('tracking_video.mp4')
# 读取第一帧
ret, frame = cap.read()
# 设置初始跟踪窗口
x, y, w, h = 300, 200, 100, 50
track_window = (x, y, w, h)
# 设置ROI用于跟踪
roi = frame[y:y+h, x:x+w]
# 转换为HSV并创建掩模
hsv_roi = cv2.cvtColor(roi, cv2.COLOR_BGR2HSV)
mask = cv2.inRange(hsv_roi, np.array((0., 60., 32.)), np.array((180., 255., 255.)))
# 计算直方图,用于反向投影
roi_hist = cv2.calcHist([hsv_roi], [0], mask, [180], [0, 180])
cv2.normalize(roi_hist, roi_hist, 0, 255, cv2.NORM_MINMAX)
# 设置终止条件,迭代10次或移动至少1 pt
term_crit = (cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 1)
while True:ret, frame = cap.read()if not ret:break# 转换为HSVhsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)dst = cv2.calcBackProject([hsv], [0], roi_hist, [0, 180], 1)# 应用Meanshift获取新位置ret, track_window = cv2.meanShift(dst, track_window, term_crit)# 在图像上绘制它x, y, w, h = track_windowimg2 = cv2.rectangle(frame, (x, y), (x+w, y+h), 255, 2)cv2.imshow('Meanshift Tracking', img2)k = cv2.waitKey(60) & 0xffif k == 27:break
cv2.destroyAllWindows()
cap.release()
3. 特征匹配

使用SIFT、SURF等算法进行特征提取和匹配,可以用于图像拼接、3D重建等。

import cv2
import numpy as np
# 读取两幅图像
img1 = cv2.imread('box.png', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('box_in_scene.png', cv2.IMREAD_GRAYSCALE)
# 初始化SIFT检测器
sift = cv2.SIFT_create()
# 计算关键点和描述符
kp1, des1 = sift.detectAndCompute(img1, None)
kp2, des2 = sift.detectAndCompute(img2, None)
# 使用BFMatcher进行匹配
bf = cv2.BFMatcher()
matches = bf.knnMatch(des1, des2, k=2)
# 应用比率测试
good = []
for m, n in matches:if m.distance < 0.75 * n.distance:good.append(m)
# 绘制匹配结果
img3 = cv2.drawMatches(img1, kp1, img2, kp2, good, None, flags=2)
cv2.imshow('Feature Matches', img3)
cv2.waitKey(0)
cv2.destroyAllWindows()

注意事项:

  • OpenCV-Python的函数通常接受NumPy数组作为输入和输出,因此熟悉NumPy库对于有效地使用OpenCV非常重要。
  • 在使用

深度学习模型和算法时,OpenCV-Python可能需要额外的依赖项,如TensorFlow、PyTorch或ONNX Runtime等。

深度学习集成示例:

1. 使用OpenCV和TensorFlow进行物体检测
import cv2
import tensorflow as tf
# 加载TensorFlow的物体检测模型(假设已经有一个冻结的GraphDef模型)
model_path = 'frozen_inference_graph.pb'
labels_path = 'mscoco_label_map.pbtxt'
num_classes = 90
# 加载模型和标签
detection_graph = tf.Graph()
with detection_graph.as_default():od_graph_def = tf.GraphDef()with tf.gfile.GFile(model_path, 'rb') as fid:serialized_graph = fid.read()od_graph_def.ParseFromString(serialized_graph)tf.import_graph_def(od_graph_def, name='')
# 加载标签
label_map = label_map_util.load_labelmap(labels_path)
categories = label_map_util.convert_label_map_to_categories(label_map, max_num_classes=num_classes, use_display_name=True)
category_index = label_map_util.create_category_index(categories)
# 读取图像
image_np = np.array(cv2.imread('object_detection.jpg'))
# 执行物体检测
with detection_graph.as_default():with tf.Session(graph=detection_graph) as sess:# 扩展图像维度image_np_expanded = np.expand_dims(image_np, axis=0)image_tensor = detection_graph.get_tensor_by_name('image_tensor:0')boxes = detection_graph.get_tensor_by_name('detection_boxes:0')scores = detection_graph.get_tensor_by_name('detection_scores:0')classes = detection_graph.get_tensor_by_name('detection_classes:0')num_detections = detection_graph.get_tensor_by_name('num_detections:0')# 运行模型(boxes, scores, classes, num_detections) = sess.run([boxes, scores, classes, num_detections],feed_dict={image_tensor: image_np_expanded})# 可视化结果v = visualize_boxes_and_labels_on_image_array(image_np,np.squeeze(boxes),np.squeeze(classes).astype(np.int32),np.squeeze(scores),category_index,use_normalized_coordinates=True,line_thickness=8)# 显示图像cv2.imshow('Object Detection', image_np)cv2.waitKey(0)cv2.destroyAllWindows()
2. 使用OpenCV进行实时人脸识别
import cv2
# 加载人脸识别模型(假设已经训练好了)
face_recognizer = cv2.face.LBPHFaceRecognizer_create()
face_recognizer.read('face_model.yml')
# 加载Haar级联分类器
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')
# 启动视频捕获
cap = cv2.VideoCapture(0)
while True:ret, frame = cap.read()if not ret:breakgray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)faces = face_cascade.detectMultiScale(gray, 1.1, 4)for (x, y, w, h) in faces:face_roi = gray[y:y+h, x:x+w]# 进行预测label, confidence = face_recognizer.predict(face_roi)cv2.putText(frame, str(label), (x, y-5), cv2.FONT_HERSHEY_PLAIN, 1.5, (0, 255, 0), 2)cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)cv2.imshow('Face Recognition', frame)if cv2.waitKey(1) & 0xFF == ord('q'):break
cap.release()
cv2.destroyAllWindows()

结束语:

OpenCV-Python是一个非常强大的工具,它为计算机视觉任务提供了一个丰富的函数库。通过结合深度学习和其他机器学习技术,OpenCV-Python可以用于解决复杂的问题,如图像识别、物体检测、人脸识别等。随着技术的发展,OpenCV-Python也在不断更新和改进,以支持更多的功能和算法。如果您对特定功能或应用有更多的问题,欢迎继续提问。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/724747.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

记录一则 线上域名证书更新及cdn证书更新

本篇为阿里云免费证书更新记录。 登录阿里云账号 搜索数字证书管理服务管理控制台 点击创建证书 输入你的域名 填写相关信息&#xff08;注&#xff1a;域名验证方式选择文件验证&#xff09; 等待审核通过&#xff08;时间不久&#xff0c;一般为半小时内&#xff09; …

Vue2高级篇

Vue高级 Vue生命周期 生命周期又称为生命周期回调函数、生命周期函数、生命周期钩子, 是Vue在运行过程中的关键时刻帮我们调用的一些指函数, 生命周期函数名字不可修改, 其中的this指向的是vm或组件实例对象. 常用的生命周期钩子: mounted: 发送ajax请求、启动定时器、绑定…

【Web安全】SQL各类注入与绕过

【Web安全】SQL各类注入与绕过 【Web安全靶场】sqli-labs-master 1-20 BASIC-Injection 【Web安全靶场】sqli-labs-master 21-37 Advanced-Injection 【Web安全靶场】sqli-labs-master 38-53 Stacked-Injections 【Web安全靶场】sqli-labs-master 54-65 Challenges 与62关二…

python并发编程:IO模型

一 IO模型 二 network IO 再说一下IO发生时涉及的对象和步骤。对于一个network IO \(这里我们以read举例\)&#xff0c;它会涉及到两个系统对象&#xff0c;一个是调用这个IO的process \(or thread\)&#xff0c;另一个就是系统内核\(kernel\)。当一个read操作发生时&#xff…

无代理方式实现VMware的迁移?详细解析

在当今数字化时代&#xff0c;数据的安全性和可用性对于企业至关重要。尤其是在VMware转变订阅策略后&#xff0c;原本永久订阅的产品转变为以年付费订阅的形式&#xff0c;导致客户不得不支付更多的费用&#xff0c;大幅增加了成本。同时&#xff0c;客户也对VMware未来发展前…

Go-gin-example 第三部分 编写一个简单的文件日志系统

文章目录 本文目标新建logging包file.go编写log文件当前目录结构 接入自定义的log功能验证功能 本文目标 在上一节中&#xff0c;我们解决了 API’s 可以任意访问的问题&#xff0c;那么我们现在还有一个问题&#xff0c;就是我们的日志&#xff0c;都是输出到控制台上的&…

k8s-kubeapps图形化管理 21

结合harbor仓库 由于kubeapps不读取hosts解析&#xff0c;因此需要添加本地仓库域名解析&#xff08;dns解析&#xff09; 更改context为全局模式 添加repo仓库 复制ca证书 添加成功 图形化部署 更新部署应用版本 再次进行部署 上传nginx 每隔十分钟会自动进行刷新 在本地仓库…

人人都写过的6个bug

大家好&#xff0c;我是知微。 程序员写bug几乎是家常便饭&#xff0c;也是我们每个人成长过程中难以避免的一部分。 为了缓解这份“尴尬”&#xff0c;今天想和大家分享一些曾经都会遇到过的bug&#xff0c;让我们一起来看看这些“经典之作”。 1、数组越界 #include <…

Python爬虫:http和https介绍及请求

HTTP和HTTPS 学习目标&#xff1a; 记忆 http、https的概念和区别记忆 浏览器发送http请求的过程记忆 http请求头的形式记忆 http响应头的形式了解 http响应状态码 1 为什么要复习http和https 在发送请求&#xff0c;获取响应的过程中 就是发送http或https的请求&#xff0c…

面试题--01

GC机制 GC机制又称垃圾回收机制&#xff0c;是Python解释器自带一种机&#xff0c;专门用来回收不可用的变量值所占用的内存空间 有三个核心&#xff0c;分别是引用计数、标记清除和分代回收 引用计数&#xff1a;一个变量值如果有一个变量名指向&#xff0c;那么在它身上就计…

DMA 链表模式(LLI)深度解析

在进行一次 DMA 读或者写的时候&#xff0c;可以配置多个链表&#xff0c;从而当一个链表的数据传输完成时&#xff0c;会跳到下一个链表的起始地址&#xff0c;并继续传输数据&#xff0c;直到链表的下一个地址为 0。如果 DMA 使能了完成中断&#xff0c;则当 DMA 发送或者接收…

c++ ponder库实现机制的理解

Ponder是一个用于C的反射库&#xff0c;它允许在运行时查询和操作类型信息。反射通常是动态语言的特性&#xff0c;但Ponder通过提供一套API&#xff0c;使得在静态类型语言C中也能实现类似的功能。这对于需要动态处理对象&#xff0c;如序列化/反序列化、脚本绑定等场景非常有…

微信小程序--注册时获取微信头像

参考官方文档&#xff1a;点击跳转 具体实现&#xff1a; wxml&#xff1a; <button class"avatarBtn" open-type"chooseAvatar" chooseavatar"onChooseAvatar"><image class"avatar" :src"avatarUrl"></…

【语音识别】- 几个主流模型 2024年2月整理

文章目录 1. Wav2Vec 2.02. Whisper3. WeNet4. Paraformer5. Flan-T51. Wav2Vec 2.0 由Facebook AI Research(FAIR)于2020年提出的在语音方向里具有一定影响力的预训练模型。 论文地址:https://arxiv.org/pdf/2006.11477.pdf 项目地址:https://github.com/pytorch/fairse…

程序计数器介绍

程序计数器是计算机处理器中的寄存器&#xff0c;它包含当前正在执行的指令的地址(位置)。当每个指令被获取&#xff0c;程序计数器的存储地址加一。在每个指令被获取之后&#xff0c;程序计数器指向顺序中的下一个指令。当计算机重启或复位时&#xff0c;程序计数器通常恢复到…

java微服务技术选型,Java学习的三个终极问题及学习路线规划

前言 在网络技术中基于浏览器的B/S结构无论在PC端还是手机端都充当着至关重要的角色。 PC端自不必说&#xff0c;手机中很多应用虽然是以APP的形式存在&#xff0c;但它采用的还是B/S结构。如今日头条、微信的朋友圈等&#xff0c;这些应用在内部封装了浏览器&#xff0c;后端…

【项目实战】高并发内存池(仿tcmalloc)

【项目实战】高并发内存池&#xff08;仿tcmalloc&#xff09; 作者&#xff1a;爱写代码的刚子 时间&#xff1a;2024.2.12 前言&#xff1a; 当前项目是实现一个高并发的内存池&#xff0c;它的原型是google的一个开源项目tcmalloc&#xff0c;tcmalloc全称 Thread-Caching M…

MySQL 8.0 架构 之 DDL日志(元数据日志)(DDL log)

文章目录 MySQL 8.0 架构 之 DDL日志&#xff08;元数据日志&#xff09;&#xff08;DDL log&#xff09;MySQLDDL日志&#xff08;元数据日志&#xff09;&#xff08;DDL log&#xff09;参考 【声明】文章仅供学习交流&#xff0c;观点代表个人&#xff0c;与任何公司无关。…

【JavaScript】将数组中的数字按照从小到大排序(sort)

如果在 sort()方法中带参&#xff0c;我们就可以自定义排序规则。具体做法如下&#xff1a; 我们可以在 sort()的参数中添加一个回调函数&#xff0c;来指定排序规则。回调函数中需要定义两个形参&#xff0c;JS将会分别使用数组中的元素作为实参去调用回调函数。 JS根据回调…

宠物的异味,用空气净化器可以解决吗?宠物空气净化器品牌推荐

养猫的人都了解&#xff0c;一个养猫家庭的环境卫生和气味问题与主人的关系密切相关。主人的勤劳程度和对卫生的重视程度直接影响着家中的气味。尽管主人通常会经常更换猫砂&#xff0c;但有时候仍然会存在一些难闻的气味。事实上&#xff0c;忙碌的猫主人可能会因为没有足够的…