1.1 OpenCV随手简记(一)

OpenCV学习篇

OpenCV (Open Source Computer Vision Library) 是一个开源的计算机视觉库,它提供了大量的算法和函数,用于图像处理、计算机视觉和机器学习等领域。

1. OpenCV 简介

1.1 OpenCV 的起源和发展

OpenCV 项目始于 1999 年,由 Intel 公司发起,旨在为计算机视觉研究人员和开发者提供一个开源的库。经过多年的发展,OpenCV 已经成为最流行的计算机视觉库之一,被广泛应用于学术研究和工业应用中。

1.2 OpenCV 的特点和优势

  • 开源免费:OpenCV 是开源的,可以免费使用和修改。
  • 跨平台:OpenCV 支持多种操作系统,包括 Windows、Linux、Mac OS 等。
  • 功能丰富:OpenCV 提供了大量的图像处理、计算机视觉和机器学习算法,涵盖了从基础到高级的各种功能。
  • 易于使用:OpenCV 的 API 设计简洁易懂,易于学习和使用。

2. OpenCV 安装和配置

2.1 OpenCV 安装

OpenCV 可以通过多种方式安装,包括预编译的二进制包、源代码编译以及使用包管理工具(如 pip)安装。

2.2 OpenCV 配置

安装 OpenCV 后,需要配置开发环境,包括添加库路径、头文件路径等。

3. OpenCV 基础

3.1 图像读取和显示

  • cv2.imread():读取图像文件。
  • cv2.imshow():显示图像。
  • cv2.waitKey():等待按键事件。

3.2 图像基础操作

  • cv2.cvtColor():图像颜色空间转换。
  • cv2.resize():图像缩放。
  • cv2.copyMakeBorder():图像边界扩展。
  • cv2.split() 和 cv2.merge():图像通道分离和合并。

3.3 图像滤波

  • cv2.blur():均值滤波。
  • cv2.GaussianBlur():高斯滤波。
  • cv2.medianBlur():中值滤波。
  • cv2.bilateralFilter():双边滤波。

3.4 图像边缘检测

  • cv2.Canny():Canny 边缘检测算法。
  • cv2.Sobel():Sobel 算子。
  • cv2.Laplacian():Laplacian 算子。

3.5 图像形态学操作

  • cv2.erode():腐蚀操作。
  • cv2.dilate():膨胀操作。
  • cv2.morphologyEx():形态学操作(开运算、闭运算等)。

4. OpenCV 进阶

4.1 特征检测与匹配

  • cv2.goodFeaturesToTrack():角点检测。
  • cv2.SIFT()cv2.SURF()cv2.ORB():特征点检测和描述。
  • cv2.BFMatcher()cv2.FlannBasedMatcher():特征匹配。

4.2 轮廓检测

  • cv2.findContours():寻找图像中的轮廓。
  • cv2.drawContours():绘制轮廓。

4.3 图像分割

  • cv2.threshold():图像阈值分割。
  • cv2.watershed():分水岭算法。

4.4 联通组件分析

  • cv2.connectedComponents():连通组件分析。

4.5 目标跟踪

  • cv2.TrackerMIL_create():多实例学习跟踪器。
  • cv2.TrackerKCF_create():核相关滤波跟踪器。

5. OpenCV 应用

5.1 人脸检测

人脸检测是计算机视觉中的一个经典问题,它可以帮助我们识别图像或视频中的 faces。OpenCV 提供了级联分类器(Cascade Classifier)用于人脸检测。

  • 级联分类器:级联分类器是一种基于机器学习的分类器,它由多个简单的分类器级联而成。每个分类器负责检测图像中的某个局部特征,如果所有分类器都认为该区域是人脸,则最终判断该区域为人脸。
  • HAAR 特征:HAAR 特征是一种用于图像分类的特征,它基于图像的灰度差。OpenCV 提供了 HAAR 特征的训练工具,可以帮助您训练自己的人脸检测模型。
  • 示例代码*
    # 创建级联分类器对象
    face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
    # 读取图像
    img = cv2.imread('image.jpg')
    # 将图像转换为灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 检测图像中的人脸
    faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30), maxSize=(100, 100))
    # 绘制人脸矩形框
    for (x, y, w, h) in faces:cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
    # 显示图像
    cv2.imshow('Image', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

5.2 车牌识别

车牌识别是计算机视觉中的一个重要应用,它可以用于交通监控、智能停车等领域。OpenCV 提供了多种工具和算法,可以帮助您实现车牌识别。

  • 轮廓检测:使用 cv2.findContours() 函数可以检测图像中的轮廓,从而找到车牌区域。
  • 模板匹配:使用 cv2.matchTemplate() 函数可以将车牌模板与图像中的区域进行匹配,从而识别车牌。
  • 字符识别:可以使用 Tesseract OCR 库或其他字符识别算法识别车牌中的字符。
  • 示例代码*
    # 读取图像
    img = cv2.imread('image.jpg')
    # 将图像转换为灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 使用 Sobel 算子进行边缘检测
    edges = cv2.Canny(gray, 50, 150, apertureSize=3)
    # 查找轮廓
    contours, hierarchy = cv2.findContours(edges, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    # 绘制轮廓
    cv2.drawContours(img, contours, -1, (0, 255, 0), 3)
    # 显示图像
    cv2.imshow('Image', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

    5.3 物体识别

  • 物体识别是计算机视觉中的一个重要应用,它可以用于智能监控、智能交通等领域。OpenCV 提供了多种工具和算法,可以帮助您实现物体识别。
  • 支持向量机 (SVM):SVM 是一种用于分类的机器学习算法,它可以用于识别图像中的物体。
  • HOG 描述子:HOG 描述子是一种用于图像特征提取的算法,它可以用于描述图像中的物体形状。
  • 示例代码*
    # 创建 SVM 分类器
    svm = cv2.ml.SVM_create()
    # 训练 SVM 分类器
    svm.train(train_data, cv2.ml.ROW_SAMPLE, labels)
    # 使用 SVM 分类器识别图像中的物体
    rects, labels = svm.detectMultiScale(img, scaleFactor=1.05, minNeighbors=3, minSize=(30, 30))
    # 绘制识别结果
    for (x, y, w, h) in rects:cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)
    # 显示图像
    cv2.imshow('Image', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

5.4 视频分析

视频分析是计算机视觉中的一个重要应用,它可以用于运动检测、目标跟踪、行为识别等领域。OpenCV 提供了多种工具和算法,可以帮助您实现视频分析。

  • 视频读取:使用 cv2.VideoCapture() 函数可以读取视频文件。
  • 视频写入:使用 cv2.VideoWriter() 函数可以将视频写入文件。
  • 背景减除器:使用 cv2.createBackgroundSubtractorMOG2() 函数可以创建背景减除器,用于检测视频中的运动目标。
  • 示例代码*
    # 创建 VideoCapture 对象
    cap = cv2.VideoCapture('video.mp4')
    # 创建 BackgroundSubtractorMOG2 对象
    fgbg = cv2.createBackgroundSubtractorMOG2()
    # 读取视频帧
    while True:ret, frame = cap.read()if not ret:break# 应用背景减除器fgmask = fgbg.apply(frame)# 显示前景掩码cv2.imshow('Foreground Mask', fgmask)# 按 'q' 键退出循环if cv2.waitKey(1) & 0xFF == ord('q'):break
    # 释放 VideoCapture 对象
    cap.release()
    # 关闭所有窗口
    cv2.destroyAllWindows()

6. OpenCV 扩展

6.1 DNN 模块

OpenCV 的 DNN (Deep Neural Network) 模块提供了深度学习相关的功能,可以用于图像分类、目标检测、语义分割等任务。

  • 模型加载:使用 cv2.dnn.readNetFromDarknet()cv2.dnn.readNetFromTensorflow() 等函数可以加载不同的深度学习模型。
  • 模型推理:使用 cv2.dnn Net::forward() 函数可以对图像进行模型推理,获取模型的输出结果。
  • 示例代码*
    # 创建网络对象
    net = cv2.dnn.readNetFromDarknet('yolov3.cfg')
    # 加载权重文件
    net.setPreferableBackend(cv2.dnn.DNN_BACKEND_OPENCV)
    net.setPreferableTarget(cv2.dnn.DNN_TARGET_CPU)
    # 读取图像
    img = cv2.imread('image.jpg')
    # 获取网络输入尺寸
    blob = cv2.dnn.blobFromImage(img, scalefactor=1/255, size=(416,416), mean=(0,0,0), swapRB=True, crop=False)
    # 设置网络输入
    net.setInput(blob)
    # 执行模型推理
    outputs = net.forward()
    # 处理模型输出结果
    ...

6.2 ML模块

OpenCV 的 ML (Machine Learning) 模块提供了机器学习相关的功能,可以用于分类、回归、聚类等任务。

  • SVM:支持向量机 (SVM) 是一种用于分类的机器学习算法。
  • KNN:K 近邻 (KNN) 是一种用于分类和回归的机器学习算法。
  • 决策树:决策树是一种用于分类和回归的机器学习算法。
  • 示例代码*
    ## 创建 SVM 分类器
    svm = cv2.ml.SVM_create()
    ## 设置 SVM 参数
    svm.setType(cv2.ml.SVM_C_SVC)
    svm.setKernel(cv2.ml.SVM_LINEAR)
    svm.setTermCriteria((cv2.TERM_CRITERIA_MAX_ITER, 100, 1e-6))
    ## 训练 SVM 分类器
    svm.train(train_data, cv2.ml.ROW_SAMPLE, labels)
    ## 使用 SVM 分类器进行预测
    ret, result = svm.predict(test_data)
    ## 输出预测
    

7. OpenCV 学习资源

  • OpenCV 官方文档:OpenCV documentation index
  • OpenCV 官方教程:OpenCV: OpenCV Tutorials
  • OpenCV 示例代码:GitHub - opencv/opencv: Open Source Computer Vision Library
  • OpenCV 教程网站:OpenCV: OpenCV Tutorials
  • OpenCV 论坛:Questions - OpenCV Q&A Forum

af84faf45e6b4c4a84f14ad6a388c832.png

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/20788.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【火猫欧洲杯】意甲:孔蒂亲自推动,送走尼日利亚锋霸

本赛季那不勒斯作为卫冕冠军发挥不佳,联赛仅仅排在第10名,休赛期他们率先炒掉了主帅卡尔佐纳,基本上锁定了前国米主帅孔蒂。孔蒂对于执教那不勒斯也非常期待,根据意大利媒体爆料,孔蒂已经开始准备推动转会,将球队的进攻核心奥斯梅恩卖掉,如果可以他想将自己的爱将卢卡库换回来。…

Java 22的FFM API,比起Java 21的虚拟线程

哪个对Java未来的发展影响更大?两个 Java 版本中的重要特性:Java 21 的虚拟线程和 Java 22 的 FFM API。我这里有一套编程入门教程,不仅包含了详细的视频讲解,项目实战。如果你渴望学习编程,不妨点个关注,给…

MPB | 林科院袁志林组-​内生镰刀菌基因组染色体级别组装和注释

内生镰刀菌基因组染色体级别组装和注释 Chromosome-Scale Genome Assembly and Annotation Method of Endophyte Fusarium 单晓亮1, 2,袁志林1, 2,* 1中国林业科学研究院林木遗传育种国家重点实验室,北京;2中国林业科学研究院亚热带林业研究…

DeepFace ——用于高级人脸识别算法探索与应用

1. 概述 人脸识别作为人工智能和机器学习中的一个活跃领域,长期以来一直在追求模仿甚至超越人类视觉系统的能力。这项技术在安全、监控、身份验证等多个方面都有着广泛的应用,但同时也伴随着隐私、伦理和准确性等社会和文化方面的考量。 Meta&#xff0…

苹果电脑数据丢失怎么办 苹果电脑数据恢复软件免费版 如何使用EasyRecovery恢复数据

无论是使用苹果电脑还是Windows电脑,丢失文件是一个常见的问题。无论是意外的删除、格式化错误还是系统崩溃,都可能导致重要数据的丢失。此时就需要用到数据恢复工具恢复数据。然而数据恢复工具的选择是十分重要的,踩坑了不仅找不回数据&…

超级SDK版本管理器VMR v0.6.1预览版发布!

项目地址:https://github.com/gvcgo/version-manager/releases/tag/v0.6.1 官方文档:https://gvcgo.github.io/vdocs/ 支持的语言列表: bun, clang, codon, deno, dlang, dotnet, elixir, erlang, flutter, gcc, gleam, go, groovy, jdk, …

【启程Golang之旅】从结构到接口揭秘Go的“面向对象”面纱

欢迎来到Golang的世界!在当今快节奏的软件开发领域,选择一种高效、简洁的编程语言至关重要。而在这方面,Golang(又称Go)无疑是一个备受瞩目的选择。在本文中,带领您探索Golang的世界,一步步地了…

ICPC训练赛补题集

ICPC训练赛补题集 文章目录 ICPC训练赛补题集D - Fast and Fat (负重越野)I-路径规划G. Inscryption(邪恶铭刻)NEW Houses雪中楼(西安交通大学)L.BracketGenerationE - Checksum D - Fast and Fat (负重越野) 原题链接:原题链接 题意:体重大的背体重小的…

【面试题-004】ArrayList 和 LinkList区别

ArrayList 和 LinkedList 都是 Java 中常用的动态数组实现,都实现了 List 接口,但它们在内部数据结构和性能方面有所不同: 内部数据结构: ArrayList 是基于动态数组的数据结构,它允许快速随机访问。数组的大小在创建时…

用java实现客服聊天+网络爬虫下载音乐(java网络编程,io,多线程)

一 灵感: 在2022年的暑假,也就是我即将迈进高三的那个暑假,我并没有察觉自己应该要学习了,还是和过往的暑假一样玩着王者荣耀,凌晨2点睡觉,中午12点起床。我依稀记得这种状态一直持续到8月19。然而离开学还…

【MySQL】Linux安装MySQL

一、center OS环境准备 为了在Linux系统中查看MySQL5.8与8.0版本的区别 我们要准备两个虚拟机,需要的软件:VMware和CentOS7 因为博主之前在学习redis的时候已经安装过一个虚拟机了,所以我就直接克隆了一个CentOS2.0 修改mac地址&#xff0…

STM32作业实现(二)串口控制led

目录 STM32作业设计 STM32作业实现(一)串口通信 STM32作业实现(二)串口控制led STM32作业实现(三)串口控制有源蜂鸣器 STM32作业实现(四)光敏传感器 STM32作业实现(五)温湿度传感器dht11 STM32作业实现(六)闪存保存数据 STM32作业实现(七)OLED显示数据 STM32作业实现(八)触摸按…

深入理解Java中的List集合:解析实例、优化技巧与最佳实践

一:List 集合的基础 1.1 什么是 List 集合? List 集合是 Java 集合框架中的一种有序、可重复的数据结构,它继承自Collection 接口,允许存储多个元素。 与数组不同,List 集合的大小是动态可变的,可以根据…

通过指针变量访问整型变量

有两个与指针变量有关的运算符: (1)&:取地址运算符。 (2)*:指针运算符(或称间接访问运算符)。 例如:&a为变量a的地址,*p为指针变量p所指向的存储单元。 编写程序: 运行结果…

【面试经典150题】移除元素

目录 一.移除元素 一.移除元素 这题的思路非常清晰&#xff0c;可以使用迭代器遍历找到需要删除的元素使用erase删除即可&#xff1a; #include<iostream> #include<vector>using namespace std;class Solution { public:int removeElement(vector<int>&…

设计模式(六)结构型模式---桥接模式

文章目录 桥接模式简介结构优点UML图具体实现UML图代码实现 桥接模式简介 桥接模式是一种将抽象与实现分离&#xff0c;使它们独立变化。然后利用组合关系来代替继承关系&#xff0c;大大的降低了抽象和实现的耦合度的设计模式。实际使用&#xff1a; JDBC源码分析&#xff0c…

Xcode下载安装

1.Xcode可用版本判断&#xff1a; 2.Xcode下载安装&#xff1a; 方案1:AppStore 下载更新 若方案1失败则 方案2:指定版本Xcode包下载解压安装 苹果下载 3.Xcode命令行工具插件安装 xcode-select --install 备注&#xff1a; xcode_x.x.x.xip(压缩包存在时效性(使用前24h/…

Mac专用投屏工具:AirServer 7 for Mac 激活版下载

AirServer 7 是一款在 Windows 和 macOS 平台上运行的强大的屏幕镜像和屏幕录制软件。它能够将 iOS 设备、Mac 以及其他 AirPlay、Google Cast 和 Miracast 兼容设备的屏幕镜像到电脑上&#xff0c;并支持高质量的录制功能。总的来说&#xff0c;AirServer 7 是一款功能全面的屏…

Mybatis编写SQL

文章目录 一、用注解编写1.1 增普通增加获取自增ID 1.2 删和改1.3 查单表查询多表查询 二、用xml编写2.1 使用xml的流程2.2 增普通增加获取自增ID 2.3 删 和 改2.4 查 三、#{} 和 ${}3.1 #{} 、${}3.1 预编译 SQL 、即时编译SQL 两种写法是可以同时存在的 一、用注解编写 1.1 …

mediasoup基础概览

提示&#xff1a;本文为之前mediasoup基础介绍的优化 mediasoup基础概览 架构&#xff1a;2.特性&#xff1a;优点缺点 3.mediasoup常见类介绍js部分c 4.mediasoup类图5.业务类图 Mediasoup 是一个构建在现代 Web 技术之上的实时通信&#xff08;RTC&#xff09;解决方案&#…