基于yolov8调用本地摄像头并将读取的信息传入jsonl中

最近在做水面垃圾识别的智能船 用到了yolov8进行目标检测 修改并添加了SEAttention注意力机制

详情见其他大神

【保姆级教程|YOLOv8添加注意力机制】【1】添加SEAttention注意力机制步骤详解、训练及推理使用_yolov8添加se-CSDN博客

并且修改传统的iou方法改为添加了wise-iou的方法 ,对于小目标,传统的IoU可能不够敏感,因为即使是微小的偏移也可能导致IoU显著下降。Wise-IoU通过加权可以更公平地对待小目标,从而提高小目标检测的性能 ,这对于我们船体的摄像头 查找远处或较小漂浮物起到了一定作用。

好了,回归正题。我们写了一个脚本 用于收集识别后的标框和参数信息 将这些信息存储进一个jsonl文件中 启用两个线程 在jetson nano b01 4gb的板子上进行运行 。

目的: 通过存储这些信息我们可以用于计算 例如计算到屏幕正下方的距离 可以做些简单的计算和路径规划等问题 后续我们还在完成这份工作 

话不多说,我们先上传代码。 该代码结合gpt添加了许多注释 (真的很多,组里有人看不懂代码 所以写的时候只能加很多注释并让gpt规范格式)不过这样也方便大家的阅读和使用

以下是源码环节:

import cv2
from ultralytics import YOLO
import datetime
import json
import threading
import queue
import time  # 导入 time 模块# 队列用于线程间通信
data_queue = queue.Queue()# 事件用于通知其他线程停止
stop_event = threading.Event()# 将 id_counter 定义为全局变量
id_counter = 0# 修改 detection_data 的定义,去掉 timestamp 并添加 id 作为第一个元素
def process_frames(model, cap):"""对摄像头捕捉到的视频帧进行处理,使用YOLO模型进行目标检测,并将结果放入队列中。Args:model (YOLO): YOLO目标检测模型实例。cap (cv2.VideoCapture): 摄像头视频流对象。Returns:None"""global id_counter  # 确保在函数内部使用的是全局变量id_counterwhile not stop_event.is_set():  # 当停止事件未设置时,循环继续ret, frame = cap.read()  # 从摄像头读取一帧if not ret:  # 如果无法读取帧(摄像头可能已断开)print("无法接收帧(可能是摄像头断开)")break  # 跳出循环results = model(frame)  # 使用模型处理帧for result in results:  # 遍历模型检测结果boxes = result.boxes  # 获取检测到的边界框for box in boxes:  # 遍历每个边界框x1, y1, x2, y2 = map(int, box.xyxy[0])  # 提取边界框坐标confidence = round(float(box.conf[0]), 3)  # 提取置信度cls = int(box.cls[0])  # 提取类别索引label = model.names[cls]  # 获取类别名称detection_data = {  # 构造检测数据字典"id": id_counter,"x1": x1,"y1": y1,"x2": x2,"y2": y2,"confidence": confidence,"label": label}data_queue.put(detection_data)  # 将检测数据放入队列# 绘制检测框和标签cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 255, 0), 2)  # 绘制绿色矩形框cv2.putText(frame, f"{label} {confidence:.2f}", (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5,(0, 255, 0), 2)  # 在框上方绘制标签和置信度id_counter += 1  # 在每次处理后增加 ID 计数器now = datetime.datetime.now()  # 获取当前时间time_str = now.strftime("%Y-%m-%d %H:%M:%S")  # 格式化时间字符串cv2.putText(frame, time_str, (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2, cv2.LINE_AA)  # 在画面上显示时间cv2.imshow('Camera', frame)  # 显示画面if cv2.waitKey(1) & 0xFF == ord('q'):  # 如果用户按下 'q' 键stop_event.set()  # 设置停止事件break  # 跳出循环# 添加 sleep 以控制帧率time.sleep(1)  # 每隔1秒处理一帧cap.release()  # 释放摄像头资源cv2.destroyAllWindows()  # 关闭所有OpenCV窗口# write_to_file 函数不需要再处理 detection_data 中的 timestamp
def write_to_file(output_file, max_lines=1000):line_count = 0  # 记录写入的行数with open(output_file, 'w') as f:  # 初始以写模式打开文件,清空文件内容while True:try:detection_data = data_queue.get(timeout=1)  # 尝试从队列获取数据f.write(json.dumps(detection_data) + '\n')line_count += 1if line_count >= max_lines:print(f"已达到{max_lines}行数据,清空文件并继续运行。")f.close()  # 关闭当前文件句柄f = open(output_file, 'w')  # 重新打开文件,清空内容line_count = 0  # 重置行数计数器except queue.Empty:  # 如果队列为空,则等待下一次尝试if stop_event.is_set():  # 检查是否需要退出returncontinuedef run_yolov8_detection(model_path="./yolov8n.pt", camera_id=0, output_file="ultralytics-main/detector.jsonl"):"""运行 YOLOv8 目标检测算法。Args:model_path (str, optional): YOLOv8 模型文件路径,默认为 "./yolov8n.pt"。camera_id (int, optional): 摄像头设备 ID,默认为 0。output_file (str, optional): 输出文件路径,默认为 "ultralytics-main/detector.jsonl"。Returns:None"""# 初始化YOLO模型model = YOLO(model_path)# 打开摄像头cap = cv2.VideoCapture(camera_id)# 检查摄像头是否成功打开if not cap.isOpened():print("无法打开摄像头")return# 创建并启动两个线程# 第一个线程用于处理摄像头捕捉到的帧processing_thread = threading.Thread(target=process_frames, args=(model, cap))# 第二个线程用于将处理后的帧写入文件writing_thread = threading.Thread(target=write_to_file, args=(output_file,))# 启动两个线程processing_thread.start()writing_thread.start()# 等待两个线程完成# 等待处理帧的线程完成processing_thread.join()# 等待写入文件的线程完成writing_thread.join()# 调用函数
run_yolov8_detection()

如有问题请及时私信,欢迎大家指正!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/55519.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

已解决:ImportError: cannot import name ‘get_column_letter‘

已解决:ImportError: cannot import name ‘get_column_letter’ 文章目录 写在前面问题描述报错原因分析 解决思路解决办法1. 检查 Openpyxl 版本2. 升级 Openpyxl3. 重新安装 Openpyxl4. 检查导入路径和函数拼写5. 检查虚拟环境6. 降级 Openpyxl 版本(…

手机使用指南:如何在没有备份的情况下从 Android 设备恢复已删除的联系人

在本指南中,您将了解如何从 Android 手机内存中恢复已删除的联系人。Android 诞生、见证并征服了 80% 的智能手机行业。有些人可能将此称为“非常大胆的宣言”,但最近的统计数据完全支持我们的说法。灵活性、高度改进的可用性和快速性是 Android 操作系统…

[20241003] 狂飙500天,国产大模型如何突破商业化之困?

大模型加速狂飙,AI商业化却面临巨大鸿沟。 一方面,传统企业不知道怎么将AI融入原始业务,另一方面,AI企业难以找到合适的变现方式。AI企业究竟该如何突破商业化之困?B端和C端,呈现出两种不同的路径。 纵…

Bootstrap 4 导航栏:构建响应式和现代的网页导航

Bootstrap 4 导航栏:构建响应式和现代的网页导航 Bootstrap 4 是目前最受欢迎的前端框架之一,它提供了一套丰富的工具和组件,帮助开发者快速构建响应式、移动设备优先的网页。在网页设计中,导航栏是一个核心组件,它负责引导用户浏览网站的不同部分。Bootstrap 4 的导航栏…

QGIS中怎么裁剪与掩膜提取

最近,我接到了一个关于QGIS中矢量与栅格与栅格数据怎么裁剪与掩膜提取到自己想要区域的咨询。 其实这个操作,与arcgis中的操作其实是类似的 下面是我对这个问题的解决思路: 首先得把栅格与矢量数据加载进去,如下图:…

安全中心 (SOC) 与 网络运营中心 (NOC)

NOC 和 SOC 之间的区别 网络运营中心 (NOC) 负责维护公司计算机系统的技术基础设施,而安全运营中心 (SOC) 则负责保护组织免受网络威胁。 NOC 专注于防止自然灾害、停电和互联网中断等自然原因造成的网络干扰,而 SOC 则从事监控、管理和保护。 NOC 提…

Yolov11项目实战1:道路缺陷检测系统设计【Python源码+数据集+运行演示】

一、项目背景 随着城市化进程的加速和交通网络的不断扩展,道路维护成为城市管理中的一个重要环节。道路缺陷(如裂缝、坑洞、路面破损等)不仅影响行车安全,还会增加车辆的磨损和维修成本。传统的道路缺陷检测方法主要依赖人工巡检…

接口隔离原则在前端的应用

什么是接口隔离 接口隔离原则(ISP)是面向对象编程中的SOLID原则之一,它专注于设计接口。强调在设计接口时,应该确保一个类不必实现它不需要的方法。换句话说,接口应该尽可能地小,只包含一个类需要的方法&am…

数据预处理:数据挖掘的第一步

一、引言 在数据挖掘的过程中,数据预处理是至关重要的第一步。 它涉及到对原始数据进行清洗、集成、转换和归一化等一系列操作,以确保数据的质量和可 用性。 有效的数据预处理能够显著提升数据挖掘的效率和结果的质量。 本文将深入探讨数据预处理的各个…

硬件测量仪器使用

在开发中,我们经常需要用到一些仪器来辅助我们软件开发,来排查问题: 比如:万用表、示波器、逻辑分析仪 万用表: 在电路板调试过程中主要使用万用表的两个功能。 ● 测量电平。 ● 使用二极管挡测量电路板上网络的连通…

书生大模型实战(从入门到进阶)L3-彩蛋岛-InternLM 1.8B 模型 Android 端侧部署实践

目录 1 环境准备 1.1 安装rust 1.2 安装Android Studio 1.3 设置环境变量 2 转换模型 2.1 安装mlc-llm 2.2 (可选)转换参数 2.3 (可选)生成配置 2.4 (可选)上传到huggingface 2.5 (可选) 测试转换的模型 3 打包运行 3.1 修改配置文件 3.2 运行打包命令 3.3 创建签…

Python next方法应用场景

Python next方法应用场景 什么是 next() 函数?基本用法与示例next() 函数的实际应用场景场景 1:在生成器中逐个获取元素场景 2:文件逐行读取场景 3:跳过迭代中的特定元素场景 4:查找匹配元素场景 5:用 next…

管理方法(12)-- 采购管理

采购人员不是在为公司讨价还价,而是在为顾客讨价还价,我们应该为顾客争取最低的价钱。-----山姆 沃尔顿 沃尔玛的创始人。 1. 采购的定义和原则 5R原则:适时(Right Time)、适质(Right Quality)、适量(Right Quantity)、适价(Right Price)、适地(Right Place)。…

基于深度学习的视频内容理解

基于深度学习的视频内容理解(Video Content Understanding, VCU)是一项关键技术,旨在通过神经网络模型自动分析、解读和提取视频中的语义信息。深度学习方法能够利用视频的时序和空间特性,提取多模态信息(如图像、音频…

数据结构——栈的基本操作

前言 介绍 🍃数据结构专区:数据结构 参考 该部分知识参考于《数据结构(C语言版 第2版)》55 ~ 59页 🌈每一个清晨,都是世界对你说的最温柔的早安:ૢ(≧▽≦)و✨ 1、栈的基本概念 栈&#x…

【SpringBoot详细教程】-08-MybatisPlus详细教程以及SpringBoot整合Mybatis-plus【持续更新】

目录 🌲 MyBatis Plus 简介 🌾入门案例 🌾 MP 简介 🌲 MP 的CRUD 🌾 新增 🌾 删除 🌾 修改在进行 🌾 根据ID查询 🌾 查询所有 🌲 分页功能 🌾 设置分页参数 🌾 设置分页拦截器 🌲 优化启动 🌾 取消mbatisPlusBanner 🌾 取消Sprin…

[linux] 磁盘清理相关

在 CentOS 7 中清理磁盘空间可以通过多种方法实现,以下是一些常用的步骤和命令: 1. 查找和删除大文件 你可以使用 find 命令查找占用大量空间的文件: find / -type f -size 100M 2>/dev/null这条命令会查找大于 100 MB 的文件。你可以根…

国外电商系统开发-运维系统功能清单开发

一、最终效果图 二、功能清单 功能 描述 自定义日志绘图 根据Nginx、Apache登录日志文件绘图,绘图数据包括:访问量走势,500错误,200正确百分比等 创建服务器 加入服务器 主机状态自动检查 加入主机到系统后,系统…

LeetCode: 1971. 寻找图中是否存在路径

寻找图中是否存在路径 原题 有一个具有 n 个顶点的 双向 图,其中每个顶点标记从 0 到 n - 1(包含 0 和 n - 1)。图中的边用一个二维整数数组 edges 表示,其中 edges[i] [ui, vi] 表示顶点 ui 和顶点 vi 之间的双向边。 每个顶点…

记OpenGL的Demo中增加ImGui后界面不显示的问题

百思不得其解: 我的ImGui界面呢? 经过不断调整代码,也可能是对这还不太熟悉吧,最终将drawData放在clearColor后界面出来了,仔细想想也能理解,先画了界面,再渲染了背景色,将界面盖住了…