基于YOLOV8复杂场景下船舶目标检测系统

1. 背景

海洋作为地球上70%的表面积,承载着人类生活、经济发展和生态系统的重要功能。船舶作为海洋活动的主要载体之一,在海上运输、资源开发、环境监测等方面发挥着重要作用。复杂海洋环境下的船舶目标检测成为了海事管理、海洋资源开发和环境保护等领域的关键技术之一。

2. YOLOv8算法

为什么我应该使用 YOLOv8?

  • YOLOv8 具有许多开发人员方便的功能,从易于使用的 CLI 到结构良好的 Python 包。
  • YOLO 周围有一个庞大的社区,围绕 YOLOv8 模型的社区也在不断壮大,这意味着计算机视觉圈子里有很多人在你需要指导时可以为您提供帮助。YOLOv8在COCO上实现了很高的准确性。例如,YOLOv8m模型 - 中等模型 - 在COCO上测量时达到50.2%的mAP。当针对Roboflow 100(专门评估各种任务特定域上的模型性能的数据集)进行评估时,YOLOv8的得分明显优于YOLOv5。本文后面的性能分析中提供了有关此内容的更多信息。此外,YOLOv8 中方便开发人员的功能也很重要。与其他模型相反,任务被拆分到您可以执行的许多不同 Python 文件中,YOLOv8 带有一个 CLI,使训练模型更加直观。这是对 Python 包的补充,该包提供了比以前的模型更无缝的编码体验。当您考虑使用模型时,YOLO 周围的社区值得注意。许多计算机视觉专家都知道 YOLO 及其工作原理,并且网上有很多关于在实践中使用 YOLO 的指导。尽管 YOLOv8 在撰写本文时是新的,但网上有许多指南可以提供帮助。以下是一些学习资源,您可以使用它们来提高您对 YOLO 的了解:
  • Roboflow 模型上的 YOLOv8 模型卡
  • 如何在自定义数据集上训练YOLOv8模型
  • 如何在自定义数据集上训练YOLOv8模型
  • 用于训练YOLOv8目标检测模型的谷歌Colab笔记本
  • 用于训练YOLOv8分类模型的谷歌Colab笔记本
  • 用于训练YOLOv8分割模型的谷歌Colab笔记本
  • 使用YOLOv8和ByteTRACK跟踪和计数车辆)让我们深入了解架构以及 YOLOv8 与以前的 YOLO 模型的不同之处。

2.1 YOLOv8检测网络

在这里插入图片描述

2.2 模型结构

如下图, 左侧为 YOLOv5-s,右侧为 YOLOv8-s。
在暂时不考虑 Head 情况下,对比 YOLOv5 和 YOLOv8 的 yaml 配置文件可以发现改动较小。
在这里插入图片描述
在这里插入图片描述

3. 软件界面功能

  1. 可用于实时检测各类复杂场景种的船舶位置,并显示目标数量;
  2. 支持图片、视频及摄像头进行检测,同时支持图片的批量检测;
  3. 界面可实时显示目标位置、目标总数、置信度、用时等信息;
  4. 支持图片或者视频的检测结果保存;

4. 数据集与训练

数据集为各类复杂场景下的船舶图片,并使用Labelimg标注工具对每张图片中的目标边框(Bounding Box)及类别进行标注。一共包含5090张图片,其中训练集包含4576张图片,验证集包含509张图片,测试包含5张图片。
该数据集是专为研究和解决复杂场景下船舶目标检测问题而设计。包含多样性丰富的环境,如交通繁忙的港口、船只密集的渔业区,以及船与岸边混合交通场景。与传统的船舶目标检测数据集不同,本数据集特意考虑了在实际应用场景中常见但在数据集中经常被忽视的问题。例如,船舶在图像或视频帧中不一定是主体,有时仅作为背景出现。此外,数据集还包括船只部分或完全被其他对象遮挡的情况。这些特点使得本数据集非常适用于开发和评估目标检测算法在复杂、多变和部分遮挡条件下的性能。数据集旨在推动船舶目标检测和相关领域的研究进展,以满足日益增长的实际应用需求,例如航海安全、渔业管理以及海洋环境保护等。
在这里插入图片描述
在这里插入图片描述
data.yaml的具体内容如下:

train: D:\BoatDetection\datasets\Data\train
val: D:\BoatDetection\datasets\Data\val
nc: 1
names: ['boat']

数据准备完成后,通过调用train.py文件进行模型训练,epochs参数用于调整训练的轮数,batch参数用于调整训练的批次大小【根据内存大小调整,最小为1】,代码如下:

from ultralytics import YOLO# 加载预训练模型
model = YOLO("yolov8n.pt")
# Use the model
if __name__ == '__main__':# Use the modelresults = model.train(data='D:\BoatDetection\datasets\Data\data.yaml', epochs=300, batch=4)  # 训练模型

4.1 训练结果评估

在深度学习中,我们通常用损失函数下降的曲线来观察模型训练的情况。YOLOv8在训练时主要包含三个方面的损失:定位损失(box_loss)、分类损失(cls_loss)和动态特征损失(dfl_loss),在训练结束后,可以在runs/目录下找到训练过程及结果文件,如下所示:
在这里插入图片描述
本文训练结果如下:
在这里插入图片描述
PR曲线:
在这里插入图片描述

5. 检测结果识别

在这里插入图片描述

6. 结论与展望

基于YOLOv8的船舶目标检测系统为复杂海洋环境下的船舶监测与管理提供了一种高效准确的解决方案。未来,随着人工智能和深度学习技术的不断发展,该系统将进一步提升在海洋领域的应用价值,为构建美丽海洋、实现可持续发展做出更大贡献。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/10913.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能轨道交通行业周刊-第79期(2024.4.22-5.12)

本期关键词:无人机巡检、车机联控、减速顶、Agent、GraphRAG、RAGFlow 1 整理涉及公众号名单 1.1 行业类 RT轨道交通人民铁道世界轨道交通资讯网铁路信号技术交流北京铁路轨道交通网铁路视点ITS World轨道交通联盟VSTR铁路与城市轨道交通RailMetro轨道世界铁路那…

2024OD机试卷-API集群负载统计 (java\python\c++)

题目:API集群负载统计 题目描述 某个产品的RESTful API集合部署在 服务器 集群的多个节点上,近期对客户端访问日志进行了采集,需要统计各个API的访问频次,根据热点信息在服务器节点之间做负载 均衡,现在需要实现热点信息统计查询功能。 RESTful API是由多个层级构成,层…

《动手学深度学习》V2(11-18)

文章目录 十一、二 模型选择与过拟合和欠拟合1、模型的选择2、过拟合和欠拟合3、估计模型容量4、线性分类器的VC维5、过拟合欠拟合的代码实现 :fire:①生成数据集②定义评估损失③定义训练函数④三阶多项式函数拟合⑤线性函数拟合(欠拟合)⑤高阶多项式函数拟合(过拟合) 十三、权…

【C语言】精品练习题

目录 题目一: 题目二: 题目三: 题目四: 题目五: 题目六: 题目七: 题目八: 题目九: 题目十: 题目十一: 题目十二: 题目十…

「 网络安全常用术语解读 」漏洞利用预测评分系统EPSS详解

1. 概览 EPSS(Exploit Prediction Scoring System,漏洞利用预测评分系统) 提供了一种全新的高效、数据驱动的漏洞管理功能。EPSS是一项数据驱动的工作,使用来自 CVE 的当前威胁信息和现实世界的漏洞数据。 EPSS 模型产生 0 到 1&…

vue 中的 Vuex

Vuex Vuex是什么? 概念:专门在vue中实现集中式状态(数据)管理的一个Vue插件,对Vue应用中多个组件的共享状态进行集中式的管理(读/写),也是一种组件间通信的方式,且适用于任意组件间…

2024最新小红书电商落地实操课,从入门到精通,打造爆款方法(16节课)

你是不是经常在小红书上看到各种各样的推广和引流方法,却感觉实际操作起来很困难? 那么,这门2024最新小红书电商落地实操课就是为你量身定制的!从入门到精通,不仅能让你了解电商平台的基本规则和玩法,还能…

ansible------inventory 主机清单

目录 inventory 中的变量 2)组变量[webservers:vars] #表示为 webservers 组内所有主机定义变量,所有组内成 员都有效 ansible_userrootansible_passwordabc1234 3) [all:vars…

VulkanSDK Demos vkcube 编译失败

操作系统: Windows 11 23H2 Vulkan 版本: 1.3.2.280.0 Visual Studio 版本: 2022 在VulkanSDK/Demos目录下存在一个demo solution,其中包含两个project, vkcube和vkcubepp,两个分别为C语言和C写的示例程序, 但是直接编译这两个project时会编译失败,报了以下错误: fatal err…

[Java EE] 文件IO(一):文件概念与文件系统操作

🌸个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 🏵️热门专栏:🍕 Collection与数据结构 (91平均质量分)https://blog.csdn.net/2301_80050796/category_12621348.html?spm1001.2014.3001.5482 🧀Java …

LeetCode 每日一题 ---- 【2391.收集垃圾的最少总时间】

LeetCode 每日一题 ---- 【2391.收集垃圾的最少总时间】 2391.收集垃圾的最少总时间方法:模拟(多次遍历) 2391.收集垃圾的最少总时间 方法:模拟(多次遍历) 需要注意的点是,处理一个单位的一个…

mysql分页排序的坑,千万注意!

1、问题复现 现象: mysql对无索引字段进行排序后limit ,当被排序字段有相同值时并且在limit范围内,取的值并不是正常排序后的值,有可能第一页查询的记录,重复出现在第二页的查询记录中,而且第二页的查询结…

青少年软件编程(Python)等级考试试卷(四级)2024年3月

电子学会2024.03青少年软件编程(Python)等级考试试卷(四级) 一、单选题 1.运行如下代码,若输入整数3,则最终输出的结果为? ( ) def f(x): if x1: s1 else: sf(x-1)*x return s nint(input("请…

Java RMI SERVER命令执行漏洞

Java RMI SERVER命令执行漏洞 一、介绍二、原理三、复现准备四、漏洞复现 一、介绍 RMI全称是Remote Method Invocation(远程方法调用),是专为Java环境设计的远程方法调用机制,远程服务器提供API,客户端根据API提供相…

java性能分析async-profiler

项目地址 github:https://github.com/async-profiler/async-profiler cpu ./asprof -d 600s -f cpu.html pidcpu-wall:表示抓取所有状态下的线程数据,包含:Running, Sleeping or Blocked ./asprof -e wall -d 600s -f cpu-wall…

TypeScript 工具类型

这些工具类型是 TypeScript 提供的强大功能&#xff0c;用于操作和转换类型。下面是每个工具类型的简要说明和示例&#xff1a; 1、Record let value: Record<string, any> { name: "", age: 0, desc: [] }; let value2: { [key: string]: any } { name: &…

java生成二维码合并海报并加上文字

1.生成二维码 public static byte[] generateQRCodeImages(String text, int width, int height) throws WriterException, IOException {String binary null;QRCodeWriter qrCodeWriter new QRCodeWriter();//调整白边大小Hashtable<EncodeHintType, Object> hints n…

微信小程序新技能解锁:轻松实现二维码扫描与识别

微信小程序新技能解锁&#xff1a;轻松实现二维码扫描与识别 在移动互联网时代&#xff0c;二维码已成为连接线上线下的桥梁&#xff0c;而微信小程序作为轻量级应用的代表&#xff0c;自然也少不了二维码扫描与识别的功能。本文将手把手教你如何在微信小程序中集成这项实用功…

【3dmax笔记】020:变换输入、世界坐标、屏幕坐标案例详解

文章目录 一、变换输入二、世界坐标三、屏幕坐标四、区别一、变换输入 变换输入可用于:移动/旋转/缩放变换输入,快捷键为F12,在变换输入窗口中,有两种常见重要的坐标系: 世界坐标:固定屏幕坐标:随着选择的视图发生变化在3ds Max中,世界坐标(World Coordinate System)…

Git Bash和Git GUI设置中文的方法

0 前言 Git是一个分布式版本控制系统&#xff0c;可以有效、高速地处理从很小到非常大的项目版本管理。一般默认语言为英文&#xff0c;本文介绍修改Git Bash和Git GUI语言为中文的方法。 1 Git Bash设置中文方法 &#xff08;1&#xff09;鼠标右键&#xff0c;单击“Git B…