YOLOV8:最新探测物体状态综合指南

YLOLV8是最新的以YOO为基础的物体检测模型,提供最先进的性能。

利用前几部《yolo》,yolov8更快速更准确,同时为训练模式提供统一的框架

  • 物体检测
  • 实例分割
  • 影像分类

到编写本文件时,许多功能还没有被添加到超催化剂YLOLV8存储库中。这包括训练有素的模型的一整套导出特性。此外,超级催化剂将发布一篇关于arxiv与其他最先进的视觉模型相比较的论文。

  • YLOV8建筑和什么是新的在YLOV8?
  • 提供的模型见
  • 如何使用YLov8?
  • YLOLV8目标检测模型的演变
  • 结论

YLOV8建筑和什么是新的在YLOV8?

超催化剂发布了一个全新的YOLOV8存储库。它是作为  训练对象检测、实例分割和图像分类模型的统一框架。
以下是新版本的一些主要特点:

  • 对用户友好的API(命令行+组)。
  • 更快更准确。
  • 支持
    • 物体检测,
    • 实例分割,
    • 影像分类。
  • 可扩展到所有以前的版本。
  • 新的主干网。
  • 新的无锚头。
  • 新的损失函数。

YLOLV8也是高效率和灵活的支持多个导出格式,该模型可以运行在CPU和GPS上。

在架构层面,根据 这个吉塔布问题 :

… C3模块 改为 C2F模块 .
第一次 6×6 Conv 被替换为 3×3 Conv 在…中 脊骨 .
使用脱钩头和删除 物体处 .
第一次 1×1 Conv in Backbone 被替换为 3×3 Conv .
提供的模型见
在YLOLV8模型的每个类别中,有5个模型用于检测、分割和分类。YLOLV8纳米是最快和最小的,而YLOLV8是最准确,也是最慢的。

YLOLV8与下列经过训练的模特捆绑在一起:

  • 对象检测检查站接受了关于可可检测数据集的培训,图像分辨率为640。
  • 实例分割检查站对可可分割数据集进行培训,图像分辨率为640。
  • 图像分类模型预先培训了伊马内特数据集的图像分辨率为224。

让我们来看看使用YLOLV8X检测和实例分割模型的输出。

如何使用YLov8?

要充分利用YLOLV8的潜力,就需要从存储库以及ultralytics 包裹。

要安装需求,我们需要首先克隆存储库。

安装需求

pip install -r requirements.txt

如何使用命令行接口(CLI)使用YLOLV8?

在安装了必要的包后,我们可以使用yolo 指挥官。下面是一个使用yolo 克里。

yolo task=detect \
mode=predict \
model=yolov8n.pt \
source="image.jpg"

task 国旗可以接受三个论点:detect ,classify ,以及segment .同样,这种模式可以是train ,val ,或predict .我们还可以通过模式export 在输出训练有素的模型时。

以下图片显示了所有可能的yolo CLI标志和争论。

如何使用组的API使用YLOLV8?

我们还可以创建一个简单的pygn文件,导入Yloo模块并执行我们选择的任务。

from ultralytics import YOLOmodel = YOLO("yolov8n.pt")  # load a pretrained YOLOv8n modelmodel.train(data="coco128.yaml")  # train the model
model.val()  # evaluate model performance on the validation set
model.predict(source="https://ultralytics.com/images/bus.jpg")  # predict on an image
model.export(format="onnx")  # export the model to ONNX format

例如,上述代码将首先在COCO128数据集上培训YLOLV8纳米模型,在验证集上对其进行评估,并对样本图像进行预测。

我们用这个yolo 使用对象检测、实例分割和图像分类模型进行推理.

使用YLOLV8进行物体检测的推断结果

下面的命令在一个视频上运行检测,使用YLOLV8纳米模型。

yolo task=detect mode=predict model=yolov8n.pt source='input/video_3.mp4' show=True

几乎可以推断 105 FPS on a laptop GTX 1060 GPU .我们得到以下输出。

夹1.用YLOLV8纳米模型进行检测推理 

YLOLV8纳米模型混淆了猫在几个框架中作为狗。让我们在同一视频上使用YLOLV8特大型运行检测,并检查输出。

	
yolo task=detect mode=predict model=yolov8x.pt source='input/video_3.mp4' show=True

 超大型的模型运行在平均17FPS在全球贸易交易1060GPS。

虽然这次的错误分类稍微少了一点,但是模型在一些框架中错误地发现了这个平台。

推断结果,例如使用YLOLV8进行分割

使用YLov8实例分割模型的运行推理同样简单。我们只需要改变task 以及model 名字在上面的命令。

	
yolo task=segment mode=predict model=yolov8x-seg.pt source='input/video_3.mp4' show=True

 由于实例分割与对象检测相耦合,这一次,平均FPS在13左右。

分割图在输出中看起来很清晰。甚至当猫在最后几帧中隐藏在块下时,模型也能够检测和分割它。

用YLOLV8进行图像分类的推断结果

最后,由于YLOLV8已经提供了预先训练的分类模型,让我们使用yolov8x-cls 做模特。这是存储库提供的最大的分类模型。

yolo task=classify mode=predict model=yolov8x-cls.pt source='input/video_3.mp4' show=True

默认情况下,该视频会被模型预测的前5类注释。没有任何后处理的注释直接匹配伊马涅特类名称。

用YLOLV8进行人体姿势估计

最新的YLOLV8系列的模型还包括能够极精确地检测人类关键点的姿态估计模型。您可以使用以下命令在视频上运行人体姿势估计。

	
yolo task=pose mode=predict model=yolov8x-pose.pt source=video.mp4 show=True

 以下是输出类型。夹5.用YLOLV8人体姿势模型进行人体姿势检测。

不仅如此,我们还可以很好地调整YLOLV8的造型 动物键点检测 .

就在此时,与以前的YLOLO模型相比,YLOV8模型的表现似乎要好得多。不仅YOLOV5型,还领先于YOLOV7型和YOLOV6型。 

与其他的YLOO模型相比,YLOO8模型的图像分辨率为640,所有的YOLOV8模型的吞吐量和参数数相似。

现在,让我们详细了解一下最新的YLOLV8型是如何用超级催化剂的YLOLV5型来表现的。下表全面比较了YLOV8和YLOV5。

全面比较

与YLOV5模型比较 

 目标检测比较

YOLOV8与YOLOV5物体探测模型 

实例分割比较

Y洛夫8与Y洛夫5实例分割模型。

 yolov5 和 yolov8实例分割模型

图像分类比较

YOLOV8与YOLOV5图像分类模型。

YOLOV8与YOLOV5图像分类模型

很明显,除了一个分类模型之外,最新的YLOV8模型比YLOV5模型要好得多。

YLOLV8目标检测模型的演变

这是一张图片,显示了约洛目标检测模型的时间线,以及YLov8的演变是如何发生的。

尤洛物体检测模型

所有YLOLO目标检测模型在YLOLV3之前都是使用C编程语言编写的,并使用了黑网框架。新来的人发现很难穿过代码栏,并对模型进行微调。

大约在YOLOV3的同时,超晶石公司发布了第一个使用POOOOO3框架实现的YOLOV3。它也更容易获得和用于转学。

在发表了《YLOLV3》后不久,约瑟夫·雷德蒙就离开了计算机视觉研究界。(由亚历克谢等人。)是最后一个用黑网书写的YLOO模型。在那之后,已经有了很多"约洛"物体的探测。有比例的YLOV4、YOLOX、PP-YLOO、YOLOV6和YOLOV7是其中一些突出的。

在YOLOV3之后,超催化剂也发布了YOLOV5,它比所有其他YOlo模型都更好、更快、更容易使用。

从现在(2023年1月n)起,在 超催化剂 可能是迄今为止最好的yolo模型。

结论

在这篇文章中,我们探讨了约洛模型的最新一期,即yolo8。我们介绍了新的模型,它们的性能,以及随包而来的命令行接口。与此同时,我们也对视频进行推理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/228878.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Axure元件的介绍使用以及登录界面和个人简历的绘制

目录 一、Axure元件介绍 1.1 简介 1.2 特点 1.3 元件操作 二、基本元件的使用 2.1 矩形和圆形 2.2 图片 2.2.1 图片元件特点 2.2.2 具体操作 2.3 占位符 2.3.1 使用规范方法举例 2.4 文本元件 2.4.1 图示 2.5 热区 2.5.1 图示 2.5.2 热区辅助页面排版 2.6 线段…

Redis7--基础篇8(集群cluster)

1. 集群(cluster)介绍 由于数据量过大,单个Master复制集难以承担,因此需要对多个复制集进行集群,形成水平扩展每个复制集只负责存储整个数据集 的一部分,这就是Redis的集群,其作用是提供在多个…

2023人物专访【中国新时代艺坛楷模】徐大龙盆景艺术专题报道

随着社会经济的发展和人们审美观念的改变,苏派盆景艺术以其精湛的技艺和独特的艺术魅力,又成为了中外盆景界的一大亮点。今天来聊聊江南盆景艺术专家徐大龙先生。 徐大龙,江苏常州人,「复兴之路,强国有我」50位爱国奉献…

web(HTML之表单练习)

使用HTML实现该界面: 要求如下: 用户名为文本框,名称为 UserName,长度为 15,最大字符数为 20。 密码为密码框,名称为 UserPass,长度为 15,最大字符数为 20。 性别为两个单选按钮&a…

Web安全漏洞分析—文件包含

在当今数字化时代,随着Web应用程序的广泛应用,网络安全问题愈加凸显。其中,文件包含漏洞作为一种常见但危险的安全隐患,为恶意攻击者提供了可乘之机。在这篇博客中,我们将深入探讨文件包含漏洞的本质、攻击手法以及应对…

PMP项目管理 - 沟通管理

系列文章目录 PMP项目管理 - 质量管理 PMP项目管理 - 采购管理 PMP项目管理 - 资源管理 PMP项目管理 - 风险管理 现在的一切都是为将来的梦想编织翅膀,让梦想在现实中展翅高飞。 Now everything is for the future of dream weaving wings, let the dream fly in…

LVS-DR部署

目录 LVS的工作模式及其工作过程 NAT模式(VS-NAT) 直接路由模式(VS-DR) IP隧道模式(VS-TUN) DR模式 LVS负载均衡群集的分析及特点 数据包流向分析 DR 模式的特点 LVS-DR部署实例 LVS-DR模式部署流…

2023最新最全【PostMan】安装教程

为了验证接口能否被正常访问,我们常常需要使用测试工具,来对数据接口进行检测。 好处:接口测试工具能让我们在不写任何代码的情况下,对接口进行调用和调试。 下载并安装PostMan 首先,下载并安装PostMan,请…

吊炸天,腾讯开源的一站式微服务解决方案

项目介绍 Spring Cloud Tencent 是腾讯开源的一站式微服务解决方案。 Spring Cloud Tencent 实现了Spring Cloud 标准微服务 SPI,开发者可以基于 Spring Cloud Tencent 快速开发 Spring Cloud 云原生分布式应用。 Spring Cloud Tencent 的核心依托腾讯开源的一站式…

Git-瑞吉外卖

什么是GIt? 分布式版本控制工具,用来管理源代码文件。分布式主要体现在两种仓库(本地仓库、远程仓库)。 git的作用? 代码回溯、版本切换(切换不同框架)、多人协作、远程备份 基本命令&…

SpringBoot零基础入门到项目实战——学习路线规划与目录结构

文章目录 第一部分:Spring Boot基础第二部分:Web开发与RESTful API第三部分:数据访问与持久化第四部分:安全与身份验证第五部分:高级主题第六部分:测试总结与扩展实战项目练习 🎉欢迎来到Spring…

Base64编码解码(文本与文件)

目录 1.什么是base64 2.在java中使用base64 3.在js中使用base64 1.什么是base64 base64编码就是将字符串以每3个比特(bit)的字节子序列拆分为4个6比特(bit)的字节子序列(这个6比特是有效字节,最左边两个…

xilinx原语介绍及仿真——ODELAYE2

7系列IO模块相关的结构如图1所示,前文对IOB、IDELAYE2、ILOGIC、OLOGIC进行了讲解,还剩下ISERDESE2、OSERDESE2、ODELAYE2原语,本文对ODELAYE2进行讲解,该原语只有HP bank才有,即7系列FPGA的A7系列没有ODELAYE2结构&am…

探索太空深渊:计算机技术在航天领域的无限可能

探索太空深渊:计算机技术在航天领域的无限可能 一、引言 在21世纪的科技浪潮中,太空探索和计算机技术无疑是两个最为璀璨夺目的领域。它们各自的发展都足以改变人类社会的未来,而当这两者交汇时,所激发出的创新和变革更是超乎我…

git-lfs基本知识讲解

目录 1. 基本知识2. 安装 1. 基本知识 git-lfs 是 Git Large File Storage 的缩写,是 Git 的一个扩展,用于处理大文件的版本控制。 它允许你有效地管理和存储大型二进制文件,而不会使 Git 仓库变得过大和不稳定。以下是一些与 git-lfs 相关…

IIS如何本地部署网站,作为局域网内的服务器

文章目录 IIS本地部署WebService1.使用IIS及WebService的原因:2.相关文件说明及网络条件说明:(1)文件说明:(2)网络条件说明: 3.IIS安装与配置:第一步:安装第二步&#xf…

01--二分查找

一. 初识算法 1.1 什么是算法? 在数学和计算机科学领域,算法是一系列有限的严谨指令,通常用于解决一类特定问题或执行计算 不正式的说,算法就是任何定义优良的计算过程:接收一些值作为输入,在有限的时间…

介绍一款上传漏洞fuzz字典生成工具

介绍一款上传漏洞fuzz字典生成工具 1.工具概述2.安装3.参数解析4.使用案例1.工具概述 upload-fuzz-dic-builder是一个上传漏洞fuzz字典生成脚本,生成时给的上传点相关信息越详细,生成的字典越精确 upload-fuzz-dic-builder 2.安装 克隆项目: git clone git@github.com:c…

CTF-文件包含(1)

南邮杯CTF 文件包含 题目地址:asdf 点击后利用file函数对show.php进行文件利用 使用伪协议php://filter/readconvert.base64-encode/resourceindex.php访问index.php文件 base64解码后得到flag [极客大挑战 2019]Secret File 题目地址:BUUCTF在线评测 …

用23种设计模式打造一个cocos creator的游戏框架----(十九)备忘录模式

1、模式标准 模式名称:备忘录模式 模式分类:行为型 模式意图:在不破坏封装性的前提下捕获一个对象的内部状态,并在对象之外保存这个状态。这样以后就可以将对象恢复到原先保存的状态 结构图: 适用于: …