【大厂AI课学习笔记NO.52】2.3深度学习开发任务实例(5)需求采集考虑维度

今天来学习,怎么做需求分析,如何明确数据采集需求。

我把自己考试通过的学习笔记,都分享到这里了,另外还有一个比较全的思维脑图,我导出为JPG文件了。下载地址在这里:https://download.csdn.net/download/giszz/88868909

本系列都是基于腾讯人工智能AI课的内容,学习笔记,分享给大家,需要更看全面任务的,去腾讯云官网看原文。

详细见下表:

需求采集维度示例
待确认      说明确认结果

赛道样式

明确赛道样式,看是否有和标志类似的图案

使用场地与光照情况

明确模型使用场景与光照情况

  • 室内
  • 侧光,背光,面向光;
  • 信号灯的影响,都会有;

明确交通标志倾斜角度范围

需要检测的交通标志的俯仰角(pitch)、偏航角(yaw)、翻滚角(roll)

这里要有空间想象力,就是注意一点,不是以地面作为xy平面坐标,而是以这个标志牌为平面,再想象出一个z轴,就清晰了。

如上图,x为轴——俯仰角

y为轴——偏航角

z为轴——翻滚角

明确需要检测的交通标志包含哪些

明确需要检测的交通标志包含哪些;1.需要详细列举所有要被检测的交通标志,未被列举的标志不会被识别;2.交通标志的数量越多采集工作量越大;

检测框覆盖范围

需要明确范围细节,如:1.是否包含杆体2.边缘出框情况等等

1.对于交通标志牌子,标注范围是交通标志牌所处范围即可;

2.对于交通信号灯,标注范围是灯亮的区域;

3.对于行人,标注范围是整个行人范围;

4.对于边缘出框的场景,如果出框范围不超过50%,也应当予以检测(如图 2最左侧和最右侧的标志应当能够检出);

检出框分类

是否要对每个框体单独检出

不需要,只需要输出对应检测框即可

需要检测的交通标志的最小框

需要检测的交通标志的最小框最小框越小,运算量越大,执行效率越低;同时,太小的检测框容易使标注误差变大

玩具车速度较快,需要检测到距离车2米的标志,为后续的小车操控预留时间。

对图片模糊程度的要求

实际操作中摄像头模糊效果容忍程度怎样

玩具车摄像头帧率较高,且有处理算法,糊程度实际测试下来最大模糊程度如图

设备色差情况

是否存在设备色差

摄像头较好,无需考虑摄像头色差,但是在部分场景下可能产生由环境光引起的色域变化和噪点,如图

把上面这个表格理解透彻,基本就知道计算机视觉的需求采集,要考虑哪些内容了。

延伸学习:


在计算机视觉中进行需求采集时,需要考虑的维度和注意事项较多。以下是一些主要的维度和注意事项,以及相应的解决思路:

一、考虑的维度:

  1. 应用场景:明确计算机视觉系统的应用场景,如安防监控、自动驾驶、医疗诊断等,有助于确定所需的数据类型和处理方式。
  2. 数据类型:根据应用场景,确定需要采集的数据类型,如图像、视频、深度信息等。
  3. 数据量:评估所需的数据量,以确保训练出的模型具有足够的泛化能力。
  4. 数据质量:关注数据的清晰度、准确性、完整性和多样性,以提高模型的性能。
  5. 实时性要求:对于需要实时处理的应用场景,应关注算法的运算速度和效率。

二、公认的注意事项:

  1. 数据隐私和安全:在采集和处理数据时,应遵守相关法律法规,确保用户隐私和数据安全。
  2. 数据标注准确性:对于需要人工标注的数据集,应确保标注的准确性和一致性,以提高模型的训练效果。
  3. 数据偏差和不平衡问题:注意数据集中可能存在的偏差和不平衡问题,如类别不均衡、场景偏差等,这些问题可能导致模型在特定情况下的性能下降。

三、解决思路:

  1. 针对应用场景和数据类型,选择合适的采集设备和方案,确保数据的准确性和完整性。
  2. 对于数据量需求,可以通过数据增强、迁移学习等技术来扩充数据集,提高模型的泛化能力。
  3. 关注数据质量,采用图像预处理、去噪等技术改善图像质量,提高模型的性能。
  4. 针对实时性要求,优化算法和计算资源,提高处理速度。
  5. 遵守相关法律法规,加强数据加密和访问控制,确保数据隐私和安全。
  6. 建立完善的数据标注流程和质量控制机制,提高数据标注的准确性。
  7. 采用采样策略、数据扩充等技术解决数据偏差和不平衡问题,提高模型在各种情况下的性能。

总之,在计算机视觉中进行需求采集时,需要全面考虑应用场景、数据类型、数据量、数据质量和实时性要求等维度,并关注数据隐私、安全、标注准确性以及偏差和不平衡等问题。通过选择合适的采集方案、优化算法和计算资源以及加强质量控制等措施,可以有效地解决这些问题,提高计算机视觉系统的性能和可靠性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/700587.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件设计师软考题目解析02 --每日五题

想说的话:要准备软考了。0.0,其实我是不想考的,但是吧,由于本人已经学完所有知识了,只是被学校的课程给锁在那里了,不然早找工作去了。寻思着反正也无聊,就考个证玩玩。 本人github地址&#xf…

C++之std::async

std::async是C提供的一个异步处理函数。 函数原型&#xff1a; template<typename _Fn, typename... _Args> future<__async_result_of<_Fn, _Args...>> async(launch __policy, _Fn&& __fn, _Args&&... __args); 参数说明: int thFun(in…

MT8791迅鲲900T联发科5G安卓核心板规格参数_MTK平台方案定制

MT8791安卓核心板是一款搭载了旗舰级配置的中端手机芯片。该核心板采用了八核CPU架构设计&#xff0c;但是升级了旗舰级的Arm Cortex-A78核心&#xff0c;两个大核主频最高可达2.4GHz。配备了Arm Mali-G68 GPU&#xff0c;通过Mali-G88的先进技术&#xff0c;图形处理性能大幅提…

Python 实现 ATR 指标计算(真实波幅):股票技术分析的利器系列(10)

Python 实现 ATR 指标计算&#xff08;真实波幅&#xff09;&#xff1a;股票技术分析的利器系列&#xff08;10&#xff09; 介绍算法解释 代码rolling函数介绍核心代码 完整代码 介绍 ATR&#xff08;真实波幅&#xff09;是一种技术指标&#xff0c;用于衡量市场波动性的程…

Linux--ACL权限管理

一.ACL权限管理简介 ACL&#xff08;Access Control List&#xff0c;访问控制列表&#xff09;是一种文件权限管理机制&#xff0c;它提供了比传统的UGO&#xff08;用户、组、其他&#xff09;权限更灵活的权限设置方式。以下是ACL的一些主要功能&#xff1a; 针对特定用户或…

【Linux】docker构建环境编译运行linux内核

文章目录 1. 使用docker构建linux内核编译运行环境1.1. 为普通用户安装docker并验证是否安装成功1.1.1. 安装docker稳定版1.1.2. 启动docker1.1.3. 将当前用户加入docker用户组1.1.4. 验证docker是否安装成功 1.2. docker基本使用1.2.1. 列出所有镜像1.2.2. 查看当前所有容器的…

pyqt如何实现拖拽打开文件(通过windows的快捷方式打开文件)

桌面端的开发中如何通过windows的快捷方式打开文件&#xff0c;那么如何将需要打开的数据传递给qt程序呢&#xff1f; 研究了一下发现很简单 通过sys.argv可以轻松的实现传参 sys.argv import sys print(sys.argv)这个方法可以获取系统传递给程序的参数&#xff0c;默认是个列…

企业型多域名SSL证书

多域名SSL证书是目前市场上用的比较多的一种&#xff0c;主要解决多个不同规则的域名申请&#xff0c;但不适合主域名&#xff08;根域名&#xff09;相同的域名&#xff0c;因为这种域名直接申请通配符。 企业型其实就是OV类型或者EV类型&#xff0c;由于在CA/B产品名称规范中…

pi(2)

上一次我们说到了这个程序 #include <iostream> #include <cmath> #include <limits> int continuedFractionTerm(int n) { if (n 0) return 1; if (n % 2 0) { return 2 * n 1; } else { return 2 * n; } } std::pair<int, int> be…

jetson nano——安装archiconda

目录 1.archiconda3我在这提供了下载链接&#xff0c;点解下面链接即可1.看好文件所在位置&#xff0c;如果装错了&#xff0c;那么环境变量的路径自己进行相应的修改。2.添加环境变量 2.可能部分伙伴输入一些激活&#xff0c;啥的命令激活不了&#xff0c;那么输入下面这些代码…

深入浅出JVM(八)之类加载器

前文已经描述Java源文件经过前端编译器后变成字节码文件&#xff0c;字节码文件通过类加载器的类加载机制在Java虚拟机中生成Class对象 前文深入浅出JVM&#xff08;六&#xff09;之前端编译过程与语法糖原理重点描述过编译的过程 前文深入浅出JVM&#xff08;三&#xff09…

视频基础学习二——图像深度与格式(RGB与YUV)

文章目录 前言一、图像深度1.什么是图像深度2.图像深度的意义3.常见的图像深度8位16位24位32位 二、图像格式1.RGB格式2.RGB样式2.YUVYUV的来由YUV样式RGB和YUV之间的转换YUV的常见类型 总结 前言 本文的目的是为了梳理音视频基础相关的知识&#xff0c;有很多做流媒体、音视频…

高级语言期末2010级A卷

1.编写函数&#xff0c;按照如下公式计算圆周率π的值&#xff08;精确到1e-5&#xff09; #include <stdio.h>double pai() {double last0;double flag1;int n1;while(flag-last>1e-5) {lastflag;flag*1.0*(2*n)*(2*n)/((2*n-1)*(2*n1));n;}return 2*last; }int main…

基于SpringBoot的停车场管理系统

基于SpringBootVue的停车场管理系统的设计与实现~ 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringBootMyBatis工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 前台首页 停车位 个人中心 管理员界面 摘要 摘要&#xff1a;随着城市化进程的…

C#,计算几何,计算机图形学(Computer Graphics)洪水填充算法(Flood Fill Algorithm)与源代码

1 泛洪填充算法(Flood Fill Algorithm) 泛洪填充算法(Flood Fill Algorithm) &#xff0c;又称洪水填充算法&#xff0c;是在很多图形绘制软件中常用的填充算法&#xff0c;最熟悉不过就是 windows 自带画图软件的油漆桶功能。 2 源程序 using System; using System.Collecti…

windows 虚拟机:CrossOver 24.0.0 for Mac破解版安装激活2024图文教程

CrossOver 24.0.0 for Mac是一款功能强大的虚拟机软件&#xff0c;允许在Mac系统上运行Windows应用程序而无需重新启动计算机。通过CrossOver&#xff0c;用户可以轻松地运行Windows软件和游戏&#xff0c;而无需购买Windows许可证或使用虚拟机。 CrossOver 24.0.0 for Mac通过…

MySQL-基本使用,数据类型,简单操作

1. 数据库概述 1.1 数据库(DatBase) 数据库&#xff0c;就是遵循一定数据格式的数据集合&#xff0c;可以认为他是对文件系统的改进。它解决了不同操作系统之间&#xff0c;数据格式的兼容性问题。也就是说&#xff0c;只要是同一个数据库的数据文件&#xff0c;即使从windows迁…

使用 kind 集群安装运行极狐GitLab Runner【下】

GitLab 是一个全球知名的一体化 DevOps 平台&#xff0c;很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版&#xff0c;专门为中国程序员服务。可以一键式部署极狐GitLab。 上一篇内容中&#xff0c;我们已经利用 kind 创建好了一个本地…

GPT-SoVITS 快速声音克隆使用案例:webui、api接口

参考: https://github.com/RVC-Boss/GPT-SoVITS 环境: Python 3.10 PyTorch 2.1.2, CUDA 12.0 安装包: 1、使用: 1)下载项目 git clone https://github.com/RVC-Boss/GPT-SoVITS.git2)下载预训练模型 https://huggingface.co/lj1995/GPT-SoVITS 下载模型文件放到GPT…

C# (WebApi)整合 Swagger

SpringBoot-整合Swagger_jboot整合swagger-CSDN博客 C# webapi 也可以整合Swagger webapi运行其实有个自带的HELP页面 但是如果觉得UI不好看&#xff0c;且没办法显示方法注释等不方便的操作&#xff0c;我们也可以整合Swagger 一、使用NuGet控制台安装Swagger 在菜单中选择…