【大厂AI课学习笔记NO.52】2.3深度学习开发任务实例(5)需求采集考虑维度

今天来学习,怎么做需求分析,如何明确数据采集需求。

我把自己考试通过的学习笔记,都分享到这里了,另外还有一个比较全的思维脑图,我导出为JPG文件了。下载地址在这里:https://download.csdn.net/download/giszz/88868909

本系列都是基于腾讯人工智能AI课的内容,学习笔记,分享给大家,需要更看全面任务的,去腾讯云官网看原文。

详细见下表:

需求采集维度示例
待确认      说明确认结果

赛道样式

明确赛道样式,看是否有和标志类似的图案

使用场地与光照情况

明确模型使用场景与光照情况

  • 室内
  • 侧光,背光,面向光;
  • 信号灯的影响,都会有;

明确交通标志倾斜角度范围

需要检测的交通标志的俯仰角(pitch)、偏航角(yaw)、翻滚角(roll)

这里要有空间想象力,就是注意一点,不是以地面作为xy平面坐标,而是以这个标志牌为平面,再想象出一个z轴,就清晰了。

如上图,x为轴——俯仰角

y为轴——偏航角

z为轴——翻滚角

明确需要检测的交通标志包含哪些

明确需要检测的交通标志包含哪些;1.需要详细列举所有要被检测的交通标志,未被列举的标志不会被识别;2.交通标志的数量越多采集工作量越大;

检测框覆盖范围

需要明确范围细节,如:1.是否包含杆体2.边缘出框情况等等

1.对于交通标志牌子,标注范围是交通标志牌所处范围即可;

2.对于交通信号灯,标注范围是灯亮的区域;

3.对于行人,标注范围是整个行人范围;

4.对于边缘出框的场景,如果出框范围不超过50%,也应当予以检测(如图 2最左侧和最右侧的标志应当能够检出);

检出框分类

是否要对每个框体单独检出

不需要,只需要输出对应检测框即可

需要检测的交通标志的最小框

需要检测的交通标志的最小框最小框越小,运算量越大,执行效率越低;同时,太小的检测框容易使标注误差变大

玩具车速度较快,需要检测到距离车2米的标志,为后续的小车操控预留时间。

对图片模糊程度的要求

实际操作中摄像头模糊效果容忍程度怎样

玩具车摄像头帧率较高,且有处理算法,糊程度实际测试下来最大模糊程度如图

设备色差情况

是否存在设备色差

摄像头较好,无需考虑摄像头色差,但是在部分场景下可能产生由环境光引起的色域变化和噪点,如图

把上面这个表格理解透彻,基本就知道计算机视觉的需求采集,要考虑哪些内容了。

延伸学习:


在计算机视觉中进行需求采集时,需要考虑的维度和注意事项较多。以下是一些主要的维度和注意事项,以及相应的解决思路:

一、考虑的维度:

  1. 应用场景:明确计算机视觉系统的应用场景,如安防监控、自动驾驶、医疗诊断等,有助于确定所需的数据类型和处理方式。
  2. 数据类型:根据应用场景,确定需要采集的数据类型,如图像、视频、深度信息等。
  3. 数据量:评估所需的数据量,以确保训练出的模型具有足够的泛化能力。
  4. 数据质量:关注数据的清晰度、准确性、完整性和多样性,以提高模型的性能。
  5. 实时性要求:对于需要实时处理的应用场景,应关注算法的运算速度和效率。

二、公认的注意事项:

  1. 数据隐私和安全:在采集和处理数据时,应遵守相关法律法规,确保用户隐私和数据安全。
  2. 数据标注准确性:对于需要人工标注的数据集,应确保标注的准确性和一致性,以提高模型的训练效果。
  3. 数据偏差和不平衡问题:注意数据集中可能存在的偏差和不平衡问题,如类别不均衡、场景偏差等,这些问题可能导致模型在特定情况下的性能下降。

三、解决思路:

  1. 针对应用场景和数据类型,选择合适的采集设备和方案,确保数据的准确性和完整性。
  2. 对于数据量需求,可以通过数据增强、迁移学习等技术来扩充数据集,提高模型的泛化能力。
  3. 关注数据质量,采用图像预处理、去噪等技术改善图像质量,提高模型的性能。
  4. 针对实时性要求,优化算法和计算资源,提高处理速度。
  5. 遵守相关法律法规,加强数据加密和访问控制,确保数据隐私和安全。
  6. 建立完善的数据标注流程和质量控制机制,提高数据标注的准确性。
  7. 采用采样策略、数据扩充等技术解决数据偏差和不平衡问题,提高模型在各种情况下的性能。

总之,在计算机视觉中进行需求采集时,需要全面考虑应用场景、数据类型、数据量、数据质量和实时性要求等维度,并关注数据隐私、安全、标注准确性以及偏差和不平衡等问题。通过选择合适的采集方案、优化算法和计算资源以及加强质量控制等措施,可以有效地解决这些问题,提高计算机视觉系统的性能和可靠性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/700587.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件设计师软考题目解析02 --每日五题

想说的话:要准备软考了。0.0,其实我是不想考的,但是吧,由于本人已经学完所有知识了,只是被学校的课程给锁在那里了,不然早找工作去了。寻思着反正也无聊,就考个证玩玩。 本人github地址&#xf…

C++之std::async

std::async是C提供的一个异步处理函数。 函数原型&#xff1a; template<typename _Fn, typename... _Args> future<__async_result_of<_Fn, _Args...>> async(launch __policy, _Fn&& __fn, _Args&&... __args); 参数说明: int thFun(in…

MT8791迅鲲900T联发科5G安卓核心板规格参数_MTK平台方案定制

MT8791安卓核心板是一款搭载了旗舰级配置的中端手机芯片。该核心板采用了八核CPU架构设计&#xff0c;但是升级了旗舰级的Arm Cortex-A78核心&#xff0c;两个大核主频最高可达2.4GHz。配备了Arm Mali-G68 GPU&#xff0c;通过Mali-G88的先进技术&#xff0c;图形处理性能大幅提…

xtu oj 1233 Cycle Matrix 2.0

题目描述 给定N&#xff0c;输出一个N*N的矩阵&#xff0c;矩阵为N层&#xff0c;每层是一个字符&#xff0c;从A到Z。 比如说N3,矩阵为 CCCCC CBBBC CBABC CBBBC CCCCC输入 第一行是一个整数K&#xff08;K≤50&#xff09;,表示样例数。 每个样例占1行&#xff0c;为一个整…

更新从MySQL中读取数据时发现MySQL中的时间字段会相差8小时?

这里写自定义目录标题 修改事件A中的某些字段的数据&#xff0c;规则表中事件A对应的规则字段不发生改变 业务需求&#xff1a;需要将MySQL中的两张表同步到ES中&#xff08;新增、修改、删除同步&#xff09;&#xff0c;优化事件查询速度 解决方案&#xff1a;使用logstash-i…

对实现移动应用界面设计的思考

1. 屏幕 1.1. 屏幕的职责 现在的移动设备都使用触摸屏&#xff0c;触摸屏承担了两项职责&#xff1a;展示界面和处理用户操作指令。界面上展示的东西又可以分为内容和样式。比如展示一行大标题&#xff0c;标题文字是内容&#xff0c;字体、字号、颜色、背景色等等是样式。处…

Python 实现 ATR 指标计算(真实波幅):股票技术分析的利器系列(10)

Python 实现 ATR 指标计算&#xff08;真实波幅&#xff09;&#xff1a;股票技术分析的利器系列&#xff08;10&#xff09; 介绍算法解释 代码rolling函数介绍核心代码 完整代码 介绍 ATR&#xff08;真实波幅&#xff09;是一种技术指标&#xff0c;用于衡量市场波动性的程…

北航历届复试总结

政治题 科技兴国 英文翻译&#xff08;读一遍英文再翻译&#xff09; 随机抽一段计算机相关的英文论文&#xff0c;读一遍后翻译。建议全读完后再翻译&#xff0c;这样遇到不会的单词可以靠上下文猜一猜意思。之后如果你英语不强&#xff08;像我这种菜鸡&#xff09;&#xf…

【AHK】 MacOS复制粘贴习惯/MacOS转win键位使用习惯修改建议

自从转Mos后&#xff0c;转回win习惯又很不适应&#xff0c;怎么尽可能地降低两者的操作差异呢&#xff1f;通过AHK将大部分的Alt键位操作适当修改即可&#xff0c;特别是Home和End这类键&#xff0c;感觉是Mac的使用习惯更舒适 !c:: send,^c return!v:: send,^v return!x:: se…

content-type

content-type是什么 Content-Type 是 HTTP 协议中的一个头部字段&#xff08;Header Field&#xff09;&#xff0c;用于指示发送的实体数据的媒体类型&#xff08;Media Type&#xff09;。该字段用于告知服务器或客户端接收到的数据的内容类型&#xff0c;以便正确地处理和解…

如何获取 mysql 外键索引的元数据信息?

背景 对数据进行统一的管理处理&#xff0c;后续方便使用。 基本信息 见上一篇的处理。 select * from information_schema.KEY_COLUMN_USAGE where REFERENCED_TABLE_SCHEMA test \G;*************************** 1. row ***************************CONSTRAINT_CATALOG:…

Linux--ACL权限管理

一.ACL权限管理简介 ACL&#xff08;Access Control List&#xff0c;访问控制列表&#xff09;是一种文件权限管理机制&#xff0c;它提供了比传统的UGO&#xff08;用户、组、其他&#xff09;权限更灵活的权限设置方式。以下是ACL的一些主要功能&#xff1a; 针对特定用户或…

【Linux】docker构建环境编译运行linux内核

文章目录 1. 使用docker构建linux内核编译运行环境1.1. 为普通用户安装docker并验证是否安装成功1.1.1. 安装docker稳定版1.1.2. 启动docker1.1.3. 将当前用户加入docker用户组1.1.4. 验证docker是否安装成功 1.2. docker基本使用1.2.1. 列出所有镜像1.2.2. 查看当前所有容器的…

Vue3学习——路由

多级路由 routes:[{path:/about,component:About,},{path:/home,component:Home,children:[ //通过children配置子级路由{path:news, //此处一定不要写&#xff1a;/newscomponent:News},{path:message,//此处一定不要写&#xff1a;/messagecomponent:Message}]} ]命名路由 …

lower_bound详解

lower_bound是C标准模板库(STL)中的一个算法&#xff0c;用于在有序区间中查找第一个大于或等于给定值的元素的位置。这个函数非常有用&#xff0c;特别是当我们需要在有序数据集中进行二分查找时。下面是对lower_bound函数的详细讲解&#xff0c;包括其用法、原理、实现细节以…

pyqt如何实现拖拽打开文件(通过windows的快捷方式打开文件)

桌面端的开发中如何通过windows的快捷方式打开文件&#xff0c;那么如何将需要打开的数据传递给qt程序呢&#xff1f; 研究了一下发现很简单 通过sys.argv可以轻松的实现传参 sys.argv import sys print(sys.argv)这个方法可以获取系统传递给程序的参数&#xff0c;默认是个列…

企业型多域名SSL证书

多域名SSL证书是目前市场上用的比较多的一种&#xff0c;主要解决多个不同规则的域名申请&#xff0c;但不适合主域名&#xff08;根域名&#xff09;相同的域名&#xff0c;因为这种域名直接申请通配符。 企业型其实就是OV类型或者EV类型&#xff0c;由于在CA/B产品名称规范中…

pi(2)

上一次我们说到了这个程序 #include <iostream> #include <cmath> #include <limits> int continuedFractionTerm(int n) { if (n 0) return 1; if (n % 2 0) { return 2 * n 1; } else { return 2 * n; } } std::pair<int, int> be…

jetson nano——安装archiconda

目录 1.archiconda3我在这提供了下载链接&#xff0c;点解下面链接即可1.看好文件所在位置&#xff0c;如果装错了&#xff0c;那么环境变量的路径自己进行相应的修改。2.添加环境变量 2.可能部分伙伴输入一些激活&#xff0c;啥的命令激活不了&#xff0c;那么输入下面这些代码…

react18加antd新手上路使用

第一次使用react和antd组件库&#xff0c;记录过程中实用的几个组件和使用方法&#xff1b; 项目中依赖版本 "react": "^18.2.0", "antd": "^5.3.0",Input关闭历史填充 <Input placeholder"请输入ID/名称" allowClear a…