【大厂AI课学习笔记NO.53】2.3深度学习开发任务实例(6)数据采集

这个系列写了53期了,很多朋友收藏,看来还是觉得有用。

后续我会把相关的内容,再次整理,做成一个人工智能专辑。

今天学习到了数据采集的环节。

这里有个问题,数据准备包括什么,还记得吗?

数据准备包括了数据采集、数据清洗、数据标注、数据验收、数据交付5个核心过程。

这里要区分数据标注和特征工程中的打标签。

根据确认的需求,采集对应的图片,图片采集需要注意:

  • 使用真实的玩具车进行数据采集
  • 覆盖不同场景
  • 涵盖所有可能的光照情况
  • 涵盖所有可能的交通标志,推动了一大类 非线性映射函数学习问题 的解决

采集数量:根据任务要求不同略有差异,玩具车场景任务较为简单,总计采集1万张图片。

采集方式:让小车在不同场景形式,使用摄像头录制视频,然后将每帧导出为jpg格式图片。

 

这里有一些特定的工具,来进行视频图像的采集。

延伸学习:


  • 图像采集
    • 使用玩具车上的摄像头录制视频。
    • 将视频分解为图像帧,以便进一步处理。
  • 图像预处理
    • 调整图像大小、裁剪、旋转等,使其适合输入到神经网络中。
    • 归一化图像,通常是将像素值缩放到0-1之间。
    • 可能还需要进行图像增强,如亮度调整、对比度增强、噪声减少等。
  • 数据标注
    • 对于监督学习,你需要标注数据集。这意味着你需要手动或通过半自动工具为图像中的交通标志牌打上标签。
    • 开源工具如LabelImg或CVAT可用于图像标注。
  • 模型训练
    • 选择一个深度学习框架,如TensorFlow、PyTorch等。
    • 构建或选择一个预训练的卷积神经网络(CNN)模型来进行图像分类或目标检测。
    • 使用标注的数据集来训练模型。
    • 调整模型参数(超参数调优)以优化性能。
  • 模型评估与优化
    • 使用验证集评估模型的性能,查看准确率、召回率等指标。
    • 根据评估结果进行模型优化,如调整网络结构、增加数据等。
  • 部署与测试
    • 将训练好的模型部署到玩具车上,这可能需要将模型转换为适合嵌入式设备或边缘计算的格式。
    • 在实际环境中测试模型的表现,确保它能够准确地识别交通标志牌。
  • 实时视频处理
    • 使用OpenCV等库实时捕获和处理视频流。
    • 将每一帧图像输入到部署好的模型中进行预测。
    • 根据预测结果做出相应的动作或决策。

开源工具方面,除了之前提到的标注工具外,还有以下一些建议:

  • 深度学习框架:TensorFlow、PyTorch、Keras等。
  • 图像处理库:OpenCV、PIL等。
  • 模型转换工具:如TensorRT、OpenVINO等,用于将模型转换为适合部署的格式。
  • 边缘计算平台:如NVIDIA Jetson系列,适用于在嵌入式设备上运行深度学习模型。

关键技术包括卷积神经网络(CNN)的设计与训练、目标检测算法(如YOLO、SSD等)、图像预处理与增强技术、模型压缩与优化技术(如量化、剪枝等)以及实时视频处理技术。这些技术的具体实现会根据你的需求和硬件条件而有所不同。

摄像头选择:

  1. 分辨率:选择至少VGA(640x480像素)或更高分辨率的摄像头。更高的分辨率通常意味着更清晰的图像,有助于提高识别准确性。

  2. 帧率:至少30帧每秒(FPS)的帧率是比较理想的,这样可以捕捉到流畅的视频,并有助于实时处理。

  3. 焦距和视场角:根据玩具小车的大小和行驶速度,选择合适的焦距和视场角(FOV)。宽视场角有助于捕捉更多的环境信息,但可能会牺牲图像的清晰度。

  4. 接口类型:选择适合你的处理设备的接口类型,比如USB或MIPI CSI。

  5. 尺寸和重量:确保摄像头足够小巧轻便,以便安装在玩具小车上而不会对其性能造成太大影响。

处理器和边缘计算设备:

是的,你需要一个处理器或边缘计算设备来运行你的深度学习模型并处理摄像头捕捉到的图像。以下是一些可能的选项:

  1. 微控制器/单片机:对于一些基本的图像处理和简单的机器学习模型,像Arduino或ESP32这样的微控制器可能就足够了。但它们可能不适合运行复杂的深度学习模型。

  2. 单板计算机:像Raspberry Pi或NVIDIA Jetson Nano这样的单板计算机更适合运行深度学习模型。它们有足够的处理能力来处理视频流,并且有足够的内存来存储和加载模型。

  3. 边缘计算设备:NVIDIA Jetson系列(如Jetson Nano、Jetson TX2/TX2i、Jetson AGX Xavier)是专为机器学习和人工智能应用设计的边缘计算设备。它们具有强大的GPU,可以加速深度学习推理,并且尺寸小巧,适合安装在玩具小车上。

集成到玩具小车上:

  1. 物理安装:确保摄像头和处理设备可以稳固地安装在玩具小车上,并且摄像头的视角能够清晰地捕捉到交通标志。

  2. 电源管理:你需要一个合适的电源解决方案来为摄像头和处理设备供电。这可能包括电池、电压转换器等。

  3. 数据传输:确保摄像头和处理设备之间的数据传输是稳定和高效的。这可能涉及到选择合适的接口和线缆。

  4. 实时性能优化:对于实时应用,你可能需要优化你的深度学习模型和图像处理流程,以确保它们可以在你的处理设备上实时运行而不会造成太大的延迟。

总之,选择合适的摄像头和处理设备是实现玩具小车识别交通标志的关键步骤。根据你的需求和预算,你可以从上述建议中选择适合你的组件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/712003.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

接口测试实战--mock测试、日志模块

一、mock测试 在前后端分离项目中,当后端工程师还没有完成接口开发的时候,前端开发工程师利用Mock技术,自己用mock技术先调用一个虚拟的接口,模拟接口返回的数据,来完成前端页面的开发。 接口测试和前端开发有一个共同点,就是都需要用到后端工程师提供的接口。所以,当…

书生·浦语大模型图文对话Demo搭建

前言 本节我们先来搭建几个Demo来感受一下书生浦语大模型 InternLM-Chat-7B 智能对话 Demo 我们将使用 InternStudio 中的 A100(1/4) 机器和 InternLM-Chat-7B 模型部署一个智能对话 Demo 环境准备 在 InternStudio 平台中选择 A100(1/4) 的配置,如下图所示镜像…

Spring常见面试题知识点总结(三)

7. Spring MVC: MVC架构的概念。 MVC(Model-View-Controller)是一种软件设计模式,旨在将应用程序分为三个主要组成部分,以实现更好的代码组织、可维护性和可扩展性。每个组件有着不同的职责,相互之间解耦…

YOLO算法

YOLO介绍 YOLO,全称为You Only Look Once: Unified, Real-Time Object Detection,是一种实时目标检测算法。目标检测是计算机视觉领域的一个重要任务,它不仅需要识别图像中的物体类别,还需要确定它们的位置。与分类任务只关注对…

【矩阵】【方向】【素数】3044 出现频率最高的素数

作者推荐 动态规划的时间复杂度优化 本文涉及知识点 素数 矩阵 方向 LeetCode 3044 出现频率最高的素数 给你一个大小为 m x n 、下标从 0 开始的二维矩阵 mat 。在每个单元格,你可以按以下方式生成数字: 最多有 8 条路径可以选择:东&am…

安装 Ubuntu 22.04.3 和 docker

文章目录 一、安装 Ubuntu 22.04.31. 简介2. 下载地址3. 系统安装4. 系统配置 二、安装 Docker1. 安装 docker2. 安装 docker compose3. 配置 docker 一、安装 Ubuntu 22.04.3 1. 简介 Ubuntu 22.04.3 是Linux操作系统的一个版本。LTS 版本支持周期到2032年。 系统要求双核 C…

代码随想录 二叉树第二周

目录 101.对称二叉树 100.相同的树 572.另一棵树的子树 104.二叉树的最大深度 559.N叉树的最大深度 111.二叉树的最小深度 222.完全二叉树的节点个数 110.平衡二叉树 257.二叉树的所有路径 101.对称二叉树 101. 对称二叉树 已解答 简单 相关标签 相关企业 给你一…

《求生之路2》服务器如何选择合适的内存和CPU核心数,以避免丢包和延迟高?

根据求生之路2服务器的实际案例分析选择合适的内存和CPU核心数以避免丢包和延迟高的问题,首先需要考虑游戏的类型和对服务器配置的具体要求。《求生之路2》作为一款多人在线射击游戏,其服务器和网络优化对于玩家体验至关重要。 首先,考虑到游…

Java应用程序注册成Linux系统服务后,关闭Java应用程序打印系统日志

Java应用程序有自己的日志框架,有指定位置的日志文件,不需要在系统日志里记录,占用磁盘空间。 1.Linux系统文件目录 /etc/systemd/system/ 找到要修改的Java应用程序服务配置 比如bis-wz-80.service 2.设置不打印日志 StandardOutputnull S…

centos7 搭建 harbor 私有仓库

一、下载安装 1.1、harbor 可以直接从 github 上下载:Releases goharbor/harbor GitHub 这里选择 v2.10.0 的版本 wget https://github.com/goharbor/harbor/releases/download/v2.10.0/harbor-offline-installer-v2.10.0.tgz 1.2、解压 tar zxvf harbor-offlin…

L2 网络 Mint Blockchain 正式对外发布测试网

Mint Blockchain 是由 NFTScan Labs 发起的聚焦在 NFT 生态的 L2 网络,致力于促进 NFT 资产协议标准的创新和 NFT 在现实商业应用场景中的大规模采用。 Mint Blockchain 于 2024 年 2 月 28 号正式对外发布测试网,开始全面进入生态开发者测试开发阶段。 …

Springboot项目集成短信验证码(超简单)

操作流程 注册验证码平台创建验证码模版开始集成(无需引入第三方库) 注册并登陆中昱维信验证码平台 获取AppID和AppKey。 创建验证码模版 创建验证码模版,获取验证码模版id 开始集成 创建controller import org.springframework.web.bi…

MATLAB环境下基于随机游走拉普拉斯算子的快速谱聚类方法

古人有云,物以类聚,在面临信息爆炸问题的今天,对信息类别划分的价值日益显现,并逐步成为学者们的研究热点。分类和聚类是数据挖掘的重要工具,是实现事物类别划分的左右手,聚类又是分类一种特殊的方式。所谓…

CodeWhisperer安装教导--一步到位!以及本人使用Whisperer的初体验。

CodeWhisperer是亚马逊出品的一款基于机器学习的通用代码生成器,可实时提供代码建议。类似 Cursor 和Github AWS CodeWhisperer 亚马逊科技的CodeWhisperer是Amazon于2021年12月推出的一款代码补全工具,与GitHub Copilot类似。主要的功能有:代码补全注释…

猫毛过敏养猫人士的必备养猫好物-宠物空气净化器品牌分享

许多猫奴在与猫相处一段时间后突然对猫毛过敏,这真是令人难受。一些人认为对猫咪过敏是因为它们在空气中飘浮的毛发引起的,但实际上大部分人之所以过敏是因为对猫身上一种微小的蛋白质过敏。这种导致过敏的蛋白质附着在猫咪的一些皮屑上。我们都知道猫咪…

Linux 下安装Jupyter

pip3 install jupyter pip3 install ipython -------------------------------------------- pip3 install jupyterlab jupyter lab pip3 list | grep jupyterlab 启动: python3 -m jupyter lab 2.安装朱皮特 pip3 install -i https://pypi.douban.com/simpl…

高性能的key-value数据库Redis 介绍

Redis 是一个高性能的key-value数据库。 Redis是一个开源的键值存储系统,通常用于缓存和消息传递。它支持多种类型的数据结构,如字符串、列表、集合、散列表和有序集合等。Redis的特点是提供了高性能、灵活性和可伸缩性。 Redis的主要特点包括&#xff…

Pytorch学习 day02(加载数据)

加载数据 * Dataset提供一种方式:来获取数据及其label,给数据进行编号 * Dataloader为神经网络提供不同的数据形式 Dataset的组织形式有很多种,例如: 将label放在文件夹名上,如下: #Dateset # --train #…

Python算法题集_组合总和

Python算法题集_组合总和 题39:组合总和1. 示例说明2. 题目解析- 题意分解- 优化思路- 测量工具 3. 代码展开1) 标准求解【值传递回溯】2) 改进版一【引用传递堆栈回溯】3) 改进版二【过程值列表缓存遍历后检索】 4. 最优算法5. 相关资源 本文为Python算法题集之一的…

.halo勒索病毒的最新威胁:如何恢复您的数据?

尊敬的读者: 随着科技的发展,网络安全已经成为我们日常生活中不可忽视的重要议题。其中,勒索病毒是当前网络安全威胁中的一大挑战,而“.halo”勒索病毒更是近期备受关注的恶意软件之一。本文将介绍关于“.halo”勒索病毒的背景知…