《昇思 25 天学习打卡营第 4 天 | 数据集 Dataset 》

《昇思 25 天学习打卡营第 4 天 | 数据集 Dataset 》

活动地址:https://xihe.mindspore.cn/events/mindspore-training-camp
签名:Sam9029


数据集

数据是深度学习的基础,可以理解在 深度学习模型 中,数据就是模型训练的基础条件

  • MindSpore提供基于Pipeline的数据引擎,通过数据集(Dataset)和数据变换(Transforms)实现高效的数据预处理。

基于Pipeline(管道)的数据引擎是一种数据处理架构,它通过一系列有序的数据处理步骤来处理数据流。

数据集加载

  • 同时 MindSpore的领域开发库也提供了大量的预加载数据集,可以使用API一键下载使用

mindspore.dataset提供的接口仅支持解压后的数据文件,因此我们使用download库下载数据集并解压。


from download import download
​
url = "https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/" \"notebook/datasets/MNIST_Data.zip"
path = download(url, "./", kind="zip", replace=True)

数据集迭代

数据集加载后,一般以迭代方式获取数据,然后送入神经网络中进行训练

默认为上一张 提到的 张量 Tensor 数据类型, 若设置output_numpy=True,访问的数据类型为Numpy

数据集常用操作

  • shuffle : 消除数据排列造成的分布不均问题
  • map :对数据集指定列(column)添加数据变换(Transforms),将数据变换应用于该列数据的每个元素,并返回包含变换后元素的新数据集。
  • batch 将数据集打包为固定大小的batch是在有限硬件资源下使用梯度下降进行模型优化的折中方法,可以保证梯度下降的随机性和优化计算量

自定义数据集

mindspore.dataset模块提供了一些常用的公开数据集和标准格式数据集的加载API

  • 可随机访问数据集
  • 可迭代数据集
  • 生成器

结合上一张了解的 张量 Tensor 数据类型,原来在数据集中表现

深度学习 就是基于 数据数据的处理,数据集就是一类型的数据,不同深度学习模型的方向有对应的数据集

mindscope AI训练框架 提供了大量的预加载数据集,可以使用API一键下载使用,非常方便;

千里之行,始于足下!

我会继续一步一步的保持学习,在 昇思社区 进行 AI 技术方面的探索和学习

希望能给同样对 AI 充满热情的你一些启发。记住,技术的世界无限广阔,让我们一起勇敢地迈出探索的脚步吧!🚀🤖

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/34524.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【杂记-浅谈FTP文件传输协议】

FTP文件传输协议 一、FTP协议概述二、FTP的安全隐患三、FTP服务器配置问题四、FTP的安全加固方法 一、FTP协议概述 FTP,File Transfer Protocol,即文件传输协议,是一种用于在网络上进行文件传输的标准协议,它允许用户在客户端和服…

【脚本工具库】图像位深转换-24-8(附源码)

图像位深简介: 在图像处理领域,图像位深的转换是一个非常重要的概念。不同的图像模式有着不同的用途和特点,下面我们详细介绍几种常见的图像模式及其转换方法。 首先,我们来看1位像素的二值图像(1bit)&…

HarmonyOS角落里的知识:“开发应用沉浸式效果”

概述 典型应用全屏窗口UI元素包括状态栏、应用界面和底部导航条。开发应用沉浸式效果主要指通过调整状态栏、应用界面和导航条的显示效果来减少状态栏导航条等系统界面的突兀感,从而使用户获得最佳的UI体验。 图1 界面元素示意图 开发应用沉浸式效果主要要考虑如下…

8.XSS盲打

XSS盲打 XSS盲打就是攻击者在前端提交的数据不知道后台是否存在xss漏洞的情况下,提交恶意JS代码在类似留言板等输入框后,所展现的后台位置的情况下,网站采用了攻击者插入的恶意代码,当后台管理员在操作时就会触发插入的恶意代码&…

BroadcastChannel 通讯原理

BroadcastChannel 是一种用于在同一来源(同一协议、主机名和端口号)下不同浏览器上下文(如标签页、iframe、Worker、Service Worker)之间进行消息广播的 API。它提供了一种简便、可靠的方法来实现跨上下文的实时通讯。 Broadcast…

24.面向对象编程特性

目录 一、面向对象语言特征1.1 对象包含数据和行为1.2 封装1.3 继承作为类型系统与代码共享 二、使用trait对象存储不同类型的值2.1 定义共有行为的trait2.2 实现trait2.3 trait对象执行动态派发2.4 trait对象必须保证对象安全 三、面向对象设计模式四、状态模式的权衡取舍五、…

python的 pyside2 安装

pip install pyside2 pip install pyqt5-tools pycharm 在pychar 的Main Menu--setings--tool--External-tools 点击 新增自定义工具 1)自定义 QtDesigner 目的:用于生成.ui文件Name :QtDesigner Group :Qt Program &a…

交通 | 机器学习 + 大规模TSP/VRP求解

封面图来源:https://xkcd.com/399/ 推文作者:丁建辉,陈泰劼,张云天 本文针对旅行商问题(Travelling salesman problem, TSP)和车辆路径规划问题(Vehicle routing problem, VRP)这一类…

Python基础技能

目录 1. 掌握基础技能2. 变量与数据类型3. 条件语句4. 循环结构for循环while循环 5. 函数定义6. 列表与元组列表元组 1. 掌握基础技能 2. 变量与数据类型 在Python中,变量是用来存储数据的容器。我们可以给变量赋值,并使用这些值进行计算或操作。Pytho…

Excel 宏录制与VBA编程 —— 12、文本字符串类型相关(附示例)

字符串分割,文末示例(文末代码3附有源码) 代码1 - 基础字符串 代码2 - 字符串拆分 代码3 - 字符串分割 Option ExplicitSub WorkbooksClear()Dim DataRange As RangeSet DataRange Range("C2:E12")DataRange.Clear End SubSub Wo…

分布式系统_负载均衡

概述 大型网站都要面对庞大的用户量,高并发,海量数据等挑战。 为了提升系统整体的性能,可以采用垂直扩展和水平扩展两种方式。 垂直扩展:从单机角度扩展,增加单机硬件(CPU、内存、磁盘)处理能…

Vue进阶之Vue无代码可视化项目(五)

Vue无代码可视化项目 编排引擎smooth-dndLeftPanel.vueLayoutView.vuestores/debug.tsstores/editor.tsAppNavigator.vue添加-左侧栏添加到中间部分LayoutView.vuestore/editor.tsLeftPanel.vue移动-中间部分区域的位置更改新建文件夹utils、文件array.tsarray.tsLayoutView.vu…

基于rouyi框架的多租户改造

基于rouyi框架的多租户改造,重点是实现权限管理和数据隔离。权限管理相当于从原来的“顶级管理员admin-普通用户user”转变为“顶级管理员admin-租户管理员tanantAdmin-普通用户user”。数据隔离主要通过分库、分表、表内设置tenantId字段进行过滤三种方式。 本文主…

[word] word 如何在文档中进行分栏排版? #媒体#其他#媒体

word 如何在文档中进行分栏排版? 目标效果 将唐代诗人李白的组诗作品《清平调词》进行分栏排版,共分三栏,每一首诗作为一栏,参考效果如下图。

计算机图形学入门16:阴影映射

1.前言 前面几篇关于光栅化的文章中介绍了如何计算物体表面的光照,但是着色并不会进行阴影的计算,阴影需要单独进行处理,目前最常用的阴影计算技术之一就是Shadow Mapping技术,也就是俗称的阴影映射技术。 2.阴影映射 Shadow Map…

CSS中实现元素水平垂直居中的方式有哪些

在CSS中实现元素水平垂直居中的方法有很多,以下是一些常见的方法: 1. 使用Flexbox Flexbox是一个现代的布局模型,可以轻松实现元素的水平垂直居中。 .container {display: flex;justify-content: center; /* 水平居中 */align-items: cent…

C++在VS2022开发Windows窗口程序2:API式的Windows窗口程序设计模式

函数API式的Windows GUI程序设计模式是一种基于Windows API函数的方式来设计和开发Windows图形用户界面(GUI)应用程序的模式。在这种模式下,开发者通过调用Windows API函数来创建窗口、处理消息、绘制图形等,而不依赖于特定的GUI库…

mass storage:RAID Structure , Error Detection and Correction

RAID Structure RAID – redundant array of inexpensive disks multiple disk drives provides reliability via redundancyIncreases the mean time to failureMean time to repair – exposure time when another failure could cause data lossMean time to data loss bas…

【TB作品】stm32单片机,红外遥控器,温控风扇,模拟空调,PWM风扇

空调机 硬件:stm32、oled显示器、ds18b20温度传感器、风扇驱动和风扇、红外接收器、遥控器 软件功能: (1)显示室内温度 (2)显示当前模式:常态、除湿、通风 (3)显示当前风…

Ubuntu Apache2 搭建Gerrit 环境

一、前言 时隔多年,好久没有更新CSDN 博客了,主要原因有如下两点: 1、平时工作繁忙,无暇更新。 2、工作内容涉及信息安全,一些工作经验积累不便更新到互联网上。 最近一直在折腾搭建Gerrit 环境,最开始…