PyTorch深度学习快速入门(上)

PyTorch深度学习快速入门(上)

  • 一、前言
    • (一)PyTorch环境配置
    • (二)Python编译器的选择
    • (三)Python学习中的两大法宝函数
  • 二、如何加载数据
    • (一)Dataset与Dataloader的作用
    • (二)Dataset的常见组成形式与实战
    • (三)Dataloader的组成形式与实战
  • 三、TensorBoard
    • (一)TensorBoard的作用
    • (二)TensorBoard的安装&打开事件文件的指令
      • (1)TensorBoard 的安装
      • (2)如何用 tensorboard 打开事件文件
      • (3)两个运行时常见报错
    • (三)add_scalar( ) 的使用 — 常用来绘制 train/val loss
    • (四)add_image( ) 的使用 — 常用来观察训练结果
  • 四、torchvision中的transforms
    • (一)transforms的作用与使用技巧
    • (二)transforms的使用
    • (三)transforms中常见类的使用
    • (四)与torchvision中的datasets联合使用

一、前言

(一)PyTorch环境配置

CPU下的环境配置问题,在之前的博客中已经详细介绍(链接放在下方自取),这里不再阐述
Windows下Pytorch入门深度学习环境安装与配置(CPU版本)

(二)Python编译器的选择

(1)PyCharm
在这里插入图片描述
(2)Jupyter(衍生自ipython:可交互)
默认只安装在base环境中

  • 要想在我们创建的虚拟环境中安装,需要在虚拟环境的命令行中输入以下指令:
conda install nb_conda
  • 想使用本地已下载好的包进行安装的指令:
conda install --use-local 包名
  • 想要启动 jupyter,只需要在虚拟环境的命令行中输入以下指令:
jupyter notebook

验证可以使用 Pytorch 环境
在这里插入图片描述
在这里插入图片描述

关于Jupyter更详细的使用教程(优点、如何创建在指定目录底下、常用快捷键),可查看下面这篇博客:快速入门Jupyter notebook

(三)Python学习中的两大法宝函数

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述


二、如何加载数据

(一)Dataset与Dataloader的作用

在这里插入图片描述

(二)Dataset的常见组成形式与实战

  • Dataset 的三种组织形式
    在这里插入图片描述

  • Dataset 的官方解读
    在这里插入图片描述

  • 实战

在这里插入图片描述
在这里插入图片描述

from torch.utils.data import Dataset
from PIL import Image
import osclass MyData(Dataset): #MyData继承Datasetdef __init__(self, root_dir, label_dir):  #要获取文件夹下的所有图片  也要获取图片上一级的名称#获取文件夹的地址self.root_dir = root_dirself.label_dir = label_dirself.path = os.path.join(self.root_dir,self.label_dir)#将文件夹里数据(所有照片的路径地址)以列表的形式存储再列表里self.img_path_list = os.listdir(self.path)#获取其中每一个图片def __getitem__(self, idx):img_name = self.img_path_list[idx]img_item_path = os.path.join(self.root_dir,self.label_dir,img_name)img = Image.open(img_item_path)label = self.label_dirreturn img,label  #训练的时候需要图像和标签def __len__(self):return len(self.img_path_list)root_dir = "dataset/train"
ants_label_dir = "ants"
bees_label_dir = "bees"
ants_dataset = MyData(root_dir,ants_label_dir)
bees_dataset = MyData(root_dir,bees_label_dir)train_dataset = ants_dataset + bees_dataset

另:改造成更常见的标注方法
在这里插入图片描述

(三)Dataloader的组成形式与实战

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWritertest_data = torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor())test_loader = DataLoader(dataset=test_data,batch_size=64,shuffle=True,num_workers=0,drop_last=True)img,target = test_data[0]
print(img.shape)
print(target)writer = SummaryWriter("dataloader")
step = 0
for epoch in range(2):for data in test_loader: # test_loader是一个迭代对象,data可以拿到test_loader中的每一个元素imgs,targets = data  # batch_size=64,这里一次拿64个(默认随机抓取)# print(imgs.shape)# print(targets)writer.add_images(f"Epoch:{epoch}",imgs,step) # 注意add_images要加sstep = step + 1writer.close()

在这里插入图片描述


三、TensorBoard

(一)TensorBoard的作用

在这里插入图片描述

(二)TensorBoard的安装&打开事件文件的指令

(1)TensorBoard 的安装

在命令行中输入以下指令

pip install tensorboard -i https://pypi.tuna.tsinghua.edu.cn/simple

(2)如何用 tensorboard 打开事件文件

tensorboard --logdir=事件文件所在文件夹名

在这里插入图片描述
有的时候,一台服务器上好几个人训练,大家都指向一个端口,很麻烦,就可以用下面的代码指定端口,防止和别人冲突

tensorboard --logdir=事件文件所在文件夹名 --port=端口号(eg.6007、6008……) 

(3)两个运行时常见报错

训练时调取tensorboard报错:TypeError: MessageToJson() got an unexpected keyword argument including。并且没有显示图像。

这是由于tensorboard版本过高导致。只需要将tensorboard版本降低即可,降低至2.12.0便可以正常使用。

pip install tensorboard==2.12.0

这个时候运行,往往又会出现第二个报错:ValueError:Duplicate plugins for name projector

这是由于改版本后,之前版本的 tensorboard 没有删除,被保留下来了,多个 tensorboard 冲突。只需要在此虚拟环境的文件夹中,找到 tensorboard–x.x.xdist-info 文件(在虚拟环境->Lib->site-packages中),把它删除即可解决

(三)add_scalar( ) 的使用 — 常用来绘制 train/val loss

按 Ctr+ 鼠标移至函数处点击,即可查看函数的源代码

  • SummaryWriter( ) 的解读
    在这里插入图片描述
    在这里插入图片描述
  • add_scalar( ) 的解读
    在这里插入图片描述
  • 全代码
from torch.utils.tensorboard import SummaryWriter # 按 ctr+鼠标移至函数处,有提示writer = SummaryWriter("logs")# y = 2x
for i in range(100):writer.add_scalar("y=2x",2*i,i) # 添加标量writer.close()

在这里插入图片描述

在这里插入图片描述

:如果两次运行用同一个 tag,可能会导致生成下图中所示的图
在这里插入图片描述
解释:新的事件记入到了上一个事件当中,系统会自动做一个拟合
解决方法:一种解决方法就是把对应的logs下文件都删掉,在重新运行,还有一种更好的解决方法是创建新的文件

(四)add_image( ) 的使用 — 常用来观察训练结果

在这里插入图片描述

  • add_image( ) 的解读
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • 如果想用openCV,需下载,在命令行中输入以下指令:
pip install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple
  • 全代码
from torch.utils.tensorboard import SummaryWriter 
import numpy as np
from PIL import Imagewriter = SummaryWriter("logs")
image_path = "data/train/ants_image/0013035.jpg"
img_PIL = Image.open(image_path)
img_array = np.array(img_PIL)print(img_array.shape)  # 看一下 img 的格式,是(512, 768, 3),HWC格式,也可以直接通过控制台查看
writer.add_image("test",img_array,1,dataformats='HWC') writer.close()

在这里插入图片描述


四、torchvision中的transforms

(一)transforms的作用与使用技巧

(1)作用
transforms提供了一系列的工具,使得数据可以在加载到模型之前被适当地转换和标准化
在这里插入图片描述
(2)使用方法

1. 关注输入和输出

不知道返回值的类型时,用以下方法查看
法一: print ( type( … ) )
法二:print ( ) + 打断点 debug

2. 多看官方文档,关注方法需要什么参数

重点关注 Args:、__ init __( ) : 部分

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

(二)transforms的使用

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms  # transforms:工具箱img_path = "data/train/ants_image/0013035.jpg"
img = Image.open(img_path)
print(img) # PILwriter = SummaryWriter("logs")# 1、transforms(工具箱)改如何被使用?
# 通过工具的模板创建具体的工具 tool = transforms.ToTensor()  # ToTensor():蓝图、模具 (实例化)
tensor_trans = transforms.ToTensor()
# result = tool(input)  (直接调用__call__方法)
tensor_img = tensor_trans(img)   # 光标在()中,按ctrl+P:显示需要什么参数
# print(tensor_img)# 2、为什么需要 Tensor 数据类型? -->  Tensor包装了神经网络所需理论基础的参数
writer.add_image("Tensor_img",tensor_img)writer.close()

在这里插入图片描述

(三)transforms中常见类的使用

在这里插入图片描述

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms# 将条目直接写入 log_dir 中的事件文件以供 TensorBoard 使用
writer = SummaryWriter("logs")
img = Image.open("images/C.png")
print(img)# ToTensor的使用
trans_totensor = transforms.ToTensor()
img_tensor = trans_totensor(img)
writer.add_image("ToTensor",img_tensor)# Normalize(归一化) --> 先归一化,再标准化  eg.input∈[0,1] => output∈[-1,1]
# output[channel] = (input[channel] - mean[channel]) / std[channel]
print(img_tensor[0][0][0])
trans_norm = transforms.Normalize([0.5, 0.5, 0.5, 0.5],[0.5, 0.5, 0.5, 0.5])
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("Normalize",img_norm,0)# Resize
print(img.size)
trans_resize = transforms.Resize((510,512)) #设置新尺寸大小的数值是一个整体,要在一个括号里写
img_resize = trans_resize(img)
img_resize = trans_totensor(img_resize) # 想要在tensorboard中显示,要变成tensor类型
writer.add_image("Resize",img_resize,0)# Compose 相当于一个合并功能,按照写的列表去执行流程,前一个的输出是后一个的输入(类型要匹配)
trans_resize_2 = transforms.Resize(512) # 最短边输出像素的数量,长边按等比缩放
trans_compose = transforms.Compose([trans_resize_2,trans_totensor]) #参数需要是一个列表
img_resize2 = trans_compose(img)
writer.add_image("Resize",img_resize2,1)# RandomCrop 随机裁剪
trans_random = transforms.RandomCrop((500,200)) # 只给一个参数,就会裁剪成正方形
trans_compose_2 = transforms.Compose([trans_random,trans_totensor])
for i in range(10):img_crop = trans_compose_2(img)writer.add_image("RandomCropHW",img_crop,i)writer.close()

在这里插入图片描述
在这里插入图片描述

(四)与torchvision中的datasets联合使用

在这里插入图片描述
在这里插入图片描述

(1)图片原本是 PIL 数据类型
在这里插入图片描述

import torchvisiontrain_set = torchvision.datasets.CIFAR10(root="./dataset",train=True,download=True)
test_set = torchvision.datasets.CIFAR10(root="./dataset",train=False,download=True)
print(test_set[0])
print(test_set.classes)img,target = test_set[0]
print(img)
print(target)
print(test_set.classes[target])
img.show()

(2)如何跟 transforms 联合使用?
转变成 tensor 数据类型了,就可以用 tensorboard 显示
在这里插入图片描述
在这里插入图片描述

import torchvision
from torch.utils.tensorboard import SummaryWriterdataset_transform = torchvision.transforms.Compose([torchvision.transforms.ToTensor()
])
train_set = torchvision.datasets.CIFAR10(root="./dataset",train=True,transform=dataset_transform,download=True) # ./表示当前目录
test_set = torchvision.datasets.CIFAR10(root="./dataset",train=False,transform=dataset_transform,download=True)writer = SummaryWriter("logs")
for i in range(10):img,target = test_set[i]writer.add_image("test_set",img,i)writer.close() # 一定要关闭,否则显示不出来图片

(3)常见问题以解决方法

  1. 下载数据集很慢怎么办?

新建一个名为 dataset 的文件夹在当前目录,把用迅雷下载(拷贝下载链接复制到迅雷里面)的数据(.gz就行,程序会给你解压)集拷贝到 dataset 的文件底下

  1. 下载链接如何获取?
  • 法一:运行后的窗口
  • 法二:按 Ctrl 看源代码,找 url 链接

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/876690.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

轻松学EntityFramework Core--模型创建

一、使用代码优先(Code-First)创建模型 Code-First 方法是 EF Core 提供的一种用于定义模型的方式,它允许开发人员通过编写 C# 类来定义数据库模式,再通过迁移命令生成数据库表。下面我们来一起看一下代码优先如何使用。 1.1、创…

lua 游戏架构 之 游戏 AI (六)ai_auto_skill

定义一个为ai_auto_skill的类,继承自ai_base类。ai_auto_skill类的目的是在AI自动战斗模式下,根据配置和条件自动选择并使用技能。 lua 游戏架构 之 游戏 AI (一)ai_base-CSDN博客文章浏览阅读379次。定义了一套接口和属性&#…

【原创】使用keepalived虚拟IP(VIP)实现MySQL的高可用故障转移

1. 背景 A、B服务器均部署有MySQL数据库,且互为主主。此处为A、B服务器部署MySQL数据库实现高可用的部署,当其中一台MySQL宕机后,VIP可自动切换至另一台MySQL提供服务,实现故障的自动迁移,实现高可用的目的。具体流程…

快速安装torch-gpu和Tensorflow-gpu(自用,Ubuntu)

要更详细的教程可以参考Tensorflow PyTorch 安装(CPU GPU 版本),这里是有基础之后的快速安装。 一、Pytorch 安装 conda create -n torch_env python3.10.13 conda activate torch_env conda install cudatoolkit11.8 -c nvidia pip ins…

mstc远程连接不锁屏

连接不锁屏 方法一 方法二 win10 解决多用户同时远程连接教程(超详细图文)_win10多用户登录-CSDN博客 win7软件 logout.bat for /f "skip1 tokens3" %%s in (query user %USERNAME%) do (%windir%\System32\tscon.exe %%s /dest:console) …

Datawhale AI 夏令营——AI+逻辑推理——Task1

# Datawhale AI 夏令营 夏令营手册:从零入门 AI 逻辑推理 比赛:第二届世界科学智能大赛逻辑推理赛道:复杂推理能力评估 代码运行平台:魔搭社区 比赛任务 本次比赛提供基于自然语言的逻辑推理问题,涉及多样的场景&…

React Native 与 Flutter:你的应用该如何选择?

Flutter 和 React Native 都被认为是混合应用程序开发中的热门技术。然而,当谈到为你的项目使用框架时,你必须考虑哪一个是最好的:Flutter 还是 React Native? 本篇文章包含 Flutter 和 React Native 在各个方面的差异。因此&…

正则表达式与文本处理

目录 一、正则表达式 1、正则表达式定义 1.1正则表达式的概念及作用 1.2、正则表达式的工具 1.3、正则表达式的组成 2、基础正则表达式 3、扩展正则表达式 4、元字符操作 4.1、查找特定字符 4.2、利用中括号“[]”来查找集合字符 4.3、查找行首“^”与行尾字符“$”…

Lesson 52 What nationality are they? Where do they come from?

Lesson 52 What nationality are they? Where do they come from? 词汇部分 the U.S. 美国 全称:The United States of America    美利坚合众国 其他称呼:the States      the U.S.A.      Uncle Sam Brazil n. 巴西 Brazilian a. 巴…

LeetCode算法——滑动窗口矩阵篇

1、长度最小的子数组 题目描述&#xff1a; 解法&#xff1a; 设一个 for 循环来改变指向窗口末尾的指针&#xff0c;再不断抛弃当前窗口内的首元素 最终确定满足条件的最小长度 class Solution { public:int minSubArrayLen(int target, vector<int>& nums) {int …

duilib中设置窗口透明度的接口CPaintManagerUI::SetTransparent有问题导致使用duilib窗口实现异形窗口无效的排查

目录 1、duilib框架中设置窗口透明度的代码说明 2、UpdateLayeredWindow调用失败,发现添加的WS_EX_LAYERED风格被删除了 3、窗口有WS_EX_LAYERED风格了,但UpdateLayeredWindow调用依旧失败 4、如何知道SetLayeredWindowAttributes函数调用之后再调用UpdateLayeredWindow…

苹果电脑暂存盘已满怎么清理 Mac系统如何清理磁盘空间 清理MacBook

Mac电脑用户在长时间使用电脑之后&#xff0c;时常会看到“暂存盘已满”的提示&#xff0c;这无疑会给后续的电脑使用带来烦恼&#xff0c;那么苹果电脑暂存盘已满怎么清理呢&#xff0c;下面将给大家带来一些干货帮你更好地解决这个问题。 首先我们要搞明白为什么暂存盘会满&…

c++ 智能指针shared_ptr与make_shared

shared_ptr是C11引入的一种智能指针&#xff0c;‌它允许多个shared_ptr实例共享同一个对象&#xff0c;‌通过引用计数来管理对象的生命周期。‌当最后一个持有对象的shared_ptr被销毁时&#xff0c;‌它会自动删除所指向的对象。‌这种智能指针主要用于解决资源管理问题&…

【运维自动化-配置平台】模型及模型关联最小化实践

蓝鲸智云配置平台&#xff0c;以下简称配置平台 我们知道主机是配置平台最常见的管控资源对象&#xff0c;在业务拓扑里可以通过划分模块来清晰的可视化管理&#xff1b;那其他资源如何通过配置平台来纳管呢&#xff0c;比如网络设备交换机。场景需求&#xff1a;如何把交换机…

【前端 10】初探BOM

初探BOM&#xff1a;浏览器对象模型 在JavaScript的广阔世界中&#xff0c;BOM&#xff08;Browser Object Model&#xff0c;浏览器对象模型&#xff09;扮演着举足轻重的角色。它为我们提供了一套操作浏览器窗口及其组成部分的接口&#xff0c;让我们能够通过编写JavaScript…

QT--线程

一、线程QThread QThread 类提供不依赖平台的管理线程的方法&#xff0c;如果要设计多线程程序&#xff0c;一般是从 QThread继承定义一个线程类&#xff0c;在自定义线程类里进行任务处理。qt拥有一个GUI线程,该线程阻塞式监控窗体,来自任何用户的操作都会被gui捕获到,并处理…

【PyQt5】一文向您详细介绍 setPlaceholderText() 的作用

【PyQt5】一文向您详细介绍 setPlaceholderText() 的作用 下滑即可查看博客内容 &#x1f308; 欢迎莅临我的个人主页 &#x1f448;这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地&#xff01;&#x1f387; &#x1f393; 博主简介&#xff1a;985高校的普通…

脑网络布线成本优化——从Caja守恒原则到最小化成本的探索

脑网络布线成本优化——从Caja守恒原则到最小化成本的探索 Caja守恒原则的核心作用 Caja守恒原则&#xff0c;即大脑组织的布线成本最小化原则&#xff0c;是神经科学中的一个重要概念。它指出&#xff0c;大脑在组织结构上倾向于最小化连接神经元以构成环路或网络所涉及的布…

【MySQL】记录MySQL加载数据(LOAD DATA)

MySQL LOAD DATA 一、背景二、模拟生成用户信息三、加载到mysql表3.1、建表语句3.2 加载数据3.3、查看结果 一、背景 现在有个需求是将用户信息存入student.data文件中&#xff0c;在现在load到数据库中 二、模拟生成用户信息 假设用户信息&#xff0c;包含姓名&#xff0c;…