练习3-softmax分类(李沐函数简要解析)与d2l.train_ch3缺失的简单解决方式

环境为:练习1的环境
网址为:https://www.bilibili.com/video/BV1K64y1Q7wu/?spm_id_from=333.1007.top_right_bar_window_history.content.click

代码简要解析

导入模块
导入PyTorch
导入Torch中的nn模块
导入d2l中torch模块 并命名为d2l

import torch
from torch import nn
from d2l import torch as d2l

获取数据
从Fashion-MNIST中获取batch_size个数据 注意此处为28*28的像素图像 d2l.load_data_fashion_mnist(batch_size) 函数加载 Fashion-MNIST 数据集,并返回两个迭代器

batch_size=100
train_iter,test_iter=d2l.load_data_fashion_mnist(batch_size)

初始化模型和参数
Flatten()将输入为28*28的像素图像摊开成一组784长的数组 作为特征值 输入
nn.Linear() 为784输入 10输出的层
net.apply(init); 是将其中init函数作为所有可变参数的初始化方式 注意:m是层 既对每层m进行判断 符合条件对m的权重进行初始化
type(m) == nn.Linear 用于检查变量 m 是否属于 PyTorch 中的线性层(nn.Linear

net=nn.Sequential(nn.Flatten(),nn.Linear(784,10))
def init_weights(m):if type(m)==nn.Linear:nn.init.normal_(m.weight,std=0.01)net.apply(init_weights)

初始化损失函数 这里为交叉熵损失函数

loss=nn.CrossEntropyLoss(reduction='none')

设定梯度下降算法
torch.optim.SGD()

trainer=torch.optim.SGD(net.parameters(),lr=0.1)

训练
这里的d2l是李沐老师自己写的,想要运行成功,理论上需要把d2l下载下来
网址:https://github.com/d2l-ai/d2l-zh

num_epochs=10;
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)

我所学习到的

获得Fashion-MNIST的数据

train_iter,test_iter=d2l.load_data_fashion_mnist(batch_size)

对输入进行平铺处理 其本质是把每个像素点都当作特征值

nn.Flatten()

多层的权重初始化

net.apply(init_weights)

交叉熵损失函数

loss=nn.CrossEntropy()

d2l.train_ch3缺失的简单解决方式

1.到https://github.com/d2l-ai/d2l-zh,下载源码

在这里插入图片描述
2.将torch.py改名为util.py 然后放到同一目录下在这里插入图片描述

3.引用即可

import torch
from torch import nn
import util as d2l

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/731572.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Neo4j安装 Linux:CentOS、openEuler 适配langchain应用RAG+知识图谱开发 适配昇腾910B

目录 Neo4j下载上传至服务器后进行解压运行安装JAVA再次运行在windows端打开网页导入数据 Neo4j下载 进入Neo4j官网下载页面 向下滑动找到 Graph Database Self-Managed 选择 社区版(COMMUNITY) 选择 Linux / Mac Executable Neo4j 5.17.0 (tar) 单机下…

分销商城微信小程序:用户粘性增强,促进复购率提升

在数字化浪潮的推动下,微信小程序作为一种轻便、高效的移动应用形式,正成为越来越多企业开展电商业务的重要平台。而分销商城微信小程序的出现,更是为企业带来了前所未有的机遇。通过分销商城微信小程序,企业不仅能够拓宽销售渠道…

产品推荐 - 基于矽海达 SEM9363的无线数字图传编码开发板

Sihid SEM9363无线数字图传编码调制板(A版本)通过HDMI接口输入高清数字视频到Hi3516A处理器做H.264压缩编码,压缩后的视频信号通过FPGA实现COFDM信道调制,再经AD936x转换为模拟信号调制发射出去。 SEM9363板功能与技术规格 通过Micro HDMI接口输入数字视…

生活的色彩--爱摸鱼的美工(17)

题记 生活不如意事十之八九, 恶人成佛只需放下屠刀,善人想要成佛却要经理九九八十一难。而且历经磨难成佛的几率也很小,因为名额有限。 天地不仁以万物为刍狗! 小美工记录生活,记录绘画演变过程的一天。 厨房 食…

AI探索实践12 - Typescript开发AI应用4:大模型响应数据的格式化输出

大家好,我是feng,感谢你阅读我的博文,如果你也关注AI应用开发,欢迎关注公众号和我一起​探索。如果文章对你有所启发,请为我点赞! 一、重点回顾 在介绍本文之前的文章中,我们先来回顾一下使用L…

Google OAuth2.0获取授权信息返回的id_token如何解析

背景 我们在做google登录的时候,第一步先要获取授权码code,在得到code之后会根据code拿到授权的token信息,token信息中包含:access_token,refresh_token,scope,token_type,expires_…

两天学会微服务网关Gateway-Gateway过滤器

锋哥原创的微服务网关Gateway视频教程: Gateway微服务网关视频教程(无废话版)_哔哩哔哩_bilibiliGateway微服务网关视频教程(无废话版)共计17条视频,包括:1_Gateway简介、2_Gateway工作原理、3…

前端React篇之React中什么是受控组件和非控组件?

目录 React中什么是受控组件和非控组件?受控组件非受控组件 React中什么是受控组件和非控组件? 在React中,受控组件和非受控组件是两种表单元素的状态管理方式。 受控组件 受控组件(Controlled Component)是指其值由…

探秘Solr:解密搜索引擎背后的原理与应用(一)

本系列文章简介: 在本系列文章中,我们将从Solr的基本概念开始,解释索引和搜索是如何工作的,深入探讨倒排索引、分词器和搜索算法等关键概念。接着,我们将了解Solr的工作原理,从数据导入和索引构建到搜索流程…

数据结构 - 栈和队列

本篇博客将介绍栈和队列的定义以及实现。 1.栈的定义 栈是一种特殊的线性表,只允许在固定的一端进行插入和删除数据,插入数据的一端叫做栈顶,另一端叫做栈底。栈中的数据遵守后进先出的原则 LIFO (Last In First Out)。 插入数据的操作称为压…

如何借助私域营销在医美行业中脱颖而出?

在现今这个以貌取人的社会,外貌焦虑已变得司空见惯。美丽往往能给人带来更多的瞩目和机遇,但天生丽质并非人人可得。随着经济的繁荣和消费结构的升级,颜值经济开始崭露头角,医美行业因此受到了广大消费者的青睐,迎来了…

Leetcode 剑指 Offer II 068.搜索插入位置

题目难度: 简单 原题链接 今天继续更新 Leetcode 的剑指 Offer(专项突击版)系列, 大家在公众号 算法精选 里回复 剑指offer2 就能看到该系列当前连载的所有文章了, 记得关注哦~ 题目描述 给定一个排序的整数数组 nums 和一个整数目标值 target &#xf…

阿波罗登月需要解决飞行控制问题,数学家卡尔曼在维纳控制的基础上提出了卡尔曼滤波

说到登月,很多人只想到和火箭以及航天器相关的技术,其实登月离不开信息技术的革命。因为从飞行控制到远程通信,都需要解决很多过去从未遇到过的难题。 登月首先要保证在月球上着陆的地点准确,而且要保证返回火箭和飞船能够在月球轨…

【LeetCode: 211. 添加与搜索单词 - 数据结构设计 + 前缀树】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

npm install没有创建node_modules文件夹

问题记录 live-server 使用时 报错:live-server : 无法将“live-server”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。 npm install 安装 但是 这时npm install没有创建node_modules文件夹,只生成package-lock.json文件 方法一: 手…

CEF c++调用JS,并获得JS返回值的 流程

相关章节: CEF JS与c++能够交互的原理 以及 JS 调用C++的流程分析 CEF 之 Render进程 与 Browser进程通信 目录

【笔试48天强训】day05

统计回文1 “回文串”是一个正读和反读都一样的字符串,比如“level”或者“noon”等等就是回文串。花花非常喜欢这种拥有对称美的回文串,生日的时候她得到两个礼物分别是字符串A和字符串B。现在她非常好奇有没有办法将字符串B插入字符串A使产生的字符串…

通过Electron打包前端项目为exe

🧑‍🎓 个人主页:爱蹦跶的大A阿 🔥当前正在更新专栏:《JavaScript保姆级教程》、《VUE》、《Krpano》 ✨ 正文 1、 拉取electron官网上的demo,拉下来之后安装依赖,项目跑起来之后,就…

第十篇 - 如何利用人工智能技术做好营销流量整形管理?(Traffic Shaping)- 我为什么要翻译介绍美国人工智能科技巨头IAB公司

IAB平台,使命和功能 IAB成立于1996年,总部位于纽约市​​​​​​​。 作为美国的人工智能科技巨头社会媒体和营销专业平台公司,互动广告局(IAB- the Interactive Advertising Bureau)自1996年成立以来,先…

上海计算机学会竞赛平台2024.1月月赛丙组T1 成绩等第题解

题目描述 给定一个在到之间的整数 ,请将它转成等第,规则如下: 为 A为 B为 C为 D为 F 输入格式 单个数字表示 输出格式 单个字符表示答案 数据范围 样例数据 输入: 93 输出: A 输入: 44 输出: F