昇思25天学习打卡营第7天|模型训练

昇思25天学习打卡营第7天|模型训练

news/2025/7/16 2:41:29/文章来源:https://blog.csdn.net/main_h_/article/details/140084505

模型训练

模型训练一般分为四个步骤：

构建数据集。
定义神经网络模型。
定义超参、损失函数及优化器。
输入数据集进行训练与评估。

前面几天依次学习了前面几个步骤的操作，今天继续学习模型训练。

数据集和神经网络模型这个前面已经有详细的介绍。准确的解释请参考官方解释，这里只做个人学习理解记录
训练轮次（epoch）：这个根据训练的情况动态调整，次数少了准确率不够，次数过多了可能也浪费算力。
批次大小（batch size）：每个batch越大需要的算力越大，前面介绍的MNIST数据集用64，这里先沿用
学习率（learning rate）：这个有点类似PID调参，小了收敛慢，大了震荡。

训练时候，每跑一次epoch，都要评估一下准确率看看，以便决定是否还要继续训练。
训练结束后，在用数据去测试模型的效果怎么样。如果有提升继续训练，如果已经开始震荡或者基本没有提升，就可以停下来了，说明基本已经达到了模型的极限水平，想要继续有提升只能考虑其他的手段诸如更换其他更好的模型或者采用其他得优化器之类。

在这里插入图片描述
从下图可以看到，继续增加轮次，准确率基本不在增加。说明这个模型的准确率基本就是97.7%

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/863700.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

JVM（13）：虚拟机性能分析和故障解决工具之Visual VM

JVM（13）：虚拟机性能分析和故障解决工具之Visual VM

1 Visual VM作用是到目前为止随JDK发布的功能最强大的运行监视和故障处理程序，并且可以遇见在未来一段时间内都是官方主力发展的虚拟机故障处理工具。官方在VisualVM的软件说明中写上了“All-in-One”的描述字样，预示着他除了运行监视、故障处理外&…

阅读更多...

ConcurrentHashMap是如何保证线程安全的-put方法简要分析

ConcurrentHashMap是如何保证线程安全的-put方法简要分析

简介 ConcurrentHashMap 是 Java 中并发编程中常用的线程安全的哈希表（HashMap）实现。它具有以下几个显著的特点和优点，适合在特定的并发场景中使用： 线程安全性： ConcurrentHashMap 提供了并发访问的线程安全保证&am…

阅读更多...

左耳听风_032_31_编程范式游记2-_泛型编程

左耳听风_032_31_编程范式游记2-_泛型编程

你好，我是陈浩网名英，做耳朵house.在上一节课中呢，我们从c语言开始说起，聊了聊面向过程式的辩证范式。那相信从代码的角度呢，你对这种类型的语言啊已经有了一些理解。那作为一门高级语言呢，c语言啊它绝…

阅读更多...

python进阶函数

python进阶函数

目录函数多返回值函数多种传参方式匿名函数函数多返回值问：如果一个函数如些两个return（如下所示），程序如何执行？ def return_num():return 1return 2result return_num() print(result)答：只执行了第…

阅读更多...

Web3 前端攻击：原因、影响及经验教训

Web3 前端攻击：原因、影响及经验教训

DeFi的崛起引领了一个创新和金融自由的新时代。然而，这种快速增长也吸引了恶意行为者的注意，他们试图利用漏洞进行攻击。尽管很多焦点都集中在智能合约安全上，但前端攻击也正在成为一个重要的威胁向量。前端攻击的剖析理解攻击者利用前端漏…

阅读更多...

DDD学习笔记三

DDD学习笔记三

模型的构造块：实体、值对象、领域服务 （1）实体的领域特征在领域中，一个由身份而不是属性值定义的客观概念就是实体，这个身份可以由一个唯一标识确认。一个概念是否是实体取决于系统的应用场景，一个标识是…

阅读更多...

$ORA-00903: invalid table name\nORA-06512: at line 1\n$

ORA-00903: invalid table name\nORA-06512: at line 1\n

错误信息 ORA-00903: invalid table name\nORA-06512: at line 1\n原因 ORA-00903: invalid table name 解释: 这个错误表示在 SQL 语句中使用了无效的表名。由于在建表中出现了以数字开头的表名,所以出现以下错误解决方案表名不能以数字开头

阅读更多...

RabbitMQ交换器类型

RabbitMQ交换器类型

直连交换机（Direct Exchange） 直连交换机的工作方式是最简单的路由模式，它会根据消息的routing key将其精确地路由到与之绑定的队列上。每个队列通过一个特定的routing key与交换机绑定。如果一条消息的routing key与队列的绑定键完全匹配&am…

阅读更多...

AWT的菜单组件

AWT的菜单组件

AWT的菜单组件前言一、菜单组件的介绍常见的菜单相关组件常见菜单相关组件集成体系图菜单相关组件使用小要点二、AWT菜单组件的代码示例示例一示例二实现思路前言推荐一个网站给想要了解或者学习人工智能知识的读者，这个网站里内容讲解通俗易懂且风趣幽默&…

阅读更多...

【Python】Pickle：Python对象序列化与反序列化的利器

【Python】Pickle：Python对象序列化与反序列化的利器

在Python编程中，我们经常需要在程序的不同运行之间保存和加载数据，这时候，Python标准库中的pickle模块就派上了用场。pickle模块可以将Python对象序列化为字节流，便于存储到文件或通过网络传输；同时，它也可…

阅读更多...

CentOS 7 和 CentOS Stream 8 的主要区别

CentOS 7 和 CentOS Stream 8 的主要区别

更新频率： CentOS 7：传统的稳定版本，主要用于生产环境，更新频率较低，主要包含安全补丁和重要修复。CentOS Stream 8：滚动发布版本，更新更频繁，包含最新的特性和改进。它处于 Fedora …

阅读更多...

springboot汽车租赁管理系统-计算机毕业设计源码08754

springboot汽车租赁管理系统-计算机毕业设计源码08754

目录摘要第 1 章引言 1.1 选题背景和意义 1.2 国内外研究现状 1.3 论文结构安排第 2 章系统的需求分析 2.1 系统可行性分析 2.1.1 技术方面可行性分析 2.1.2 经济方面可行性分析 2.1.3 法律方面可行性分析 2.1.4 操作方面可行性分析 2.2 系统功能需求分析…

阅读更多...

基于线调频小波变换的非平稳信号分析方法（MATLAB）

基于线调频小波变换的非平稳信号分析方法（MATLAB）

信号处理领域学者为了改进小波变换在各时频区间能量聚集性不高的缺点，有学者在小波分析基础上引入调频算子构成了线性调频小波变换，线调频小波一方面继承了小波变换的理论完善性，另一方面用一个新的参数（线调频参数）刻…

阅读更多...

Nginx 配置文件

Nginx 配置文件

Nginx的配置文件的组成部分： 主配置文件：nginx.conf子配置文件：include conf.d/*.conf 全局配置 nginx 有多种模块核心模块：是 Nginx 服务器正常运行必不可少的模块，提供错误日志记录、配置文件解析、事件驱动机…

阅读更多...

46 - 删除重复的电子邮箱（高频 SQL 50 题基础版)

46 - 删除重复的电子邮箱（高频 SQL 50 题基础版)

46 - 删除重复的电子邮箱 delete p1 from Person p1,Person p2 where p1.emailp2.email and p1.id>p2.id;

阅读更多...

跟着DW学习大语言模型-使用Streamlit构建一个RAG应用

跟着DW学习大语言模型-使用Streamlit构建一个RAG应用

在大语言模型 (LLMs) 的应用中，我们面临众多挑战，包括领域知识的缺乏、信息的准确性问题以及生成的虚假内容。检索增强生成 (RAG) 通过引入外部知识库等额外信息源，为这些问题提供了有效的缓解策略。RAG 在那些需要不断更新知识的知识密集型场…

阅读更多...

ios13多窗口（UIWindowScene）学习笔记

ios13多窗口（UIWindowScene）学习笔记

ios13引入了UIWindowScene类、UIWindowSceneDelegate协议以便支持多窗口功能，但其适用于ipad，不适用于iphone，因为iphone不支持多窗口功能。注意，这里说的窗口不是UIWindow，而是UIWindowScene。 ios13前后的app的UI架…

阅读更多...

2024年【建筑电工(建筑特殊工种)】考试试题及建筑电工(建筑特殊工种)模拟考试题库

2024年【建筑电工(建筑特殊工种)】考试试题及建筑电工(建筑特殊工种)模拟考试题库

题库来源：安全生产模拟考试一点通公众号小程序 2024年【建筑电工(建筑特殊工种)】考试试题及建筑电工(建筑特殊工种)模拟考试题库，包含建筑电工(建筑特殊工种)考试试题答案和解析及建筑电工(建筑特殊工种)模拟考试题库练习。安全生产模拟考试一点通结合…

阅读更多...

2024年【广东省安全员A证第四批（主要负责人）】新版试题及广东省安全员A证第四批（主要负责人）考试试卷

2024年【广东省安全员A证第四批（主要负责人）】新版试题及广东省安全员A证第四批（主要负责人）考试试卷

题库来源：安全生产模拟考试一点通公众号小程序 2024年【广东省安全员A证第四批（主要负责人）】新版试题及广东省安全员A证第四批（主要负责人）考试试卷，包含广东省安全员A证第四批（主要负责人&am…

阅读更多...

Go线程实现模型-P

Go线程实现模型-P

P 概述 P是G能够在M中运行关键。Go的运行时系统会适时地让P与不同的M建立或断开关联，以使P中的那些可运行的G能够及时获得，这与操作系统内核在CPU之上实时切换不同进程或线程的情况类似改变P的数量改变单个Go程序间拥有的P的最大数量有两种方法调…

阅读更多...

最新文章