深度学习记录--Train/dev/test sets

深度学习记录--Train/dev/test sets

news/2025/4/27 5:55:21/文章来源:https://blog.csdn.net/Xudong_12345/article/details/135612177

为什么需要训练集、验证集(简单交叉验证集)和测试集？

为了创建高效的神经网络，需要不断进行训练(迭代)

一个神经网络的产生

从最开始的想法idea开始，然后付诸于代码code，根据结果验证反过来对一开始的想法idea进行修正，而这就完成了一次训练(迭代)

循环速率(迭代速率)

train/dev/test sets会加速神经网络的集成

数据的配置

一般将数据分为三个部分(train/dev/test sets)

在训练集和验证集之后得到匹配的神经网络，然后利用测试集来对当前神经网络进行评估

分配的演变

小数据时代：

70% train sets 30% test sets

60% train sets 20% dev sets 20% test sets

大数据时代：

绝大部分为train sets，极小部分为dev sets和test sets

对于百万量级的数据，可以分为98% train sets 1% dev sets 1% test sets

对于超百万量级的数据，可以分为99.5% train sets 0.25% dev sets 0.25% test sets

原因：

由于大数据量的存在，dev sets只需要对不同的算法进行验证与取舍即可，故得出几种合适的算法来优化性能即可，而test sets只需要对神经网络进行无偏评估即可，所以数据量不需要很大

补充：

一条法则：

dev和test sets最好来自同一分布(same distribution)，这样可以加快速率与优化性能

test sets不是必须的

如果不需要进行无偏评估，那么只用保证train/dev sets(训练验证集)即可

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/625425.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

一、引言（DataWhale大模型理论基础）

一、引言（DataWhale大模型理论基础）

引言一、什么是语言模型语言模型（LM：language model） 定义：一种对令牌序列(token)的概率分布说明： 假设我们有一个令牌集的词汇表 V 。语言模型p为每个令牌序列 x1, …,xL ∈ V 分配一个概率（介于0和…

阅读更多...

腾讯云服务器怎么买？两种购买方式更省钱

腾讯云服务器怎么买？两种购买方式更省钱

腾讯云服务器购买流程很简单，有两种购买方式，直接在官方活动上购买比较划算，在云服务器CVM或轻量应用服务器页面自定义购买价格比较贵，但是自定义购买云服务器CPU内存带宽配置选择范围广，活动上购买只能选择固定的活动…

阅读更多...

深度系统QT 环境搭建

深度系统QT 环境搭建

1.QT安装不折腾最新版直接去商店搜索QT安装。 2.修改su密码，安装需要权限打开一个终端，然后输入下面的命令：按照提示输入密码按回车就行。 sudo passwd 回车后会出现让你输入现在这个账户的密码： 3.编译环境安装。安…

阅读更多...

JUC-线程中断机制和LockSupport

JUC-线程中断机制和LockSupport

线程中断机制概念 java提供了一种用于停止线程的协商机制-中断。称为中断标识协商机制。常用API public void interrupt() 仅仅让线程的中断标志位设置为true。不进行其他操作。public boolean isInterrupted() 获取中断标志位的状态。public static boolean interrupted…

阅读更多...

案例分享：销售管理者和员工的一对一面谈

案例分享：销售管理者和员工的一对一面谈

销售面谈对于销售过程至关重要，在快速变化的市场环境中，一对一的面谈成为销售管理者与销售员工之间沟通的重要桥梁。通过这种沟通方式，双方可以共同探讨销售工作的各个方面，包括业绩回顾、目标设定、技能提升、市场变化应对以及…

阅读更多...

CSS实现超出部分的省略

CSS实现超出部分的省略

1、为什么要省略在日常开发过程中我们难免会遇到后端返回给我们的的数据太长的情况，此时我们通常采取的是...的省略方式，其中的CSS大致如下，既可以实现对应的省略显示，但有些时候我们有需要用户可以查看具体的完整信息&#xff0…

阅读更多...

利用Python的csv(CSV)库读取csv文件并取出某个单元格的内容的学习过程

利用Python的csv(CSV)库读取csv文件并取出某个单元格的内容的学习过程

csv库在python3中是自带的。利用它可以方便的进行csv文件内容的读取。注意：要以gbk的编码形式打开，因为WPS的csv文件默认是gbk编码，而不是utf-8。 01-读取表头并在打印每一行内容时一并输出表头表头为第1行，现在要读取并打…

阅读更多...

基础面试题整理4

基础面试题整理4

1.mybatis的#{}和${}区别 #{}是预编译处理，${}是字符串替换#{}可以防止SQL注入，提高安全性 2.mybatis隔离级别读未提交 READ UNCOMMITED：读到了其他事务中未提交的数据，造成"脏读","不可重复读","幻读&…

阅读更多...

1月12日1月15日代码随想录路经总和从中序和后序遍历构造二叉树

1月12日1月15日代码随想录路经总和从中序和后序遍历构造二叉树

112.路经总和给你二叉树的根节点 root 和一个表示目标和的整数 targetSum 。判断该树中是否存在根节点到叶子节点的路径，这条路径上所有节点值相加等于目标和 targetSum 。如果存在，返回 true ；否则，返回 false 。叶子节点 …

阅读更多...

局部替换阿里 ReplaceAnything

局部替换阿里 ReplaceAnything

目录阿里的ReplaceAnything，没开源，可以人体替换、服装替换、物体替换以及背景替换等等。

阅读更多...

matlab|基于VMD-SSA-LSTM的多维时序光伏功率预测

matlab|基于VMD-SSA-LSTM的多维时序光伏功率预测

目录 1 主要内容变分模态分解(VMD) 麻雀搜索算法SSA 长短期记忆网络LSTM 2 部分代码 3 程序结果 4 下载链接 1 主要内容之前分享了预测的程序基于LSTM的负荷和可再生能源出力预测【核心部分复现】，该程序预测效果比较好，并且结构比较清晰&#…

阅读更多...

【打卡】牛客网：BM91 反转字符串

【打卡】牛客网：BM91 反转字符串

自己写的： 直接使用reverse()函数。 class Solution { public:/*** 代码中的类名、方法名、参数名已经指定，请勿修改，直接返回方法规定的值即可** 反转字符串* param str string字符串 * return string字符串*/string solve(string str) {/…

阅读更多...

buuctf-Misc 题目解答分解118-120

buuctf-Misc 题目解答分解118-120

118.[INSHack2017]sanity 打开压缩包就是一个md 文件 typora 打开发现flag INSA{Youre_sane_Good_for_you} 119.粽子的来历解压压缩包 ，得到文件夹如下用010 editor 打开我是A.doc 这个有些可以都改成FF 保存然后再次打开 docx 文件就发现了屈原的诗其他b…

阅读更多...

uniapp + node.js 开发问卷调查小程序

uniapp + node.js 开发问卷调查小程序

前后端效果图后端：nodejs 12.8 ; mongoDB 4.0 前端：uniapp 开发工具：HBuilderX 3.99 前端首页代码 index.vue <template><view class&q…

阅读更多...

新年送长辈礼物怎么选？华为畅享70 Pro 给长辈的新年贴心机

新年送长辈礼物怎么选？华为畅享70 Pro 给长辈的新年贴心机

随着春节的脚步越来越近，我们也在为如何表达对长辈的关爱而烦恼。新年送礼，不仅要表达心意，更要考虑到长辈的需求和习惯。今天，我为大家带来一款特别适合长辈的礼物——华为畅享70 Pro。首先，最直观的感受就是“大”。…

阅读更多...

【学习笔记】[AGC043F] Jewelry Box

【学习笔记】[AGC043F] Jewelry Box

点击看题意 Part 1 前置知识： L P LP LP对偶费用流。考虑这样一个费用流：每条边 u v uv uv的流量设为 f u v f_{uv} fuv，容量设为 c u v c_{uv} cuv，费用设为 w u v w_{uv} wuv。 b u b_u bu设为流出-流入。要求 m i …

阅读更多...

工具一本通--Jmeter

工具一本通--Jmeter

工具安装安装程序包运行Jmeter.bat 语言设置成中文 1 临时修改：Options > Choose Language > Chinese(Simplified) 2 永久修改：./bin/jmeter.properties #Preferred GUI language. Comment out to use the JVM default locale’s language. #la…

阅读更多...

Docker部署Traefik结合内网穿透远程访问Dashboard界面

Docker部署Traefik结合内网穿透远程访问Dashboard界面

文章目录前言1. Docker 部署 Trfɪk2. 本地访问traefik测试3. Linux 安装cpolar4. 配置Traefik公网访问地址5. 公网远程访问Traefik6. 固定Traefik公网地址前言 Trfɪk 是一个云原生的新型的 HTTP 反向代理、负载均衡软件，能轻易的部署微服务。它支持多种后端 (D…

阅读更多...

手机视频转换gif怎么操作？一个小妙招教你手机在线制gif

手机视频转换gif怎么操作？一个小妙招教你手机在线制gif

在现代社会gif动图已经是一种非常流行的图片格式了。可以通过视频转换gif的方式将自己的想法和创意制作成gif动图与好友进行分享斗图。那么，当我们想要在手机上完成视频转换成gif动图是应该怎么办呢？通过使用手机端的gif动图制作（https://www…

阅读更多...

uniapp 权限申请插件（权限使用说明） Ba-Permissions

uniapp 权限申请插件（权限使用说明） Ba-Permissions

简介（下载地址） Ba-Permissions 是一款权限申请插件，支持权限使用说明弹窗，满足市场审核需求。支持自定义权限申请，也支持快速申请定位、相机、媒体、文件、悬浮窗等常见权限。支持权限使用说明弹窗，满足…

阅读更多...

最新文章