tensorflow 随机采样

实现随机采样

dataset = tf.data.Dataset.from_tensor_slices((x, y))
dataset = dataset.shuffle(len(x)).batch(32)train_size, val_size, test_size = 0.8, 0.1, 0.1train_dataset = dataset.take(int(train_size * len(dataset)))
val_dataset = dataset.skip(int(train_size * len(dataset))).take(int(val_size * len(dataset)))
test_dataset = dataset.skip(int((train_size + val_size) * len(dataset)))

具体来说,这段代码首先使用 from_tensor_slices 方法将输入的 x 和 y 作为元组进行拼接,形成一个 tf.data.Dataset 对象。随后,使用 shuffle 方法对整个数据集进行乱序操作,然后使用 batch 方法将数据集划分为大小为 32 的 batch

接着,手动指定训练集、验证集和测试集的比例,并利用 takeskip 方法将整个数据集按照相应比例划分为三部分。其中,take 方法表示从数据集的开头取出指定数量的数据项,而 skip 方法表示跳过指定数量的数据项,从数据集的中间或结尾开始取数。最终,将三个子数据集存储到 train_dataset、val_datasettest_dataset 三个变量中,以供后续模型训练和评估使用。

将数据转换为numpy.array() 数组

  • 可以使用 tf.data.Dataset 实例的 as_numpy_iterator() 方法将其转换为 Numpy 数组迭代器,并使用 np.concatenate() 方法将它们合并成一个 Numpy 数组
test_images = []
test_labels = []for image, label in test_dataset:test_images.append(image)test_labels.append(label)test_images = tf.concat(test_images, axis=0)
test_labels = tf.concat(test_labels, axis=0)predictions = model.predict(test_images, batch_size=batch_size)

在这个示例中,我们首先循环遍历测试数据集,并将每个样本的输入和标签分别添加到 test_images 和 test_labels 列表中。然后,我们使用 tf.concat() 方法将所有输入和标签连接成一个张量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/756170.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开源的OCR工具基本使用:PaddleOCR/Tesseract/CnOCR

前言 因项目需要,调研了一下目前市面上一些开源的OCR工具,支持本地部署,非调用API,主要有PaddleOCR/CnOCR/chinese_lite OCR/EasyOCR/Tesseract/chineseocr/mmocr这几款产品。 本文主要尝试了EasyOCR/CnOCR/Tesseract/PaddleOCR这…

【开源】SpringBoot框架开发不良邮件过滤系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 系统用户模块2.2 收件箱模块2.3 发件箱模块2.4 垃圾箱模块2.5 回收站模块2.6 邮箱过滤设置模块 三、实体类设计3.1 系统用户3.2 邮件3.3 其他实体 四、系统展示五、核心代码5.1 查询收件箱档案5.2 查询回收站档案5.3 新…

C语言 数组

文章目录 1.一维数组2.二维数组3.冒泡排序4.一维函数的数组名5.二维数组的数组名 1.一维数组 语法形式:type_t arr_name [const_n] 数组是一组相同类型元素的集合 type_t是指数组的元素类型 arr_name是指数组的名称 const_n是一个常量表达式,用来指定数…

mongoDB7.0.6版安装与使用(最新版踩坑记录)

这里写自定义目录标题 0.前言1.MongoDB下载与安装2.启动服务及验证3.命令行访问4.navicat访问5.停止服务 0.前言 本文总结了最近版mongoDB下载安装的过程及简单的应用,整个过程不涉及修改配置文件,甚至不用设置用户名密码也不用登录认证,在进…

HarmonyOS NEXT应用开发—投票动效实现案例

介绍 本示例介绍使用绘制组件中的Polygon组件配合使用显式动画以及borderRadius实现投票pk组件。 效果预览图 使用说明 加载完成后会有一个胶囊块被切割成两个等大的图形来作为投票的两个选项,中间由PK两字分隔开点击左边选项,两个图形会随着选择人数…

2080: [蓝桥杯2023初赛] 飞机降落

题目描述 N 架飞机准备降落到某个只有一条跑道的机场。 其中第 i 架飞机在 Ti 时刻到达机场上空,到达时它的剩余油料还可以继续盘旋 Di 个单位时间。 即它最早可以于 Ti 时刻开始降落,最晚可以于 Ti Di 时刻开始降落。 降落过程需要Li个单位时间。 一架…

Java城管智慧执法管理系统源码带APP

目录 一、系统概述 二、系统开发环境 三、功能模块 四、应用价值 1、提升案件办理效率 2、提升监管效能 3、提升行政执法水平 4、推进行政执法创新 一、系统概述 智慧城管系统是一个基于现代信息技术手段的综合管理平台,旨在通过强化信息获取自动化、监督管…

二分算法详、

二分的概念 二分算法:是用来在一个有序数组中查找一个元素的算法。时间复杂度O(log n) 二分的二段性 集合中的元素有存在分界线,给定条件可以将集合中的元素分为两部分,一部分满足条件,一部分不满足条件…

官宣!眉州东坡终生认养大熊猫“星星”

2024年03月19日,眉州东坡终生认养大熊猫“星星”签约仪式暨第八届有机川熊猫竹笋节在北京和重庆同时举行。眉州东坡董事长王刚先生、重庆动物园副处长殷毓中先生等嘉宾在重庆共同出席了此次认养仪式,重庆动物园向眉州东坡授予大熊猫终生认养证书,宣布星星正式加入眉州东坡大家庭…

Game of Nodes 16进8

KNIME 还可以用成这样? 是不是有点过分了。 Tableau, PowerBI 同学请绕行,我们讨论的不是同一个东西... 由于 Game of Nodes 没有公开题目,且各个小组赛的题目也是不一样的,在这里我们只能通过拼接图来猜想小组赛题目了。 有的解决方案我甚至…

Android源码阅读 SharedPreferences - 1

目录 前言 正文 SharedPreferences.java PreferenceManager.java ContextImpl.java 前言 由于笔者目前水平限制,表达能力有限,尽请见谅。 SharedPreferences提供了一种轻量级的数据存储方式,允许保存和获取简单的键值对。它适用于保存少…

中霖教育:一级建造师和一级造价师通过率高吗?

在建筑工业领域,一级建造师和一级造价工程师考试都是比较热门的考试,每年参加的人数都非常多,如果只备考一个的话,2024年选择哪项考试更为合适? 一建和一造的平均通过率均未超过10%,两者难度相近: 1. 一…

TCP粘包问题优化

TCP粘包问题是指在使用TCP协议进行数据传输时,由于TCP协议本身的特性,可能会导致多个数据包被粘在一起发送,或者在接收端接收到的数据包中包含了多个独立的数据包。这种情况可能会导致数据解析出错,从而影响应用程序的正常运行。 …

SpringBoot 中配置日期格式

SpringBoot 中配置日期格式 这个错误提示表明在尝试将一个字符串转换成 java.util.Date 类型时失败了,因为字符串的格式不符合预期的日期格式。在你的情况下,字符串 “2024-03-14 18:55:55” 似乎不符合默认的日期格式。 解决这个问题的方法之一是告诉…

力扣刷题---岛屿问题--c++

DFS:深度优先遍历:深度优先遍历是一种优先走到底、无路可走再回头的遍历方式 我们所熟悉的 DFS(深度优先搜索)问题通常是在树或者图结构上进行的。而我们今天要讨论的 DFS 问题,是在一种「网格」结构中进行的。岛屿问题…

源码部署LAMP架构

LAMP 文章目录 LAMP1. lamp简介2. web服务器工作流程2.1 cgi与fastcgi2.2 httpd与php结合的方式2.3 web工作流程 3. LAMP平台构建3.1 安装httpd3.2 安装mysql3.3 安装php3.4 验证 1. lamp简介 有了前面学习的知识的铺垫,今天可以来学习下第一个常用的web架构了。 …

【基于HTML5的网页设计及应用】——动态添加下拉菜单

🎃个人专栏: 🐬 算法设计与分析:算法设计与分析_IT闫的博客-CSDN博客 🐳Java基础:Java基础_IT闫的博客-CSDN博客 🐋c语言:c语言_IT闫的博客-CSDN博客 🐟MySQL&#xff1a…

TiDB分布式关系型数据库

TiDB分布式关系型数据库 什么是TiDBTiDB结构TiDB的热点问题 什么是TiDB TiDB 是一个开源的分布式关系型数据库,由 PingCAP 公司主导开发。它的设计目标是提供水平可扩展的高性能分布式事务数据库,同时保持与 MySQL 协议的兼容性和事务的 ACID&#xff0…

什么是增强型SSL证书?购买一张需要多少钱?

增强型SSL证书是一种提供更高级别安全验证与用户信任度的网络安全工具,也被称为EV证书。相较于DV(域名验证)和OV(组织验证)证书,它通过严格的身份核实流程确保网站所有者的合法性和真实性。 首先&#xff0…

vue事件绑定引发的性能问题

Vue事件绑定中,为每个动态创建的元素都基于addEventListener做了事件绑定,可能会导致性能问题,因为在绑定的方法中需要用到每次循环的信息,会创建多个闭包。 因为在循环中使用事件绑定会导致大量的事件监听器被创建,这…