数据操作、数据预处理

1.数据类型:

在这里插入图片描述
在这里插入图片描述

2.数组元素操作:

在这里插入图片描述

3.数据预处理:

import os
import pandas as pd
import numpy as np#创建csv文件并写入数据
os.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:f.write('NumRooms,Alley,Price\n')  # 列名f.write('NA,Pave,127500\n')  # 每行表示一个数据样本f.write('2,NA,106000\n')f.write('4,NA,178100\n')f.write('NA,NA,140000\n')
#读csv文件
data = pd.read_csv(data_file)
'''处理缺失值方式:将数值型列的缺失值用该列均值填充,将有缺失值的非数值型列作为新的列
inputs取所有行+第0,1列。outputs取所有行+第2列
'''
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
#均值代替
inputs = inputs.fillna(inputs.mean(numeric_only=True))
#pandas可以自动将此列转换为两列“Alley_Pave”和“Alley_nan”。巷子类型为“Pave”的行会将“Alley_Pave”的值设置为1,“Alley_nan”的值设置为0。 缺少巷子类型的行会将“Alley_Pave”和“Alley_nan”分别设置为0和1。
inputs = pd.get_dummies(inputs, dummy_na=True)
#现在inputs和outputs中的所有条目都是数值类型,它们可以转换为张量格式。X, y = np.array(inputs.to_numpy(dtype=float)), np.array(outputs.to_numpy(dtype=float))
data, X, y

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/620811.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为OD机试真题-堆内存申请-2023年OD统一考试(C卷)

题目描述: 有一个总空间为100字节的堆,现要从中新申请一块内存,内存分配原则为优先紧接着前一块已使用内存分配空间足够且最接近申请大小的空闲内存。 输入描述: 输入: 第1行是1个整数,表示期望申请的内存字节数; 第2到N行是用空格分割的两个整数,表示当前已分配的内存…

如何在电脑上免费更改 PDF 格式文档的字体大小?

对于需要编辑或修改的 PDF 文件来说,更改其字体大小是一个非常常见且必要的工作。虽然 Adobe Acrobat Pro DC 等专业的 PDF 编辑软件可以帮助您完成此任务,但他们通常都需要昂贵的恢复。幸运的是,有许多免费的 PDF 编辑工具可供选择。在本文中…

WSL dockers容器挂载windows下的文件

-v /mnt/c/Users/<Windows用户名>/<测试数据目录>:/app/test-20240104请注意&#xff0c;您需要将<Windows用户名>和<测试数据目录>替换为您在Windows上实际使用的用户名和测试数据目录。例如&#xff0c;如果您的Windows用户名是bear&#xff0c;测试…

【WPF.NET开发】流文档

本文内容 什么是流文档&#xff1f;流文档类型创建流内容与流相关的类内容架构自定义文本 流文档旨在优化查看和可读性。 流文档根据运行时变量&#xff08;例如&#xff0c;窗口大小、设备分辨率和可选的用户首选项&#xff09;来动态调整和重新排列内容&#xff0c;而不是设…

开源数据库系统OpenGauss本地部署

文章目录 前言1. Linux 安装 openGauss2. Linux 安装cpolar3. 创建openGauss主节点端口号公网地址4. 远程连接openGauss5. 固定连接TCP公网地址6. 固定地址连接测试 前言 openGauss是一款开源关系型数据库管理系统&#xff0c;采用木兰宽松许可证v2发行。openGauss内核深度融合…

1.5矩阵元素的引用

通过下标来引用矩阵的元素 A(3, 2)表示A矩阵第3行第2列的元素。 >> arr [1,2,3;4,5,6]; >> arr(4, 5) 10arr 1 2 3 0 04 5 6 0 00 0 0 0 00 0 0 0 10>> 如果引用元素超过矩阵的大小将自…

LeetCode讲解篇之47. 全排列 II

文章目录 题目描述题解思路题解代码 题目描述 题解思路 初始化一个nums中元素是否被访问的数组used、记录还需要递归的深度deep 遍历nums 如果当前元素被访问过或者当前元素等于前一个元素且前一个元素没被访问过就跳过该次遍历 否则选择当前元素&#xff0c;继续递归 直到…

Windows系统Outlook邮件备份导出与导入教程

注意&#xff1a;微软商店UWP版本outlook客户端暂时不支持邮件备份&#xff01;而Microsoft Office2003-目前(2021)中的outlook客户端才支持邮件备份。所以&#xff0c;想要备碧桂园集团邮箱邮件&#xff0c;请安装或者登录Microsoft Office中的outlook客户端以进行邮件的备份。…

S1-07 事件组

事件组 在 FreeRTOS 中&#xff0c;事件组&#xff08;Event Group&#xff09;是一种用于任务间通信的机制&#xff0c;用于在多个任务之间同步和传递事件。 事件组主要包含一下两个概念&#xff1a; 事件标志位&#xff08;Event Flags&#xff09;&#xff1a;每个事件标志…

任务类型划分

以下内容来自于ChatGPT内存密集型应用和IO密集型应用是两种不同类型的计算应用&#xff0c;它们在资源需求和性能特点上有所不同。 内存密集型应用&#xff08;Memory-Intensive Applications&#xff09;&#xff1a; 特点&#xff1a; 这类应用主要依赖大量的内存资源来执行任…

动态规划篇-02:杨辉三角

118、杨辉三角 状态转移方程 我们还是老套路起手&#xff1a;先列出状态转移方程。 base case 每行的第一个和最后一个数字都是1 明确状态 “原问题或子问题中变化的变量” 此处的“状态”就是某一位置的数字大小 在此题中&#xff0c;每一个数的“状态” 是由其左上方…

计数排序(Java语言)

视频讲解地址&#xff1a;【手把手带你写十大排序】9.计数排序&#xff08;Java语言&#xff09;_哔哩哔哩_bilibili 代码&#xff1a; public class CountSort {public void sortFucntion(int[] array) {int max Integer.MIN_VALUE;for (int i : array) {max Math.max(max…

测试案例实例

一、hello hello.go package mainconst (spanish "Spanish"french "French"englishHelloPrefix "Hello, "spanishHelloPrefix "Hola, "frenchHelloPrefix "Bonjour, " )func main() { } fun…

Ensp AR/WLAN设备启动失败问题 错误代码41 解决方案

现象描述 启动AR设备之后&#xff0c;设备命令行无法接收输入&#xff0c;在长时间等待后一直输出“####”。启动AR/WLAN设备时&#xff0c;提示“…错误代码40…”。 检查虚拟网卡设置。 检查安装eNSP的PC上是否存在名为“VirtualBox Host-Only Network”的虚拟网卡。 - 如果…

【conda】pip安装报错,网络延时问题解决记录(亲测有效)

【conda】pip安装报错&#xff0c;网络延时问题解决记录 1. pip install 报错如下所示2. 解决方案&#xff1a; 1. pip install 报错如下所示 pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(hostfiles.pythonhosted.org, port443): Read timed out.…

AI文本生图模型Stable Diffusion部分模型叠加效果

兄弟们,最近有个烦恼,就是找图有点费事,干脆自己部署个文本生图模型Stable Diffusion,虽然机器性能慢,但是效果还可以,先和大家截图分享下,后面将映射ai.shenjian.online供大家免费使用 1. 效果预览 2. 主模型及插件安装 下载模型icerealistic_v21.safetensors放到./models/S…

Leetcode447. 回旋镖的数量

Every day a Leetcode 题目来源&#xff1a;447. 回旋镖的数量 解法1&#xff1a;枚举 哈希 题目所描述的回旋镖可以视作一个 V 型的折线。我们可以枚举每个 points[i]&#xff0c;将其当作 V\texttt{V}V 型的拐点。设 points 中有 m 个点到 points[i] 的距离均相等&#…

【笔记ing】Helm-3 主题-1 Chart

Chart Helm使用的包格式称为chart。chart就是一个描述Kubernetes相关资源的文件集合。单个chart可以用来部署一些简单的&#xff0c;类似于memcache pod&#xff0c;或者某些复杂的HTTP服务器以及web全栈应用、数据库、缓存等等。 chart是作为特定目录布局的文件被创建的。它们…

学习Java API(一):基础知识点一文通✅

推荐阅读 智能化校园&#xff1a;深入探讨云端管理系统设计与实现&#xff08;一&#xff09; 智能化校园&#xff1a;深入探讨云端管理系统设计与实现&#xff08;二&#xff09; 文章目录 推荐阅读API文档注释String类创建字符串拼接字符串格式化字符串String方法substring(…

Qt之QByteArray数值转换和输出

尽管QByteArray类是一个集合&#xff0c;但也可以作为一个特殊形式的数值来用&#xff0c;其灵活的转换格式可大大一方便各种格式数据转换与显示的需求&#xff0c;如显示二进制和十六进制、显示科学记数和指定小数位的数值。QByteArray类的公有静态函数number可以完成这些功能…