Pandas教程(二)—— 不同格式的数据读取

前言:几种常用数据格式的介绍

  • csv文件

1.  逗号分隔值文件,以纯文本形式(记事本)存储表格数据

2.  它是一种平面文件:即只存储数据和文字,不能存储公式、图表等

3.  更适合存储大数据,一般用来批量一维或二维存储数据

4.  csv、tsv、txt都属于文本文件,只是csv以逗号分隔,tsv以制表符Tab隔开,而txt没有具体要求(逗号、制表符、空格等都可) 

CSV文件的存储方式

  • Excel文件

1.  Excel是一个电子表格,将文件保存为自己的专有格式,即xls或xlsx

2.  Excel是一个二进制文件,它不仅可以存储数据,还可以对数据进行操作

3.  不适合处理大数据

  • JSON数据

1.  JSON是一种轻量级的数据交换格式,用于存储和传输结构化数据

2.  JSON一般存储与Web浏览器中,是一种在各个编程语言中流通的数据格式(类似英语)

3.  JSON 数据的书写格式是键(名称)值对

  • XML、HXML格式

1.  XML是一种标记语言,被设计用来传输和存储数据(同JOSH),其焦点是数据的内容

2.  HTML 是超文本标记语言,被设计用来显示数据,其焦点是数据的外观

1.在python中新建文件

文件类型新建方法
csv和txt(纯文本文件)pd.to_csv(路径)
excelpd.to_excel(路径)
sqlpd.to_sql(路径)

 新建文件方法的几个参数:

        sep:分隔符

        na_rep= :  缺失值标注(默认为空字符串)

        index = :  是否写入行的标签(默认True)

        header = :是否写入列的标签(默认True)

import pandas as pd
import numpy as nproad = "D:\python code\pycharm\表格.xlsx"
data = pd.DataFrame(np.arange(9).reshape(3, 3))
print(data)
data.to_excel(road,index=False,header=False)

2.读写csv和txt文本文件

 

 

 读写文本文件方法的几个参数:

       

        sep =:文件的分隔符;如果文件中分隔符不止一个,一般输入一个正则表达式 “\s+”

        header = :默认第一行为列名,如果不是,则输入None

        names = :  指定列名列表,和header搭配使用

        index_col = :  指定一个列,用作行名(可以输入索引名或索引编号)

        skiprows =:从开头起,需要跳过的行数或行号列表

        nrows =:从文件开头处需要读入的行数

        na_values =:需要用Na替换的值序列

 3.读取Excel文件

       操作基本和文本文件差不多(最好先装好第三方包 xlrd和openpyxl)

import pandas as pd
road = "E:\python 资料\孙兴华 数据分析教程\Pandas课件\课件\pandas教程\课件001-005\读取文件.xlsx"
data = pd.read_excel(road,header= None,names=["序号","姓名","年龄","手机","地址","日期"],index_col = 0) #读取文件
print(data)
data.to_excel(road) #保存文件

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/580158.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Codeforces Round 917 (Div. 2)更新中...

A.Least Product(思维) 题意: 给出一个数组 a 1 , a 2 , . . . , a n a_1, a_2, ..., a_n a1​,a2​,...,an​,你可以进行若干次以下操作: 选择数组中的一个元素 a i a_i ai​,将这个数字修改为 0 ∼ a i 0 \sim a_i 0∼ai​之…

Stream流的简单使用

stream流的三类方法 获取Stream流 ○ 创建一条流水线,并把数据放到流水线上准备进行操作中间方法 ○ 流水线上的操作 ○ 一次操作完毕之后,还可以继续进行其他操作终结方法 ○ 一个Stream流只能有一个终结方法 ○ 是流水线上的最后一个操作 其实Stream流非常简单,只…

Unity3D 安装和下载指南及汉化

Unity3D是一款强大的游戏开发引擎,为开发者提供了丰富的工具和资源,使得游戏制作变得更加简单和高效。本文将介绍Unity3D的安装和下载步骤,以帮助初学者迅速入门。 步骤一:访问Unity官网 首先,打开浏览器&#xff0c…

Qt 中使用 MySQL 数据库保姆级教程(上)

作者:billy 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 前言 在 Qt 中默认只搭载了 QSqlLite 数据库驱动,若要使用其他数据库需要自己下载数据库,并将数据库驱动加载到…

虚拟机Windows Server 2012 与ubuntu的安装与布置

介绍虚拟机 虚拟机(Virtual Machine,简称VM)是一种通过软件模拟的计算机系统,可以在一台物理计算机上同时运行多个独立的操作系统和应用软件。虚拟机将物理计算机的硬件资源(如处理器、内存、硬盘等)虚拟化…

2023年12月30日(星期六)骑行太平

2023年12月30日 (星期六) 骑行太平,早8:30到9:00, 大观公园门囗集合,9:30准时出发 【因迟到者,骑行速度快者,可自行追赶偶遇。】 偶遇地点:大观公园门囗集合 ,家住东,南,北的骑友在…

Nginx快速入门:return、rewrite重定向、重写详解(六)

0. 引言 我们在日常的生产过程中,常常有需要重定向转发的需求,比如企业更换了域名,但又要保证之前的域名能访问,这就需要做重定向的跳转。 我们在之前的章节中学习了Nginx的负载均衡、各类转发代理配置,今天继续来补…

Camtasia2024中文最新免授权版下载

TechSmith Camtasia2024免费版是一款非常专业且功能强大的屏幕录制工具!使用集屏幕录像机、视频编辑器的功能于一身,能够轻松的录制和创建具有专业外观的视频。这套非常强大的专业录屏与视频创作大型软件套装包含捕获屏幕录制、视频剪辑和编辑、视频录音…

MySQL日期查询 今天、明天、本月、下月、星期、本周第一天、本周最后一天、本周七天日期

文章目录 今天日期明天日期本月第一天本月最后一天下个月第一天当前月已过几天当前月天数当前月所有日期获取星期本周第一天本周最后一天获取本周的七天日期 今天日期 select curdate()明天日期 select DATE_SUB(curdate(),INTERVAL -1 DAY) AS tomorrow本月第一天 select d…

嵌入式——RTC内置实时时钟

学习目标 理解原理图RTC设计部分掌握初始化RTC掌握设置时间掌握读取时间学习内容 RTC原理图 RTC结构框图 RTC时钟 开发流程 加载依赖。gd32f4xx_rtc.c,gd32f4xx_pmu.c初始化RTC。时钟配置。获取时钟。RTC初始化 // 电池管理加载 rcu_periph_clock_enable(RCU_PMU); pmu_back…

C#调用(python通过excel坐标生成的曲面地形图)案例

效果图: 文件图: 详解一:环境和python库问题 1.python 中只需要下载 matplotlib3.8.2和scipy1.11.4 2.我安装的python版本 详解二:解释器问题 python解释器这里有两种形式 第一种形式 1.调用 pycharm项目下的解释器,需要安装python必须的包(命令安装或者搜索安装)。 2.修改…

“一键批量翻译与重命名,轻松将西班牙文件名转换为中文名“

你是否遇到过需要将大量的西班牙文件名翻译成中文名,却无从下手的情况?现在,我们为你带来了一款强大的文件名批量翻译与重命名软件,让你能够轻松完成这项任务,提高工作效率。 首先,进入文件批量改名高手的主…

MEMS麦克风具备哪些优势? MP34DT05TR-A 一款MEMS音频传感器全向数字麦克风

MP34DT05TR-A是一款超紧凑、低功耗、全向数字式 MEMS 麦克风,内置电容式感应元件和 IC 接口。 传感元件能够检测声波,采用专门用来生产音频传感器的硅微加工工艺制造。IC 接口采用 CMOS 工艺制造,允许专用电路设计以 PDM 格式从外部提供数字…

Java自动化测试系列[v1.0.0][常见页面操作处理附源码]

[控制滚动] package util; import org.openqa.selenium.JavascriptExecutor; import org.openqa.selenium.WebDriver; import org.openqa.selenium.WebElement;public class ScrollBarUtil {/*** 控制滚动条向下拉到底* param driver 浏览器驱动*/public static void toBottom…

Matlab之State Flow

打开方式 方式一:在命令窗口输入State Flow或者简写sf就能打开,并且会自动打开State Flow 的Library。从左到右分别是图表、真值表、状态转换表、例子、顺序查看,可以加入到Simulink当中。 方式二:从Simulink Library里面添加Sta…

SpringBoot3 应用分析

SpringBoot3-快速入门 1、简介 1. 前置知识 Java17Spring、SpringMVC、MyBatisMaven、IDEA 2. 环境要求 环境&工具版本(or later)SpringBoot3.0.5IDEA2021.2.1Java17Maven3.5Tomcat10.0Servlet5.0GraalVM Community22.3Native Build Tools0.9.1…

【Java】三甲公立医院综合绩效核算系统源码

医院绩效考核系统,建立以医院发展目标为导向,以医务人员劳动价值、工作量为评价基础,统筹效率、质量、成本的绩效管理和绩效工资分配体系。系统支持RBRVS(以资源为基础的相对价值比率)和DRGs(疾病诊断相关分…

【C++高阶(九)】C++类型转换以及IO流

💓博主CSDN主页:杭电码农-NEO💓   ⏩专栏分类:C从入门到精通⏪   🚚代码仓库:NEO的学习日记🚚   🌹关注我🫵带你学习C   🔝🔝 C高阶 1. 前言2. C语言类型转换的方式3. C的强制…

什么是微服务架构以及落地思路

文章目录 前言一、各种架构的演进二、微服务架构落地思路 总结 前言 调用几个webapi就是微服务架构?或则是ngnixwebapi 集群就是微服务架构?这个文章带你弄懂微服务架构。 一、各种架构的演进 单体架构:放在一个服务器进程完成全部的后端处理…

Linux6.4、IO基础(整体深入理解文件描述符)

个人主页:Lei宝啊 愿所有美好如期而遇 前言 本文章将从源码和内核剖析fd,细节和基础部分可以了解: 我们再来提起文件,文件可以分为两类: 磁盘文件 (未被打开)内存文件 (被进程在内存中打开) 同时我们也知道文件描…