【pandas 不同文件读取和存储】

文章目录

  • 一、Pandas 文件读取和存储概览
  • 二、读取不同类型的文件
    • 1. CSV文件的读取与存储
      • 代码及解释:
    • 2. Excel文件的读取与存储
      • 代码及解释:
    • 3. JSON文件的读取与存储
      • 代码及解释:
    • 4. SQL数据库的读取与存储
      • 代码及解释:
    • 5. 其他格式文件的读取与存储
      • HTML文件的读取
      • HDF5文件的读取和写入

一、Pandas 文件读取和存储概览

Pandas 支持的文件类型包括但不限于 CSV、Excel、JSON、HTML 和 SQL。

二、读取不同类型的文件

1. CSV文件的读取与存储

CSV(逗号分隔值)文件是数据存储的一种常见格式,特别适合存储表格数据。

代码及解释:

import pandas as pd# 读取CSV文件
data_csv = pd.read_csv('example.csv')
print(data_csv.head())# 存储为CSV文件
data_csv.to_csv('output.csv', index=False)

pd.read_csv 函数用于读取 CSV 文件,而 to_csv 方法用于将 DataFrame 存储回 CSV 文件。index=False 参数防止将行索引作为单独一列写入文件。

2. Excel文件的读取与存储

Excel 文件是办公室中常用的数据记录和分析工具。Pandas 通过内置的函数支持读取和写入 Excel 文件。

代码及解释:

# 读取Excel文件
data_excel = pd.read_excel('example.xlsx')
print(data_excel.head())# 存储为Excel文件
data_excel.to_excel('output.xlsx', index=False)

pd.read_excelto_excel 分别用于读取和写入 Excel 文件。同样,index=False 防止行索引被写入。

3. JSON文件的读取与存储

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,常用于网络数据传输。

代码及解释:

# 读取JSON文件
data_json = pd.read_json('example.json')
print(data_json.head())# 存储为JSON文件
data_json.to_json('output.json')

pd.read_json 用于读取 JSON 文件,而 to_json 方法将 DataFrame 转换为 JSON 格式。

4. SQL数据库的读取与存储

SQL 数据库是存储和管理数据的重要工具。Pandas 可以与 SQL 数据库交互,执行数据的读取和存储操作。

代码及解释:

from sqlalchemy import create_engine# 创建数据库连接
engine = create_engine('sqlite:///example.db')# 读取SQL数据
data_sql = pd.read_sql('SELECT * FROM table_name', engine)
print(data_sql.head())# 存储到SQL数据库
data_sql.to_sql('table_name', engine, if_exists='replace', index=False)

在这里,create_engine 用于创建与数据库的连接。pd.read_sql 从数据库中读取数据,而 to_sql 方法将数据写入数据库。

5. 其他格式文件的读取与存储

除了上述格式,Pandas 还支持多种其他格式,例如 HTML、HDF5 等。

HTML文件的读取

# 读取HTML中的表格数据
data_html = pd.read_html('http://example.com')
print(data_html[0].head())

pd.read_html 读取 HTML 文件中的表格数据。

HDF5文件的读取和写入

# 读取HDF5文件
data_hdf5 = pd.read_hdf('data.h5', 'key')
print(data_hdf5.head())# 写入HDF5文件
data_hdf5.to_hdf('output.h5', 'key')

HDF5 是用于存储大量科学数据的一种文件格式。pd.read_hdfto_hdf 分别用于读取和写入 HDF5 文件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/683843.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华清远见嵌入式学习——春节作业——2.15日

作业要求&#xff1a; 编写led驱动&#xff0c;通过应用程序控制三盏灯亮灭 作业答案&#xff1a; 作业效果&#xff1a; mychrdev.c #include <linux/init.h> #include <linux/module.h> #include <linux/fs.h> #include <linux/uaccess.h> #incl…

springboot声明(创建)RabbitMQ交换机和队列

在之前我们都是基于RabbitMQ控制台来创建队列、交换机。但是在实际开发时&#xff0c;队列和交换机是程序员定义的&#xff0c;将来项目上线&#xff0c;又要交给运维去创建。那么程序员就需要把程序中运行的所有队列和交换机都写下来&#xff0c;交给运维。在这个过程中是很容…

基于GPT-4一键完成数据分析全流程的AI Agent: Streamline Analyst

大型语言模型&#xff08;LLM&#xff09;的兴起不仅为获取知识和解决问题开辟了新的可能性&#xff0c;而且催生了一些新型智能系统&#xff0c;例如旨在辅助用户完成特定任务的AI Copilot以及旨在自动化和自主执行复杂任务的AI Agent&#xff0c;使得编程、创作等任务变得高效…

医卫答案在哪搜?九个公众号和软件推荐清单! #笔记#笔记#微信

在这个信息爆炸的时代&#xff0c;合理利用学习工具可以帮助我们过滤和获取有用的知识。 1.粉鹿搜题 这是一个公众号 题库包括四六级答案、各学校往期课后答案、期末考试题等&#xff0c;使用比较简单。 下方附上一些测试的试题及答案 1、最有可能担任债券发行受托人的个人…

ES实战--文档间的关系

文档常见关系 1.对象类型 2.嵌套文档 3.文档间的父子关系 4.反规范化 5.应用端的链接 嵌套映射和对象映射看上去差不多,不过其type不是object而是nested 查询和过滤器区别 1.查询是计算得分的,查询返回按照相关性得分排列的结果 2,过滤器不计算得分,运行更快,且易缓存 Nested查…

SSM框架,Spring-ioc的学习(下)

拓展&#xff1a;在xml文件中读取外部配置文件 例&#xff1a;若要导入外部配置文件jdbc.properties <?xml version"1.0" encoding"UTF-8"?> <beans xmlns"<http://www.springframework.org/schema/beans>"xmlns:xsi"&l…

装饰工程|装饰工程管理系统-项目立项子系统的设计与实现|基于Springboot的装饰工程管理系统设计与实现(源码+数据库+文档)

装饰工程管理系统-项目立项子系统目录 目录 基于Springboot的装饰工程管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、管理员功能实现 &#xff08;2&#xff09;合同报价管理 &#xff08;3&#xff09;装饰材料总计划管理 &#xff08;4&#xff0…

Java与JavaScript的区别与联系

Java是目前编程领域使用非常广泛的编程语言&#xff0c;相较于JavaScript&#xff0c;Java更被人们熟知。很多Java程序员想学门脚本语言&#xff0c;一看JavaScript和Java这么像&#xff0c;很有亲切感&#xff0c;那干脆就学它了&#xff0c;这也间接的帮助了JavaScript的发展…

OLED显示红外遥控键码

基本原理 本遥控器的编码是NEC编码&#xff0c;为PWM&#xff08;脉冲宽度调制&#xff09;。 发射红外载波的时间固定&#xff0c;通过改变不发射载波的时间来改变占空比。 逻辑“0”是由0.56ms的38KHZ载波和0.560ms的无载波间隔组成&#xff1b;逻辑“1”是由0.56ms的38KHZ…

LabVIEW高效电磁阀性能测试

LabVIEW高效电磁阀性能测试 在核电站的安全运营中&#xff0c;电磁阀作为关键组件&#xff0c;其性能的可靠性至关重要。设计一套基于LabVIEW的电磁阀测试平台&#xff0c;既能精准测试电磁阀的多项性能指标&#xff0c;又能提高检修效率与准确性&#xff0c;进而保障核电站的…

接口测试全流程扫盲

扫盲内容&#xff1a; 1.什么是接口&#xff1f; 2.接口都有哪些类型&#xff1f; 3.接口的本质是什么&#xff1f; 4.什么是接口测试&#xff1f; 5.问什么要做接口测试&#xff1f; 6.怎样做接口测试&#xff1f; 7.接口测测试点是什么&#xff1f; 8.接口测试都要掌…

​StableSwarmUI#超越文本的prompt

今天看到一个新的webui方案&#xff0c;是Stability-AI开源的&#xff1a; StableSwarmUI 是一个模块化的稳定扩散web用户界面&#xff0c;着重于使强大的工具易于访问、高性能和可扩展性。 由于项目还在开发中&#xff0c;我们可以先了解下&#xff0c;翻看了它的特点&#xf…

ELAdmin 发送邮件

邮箱配置 ELAdmin目录中选择系统工具->邮件工具。 发件人邮箱&#xff1a;发送者的邮箱地址发件用户名&#xff1a;一般都是发件人邮箱前面的部分&#xff0c;也可以任意写邮箱密码&#xff1a;如果是 qq 邮箱或者腾讯企业邮箱&#xff0c;需要使用授权码。SMTP地址&…

03 SS之返回JSON+

1. 返回JSON 为什么要返回JSON 前后端分离成为企业应用开发中的主流&#xff0c;前后端分离通过json进行交互&#xff0c;登录成功和失败后不用页面跳转&#xff0c;而是给前端返回一段JSON提示, 前端根据JSON提示构建页面. 需求: 对于登录的各种状态 , 给前端返回JSON数据 …

表的连接

目录 内连接实现效果 使用左外连接&#xff0c;将所有的员工信息都显示出来&#xff0c;即便他没有对应的部门 使用右外连接&#xff0c;将所有的部门信息都显示出来 查询每个员工的编号、姓名、职位&#xff0c;以及所在各部门的领导姓名、领导职位 确定所需要的数据表 确…

螺旋矩阵 III(c++题解)

题目描述 在 rows x cols 的网格上&#xff0c;你从单元格 (rStart, cStart) 面朝东面开始。网格的西北角位于第一行第一列&#xff0c;网格的东南角位于最后一行最后一列。 你需要以顺时针按螺旋状行走&#xff0c;访问此网格中的每个位置。每当移动到网格的边界之外时&…

多模态基础--- word Embedding

1 word Embedding 原始的单词编码方式&#xff1a; one-hot&#xff0c;维度太大&#xff0c;不同单词之间相互独立&#xff0c;没有远近关系区分。 wordclass&#xff0c;将同一类单词编码在一起&#xff0c;此时丢失了类别和类别间的相关信息&#xff0c;比如class1和class3…

应急响应实战笔记02日志分析篇(3)

第3篇:Web日志分析 ox01 Web日志 Web访问日志记录了Web服务器接收处理请求及运行时错误等各种原始信息。通过对WEB日志进行的安全分析&#xff0c;不仅可以帮助我们定位攻击者&#xff0c;还可以帮助我们还原攻击路径&#xff0c;找到网站存在的安全漏洞并进行修复。 我们来…

【牛客面试必刷TOP101】Day21.BM11 链表相加(二)和BM12 单链表的排序

作者简介&#xff1a;大家好&#xff0c;我是未央&#xff1b; 博客首页&#xff1a;未央.303 系列专栏&#xff1a;牛客面试必刷TOP101 每日一句&#xff1a;人的一生&#xff0c;可以有所作为的时机只有一次&#xff0c;那就是现在&#xff01;&#xff01;&#xff01;&…

算法详解:滑动窗口-- 最大连续1的个数 III

题目来源:力扣&#xff08;LeetCode&#xff09;官网 - 全球极客挚爱的技术成长平台 本期讲解滑动窗口经典例题,我会从三个点开始讲解题目1.题目解析2.算法原理 3.编写代码 1.题目解析 这道题目理解起来还是比较简单的,我们简单分析一下,也就是给定一个数组,数组是由1和0组成…