Python Pandas –数据输入和输出

Pandas as a library can read and write data to a wide variety of sources. In this article, we would concentrate on the following,

熊猫作为图书馆可以读取和写入各种来源的数据。 在本文中,我们将重点介绍以下内容,

  • CSV

    CSV

  • Excel

    电子表格

  • HTML

    HTML

  • SQL

    SQL

In order to work with HTML files and SQL database, along with pandas, we would need to install the below library as well,

为了与HTML文件和SQL数据库以及pandas一起使用,我们还需要安装以下库,

  1. pip install sqlalchemy

    pip安装sqlalchemy

  2. pip install lxml

    pip安装lxml

  3. pip install html5lib

    点安装html5lib

  4. pip install beautifulsoup4

    pip安装beautifulsoup4

  5. pip install openpyxl

    pip安装openpyxl

Note: In the below example, the reference files are located in the same folder as the python files are.

注意:在以下示例中,参考文件与python文件位于同一文件夹中。

读取CSV文件 (Read a CSV file)

import numpy as np
import pandas as pd
# example is the csv file name
df = pd.read_csv('example')
print(df)
'''
Output:
a   b   c   d
0   0   1   2   3
1   4   5   6   7
2   8   9  10  11
3  12  13  14  15
'''

Pandas has built in function to read from numerous type of file format, such as csv , clipboard, html, json etc.

Pandas具有内置功能,可以读取多种类型的文件格式,例如csv,剪贴板,html,json等。

写入CSV文件 (Write to CSV file)

In the above example, we have the csv content assigned to a dataFrame variable called df.

在上面的示例中,我们将csv内容分配给了一个名为df的dataFrame变量。

# here index = False coz I don't want 
# to save the index as coulmn
df.to_csv('test_csv', index=False) 
pd.read_csv('test_csv')
'''
Output:
a   b   c   d
0   0   1   2   3
1   4   5   6   7
2   8   9  10  11
3  12  13  14  15
'''

从Excel文件读取 (Reading from Excel file)

While the pandas can read the data from the Excel file, it is important to note that 'pandas' can not read or import the formulas or images or macros. Trying to read them can cause pandas to crash.

尽管大熊猫可以从Excel文件读取数据,但必须注意, “大熊猫”无法读取或导入公式,图像或宏。 尝试阅读它们可能会导致熊猫崩溃。

Also, there can be an error such as requesting us to install the xlrd library in case it is not available. [pip install xlrd].

另外,如果没有xlrd库 ,可能会出现诸如请求我们安装xlrd库的错误。 [pip install xlrd]。

pd.read_excel('Excel_Sample.xlsx')
'''
Output:
Unnamed: 	0   	a   b   c   d
0           	0   	0   1   2   3
1           	1   	4   5   6   7
2           	2   	8   9  10  11
3           	3  	12  13  14  15
'''
df.to_excel('Excel_Sample_2.xlsx',sheet_name='Sheet1')

HTML输入 (HTML input)

Pandas read_html() function will read tables off of a webpage and return a list of DataFrame objects,

熊猫的read_html()函数将从网页中读取表并返回DataFrame对象的列表,

df = pd.read_html('http://www.fdic.gov/bank/individual/failed/banklist.html')
print(df[0] )

Bank NameCitySTCERTAcquiring InstitutionClosing DateUpdated DateLoss Share TypeAgreement TerminatedTermination Date
0First CornerStone BankKing of PrussiaPA35312First-Citizens Bank & Trust CompanyMay 6, 2016July 12, 2016noneNaNNaN
1Trust Company BankMemphisTN9956The Bank of Fayette CountyApril 29, 2016August 4, 2016noneNaNNaN
2North Milwaukee State BankMilwaukeeWI20364First-Citizens Bank & Trust CompanyMarch 11, 2016June 16, 2016noneNaNNaN
3Hometown National BankLongviewWA35156Twin City BankOctober 2, 2015April 13, 2016noneNaNNaN
4The Bank of GeorgiaPeachtree CityGA35259Fidelity BankOctober 2, 2015April 13, 2016noneNaNNaN
5Premier BankDenverCO34112United Fidelity Bank, fsbJuly 10, 2015July 12, 2016noneNaNNaN
6Edgebrook BankChicagoIL57772Republic Bank of ChicagoMay 8, 2015July 12, 2016noneNaNNaN
7Doral BankEn EspanolSan JuanPR32102Banco Popular de Puerto RicoFebruary 27, 2015May 13, 2015noneNaNNaN
8Capitol City Bank & Trust CompanyAtlantaGA33938First-Citizens Bank & Trust CompanyFebruary 13, 2015April 21, 2015noneNaNNaN
9Highland Community BankChicagoIL20290United Fidelity Bank, fsbJanuary 23, 2015April 21, 2015noneNaNNaN
银行名称 ST CERT 收购机构 截止日期 更新日期 亏损份额类型 协议终止 终止日期
0 第一角石银行 普鲁士国王 功放 35312 第一公民银行和信托公司 2016年5月6日 2016年7月12日 没有 N N
1个 信托公司银行 孟菲斯 TN 9956 费耶特县银行 2016年4月29日 2016年8月4日 没有 N N
2 北密尔沃基州立银行 密尔沃基 威斯康星州 20364 第一公民银行和信托公司 2016年3月11日 六月16,2016 没有 N N
3 故乡国家银行 长远的眼光 西澳 35156 双城银行 2015年10月2日 2016年4月13日 没有 N N
4 佐治亚银行 桃树市 GA 35259 富达银行 2015年10月2日 2016年4月13日 没有 N N
5 总理银行 丹佛 一氧化碳 34112 联合富达银行 2015年7月10日 2016年7月12日 没有 N N
6 埃奇布鲁克银行 芝加哥 白介素 57772 芝加哥共和国银行 2015年5月8日 2016年7月12日 没有 N N
7 Doral BankEn Espanol 圣胡安 公关 32102 波多黎各人民银行 2015年2月27日 2015年5月13日 没有 N N
8 国会大厦城市银行与信托公司 亚特兰大 GA 33938 第一公民银行和信托公司 2015年2月13日 2015年4月21日 没有 N N
9 高地社区银行 芝加哥 白介素 20290 联合富达银行 2015年1月23日 2015年4月21日 没有 N N

SQL (SQL)

The pandas.io.sql module provides a collection of query wrappers to both facilitate data retrieval and to reduce dependency on DB-specific API. Database abstraction is provided by SQLAlchemy if installed. Also, a driver library is required for the database. Examples of such drivers are psycopg2 for PostgreSQL or pymysql for MySQL. For SQLite, this is included in Python's standard library by default.

pandas.io.sql模块提供了查询包装的集合,以促进数据检索并减少对特定于数据库的API的依赖性。 如果安装了SQLAlchemy,则提供数据库抽象。 另外,数据库需要驱动程序库。 此类驱动程序的示例是用于PostgreSQLpsycopg2或用于MySQL的pymysql。 对于SQLite,默认情况下将其包含在Python的标准库中。

If SQLAlchemy is not installed, a fallback is only provided for SQLite (and for MySQL for backward compatibility, but this is deprecated and will be removed in a future version). This mode requires a Python database adapter that respects the Python DB-API.

如果未安装SQLAlchemy,则仅为SQLite(和向后兼容MySQL)提供回退功能,但不建议使用此功能,并将在以后的版本中将其删除。 此模式需要一个遵循Python DB-API的Python数据库适配器。

See also some cookbook examples for some advanced strategies.

另请参阅一些食谱示例以了解一些高级策略。

The key functions are,

关键功能是

  • read_sql_table(table_name, con[, schema, ...]) : Read SQL database table into a DataFrame.

    read_sql_table(table_name,con [,schema,...]) :将SQL数据库表读入DataFrame。

  • read_sql_query(sql, con[, index_col, ...]) : Read SQL query into a DataFrame.

    read_sql_query(sql,con [,index_col,...]) :将SQL查询读入DataFrame。

  • read_sql(sql, con[, index_col, ...]) : Read SQL query or database table into a DataFrame.

    read_sql(sql,con [,index_col,...]) :将SQL查询或数据库表读入DataFrame。

  • DataFrame.to_sql(name, con[, flavor, ...]) : Write records stored in a DataFrame to a SQL database.

    DataFrame.to_sql(name,con [,flavor,...]) :将存储在DataFrame中的记录写入SQL数据库。

from sqlalchemy import create_engine
engine = create_engine('sqlite:///:memory:')
df.to_sql('data', engine)
sql_df = pd.read_sql('data',con=engine)
print(sql_df)
'''
Output:
index         0   a   b   c   d
0      0           0   0   1   2   3
1      1           1   4   5   6   7
2      2           2   8   9  10  11
3      3           3  12  13  14  15
'''

翻译自: https://www.includehelp.com/python/python-pandas-data-input-and-output.aspx

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/541147.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux mysql 磁盘空间_磁盘空间满了之后MySQL会怎样

导读当磁盘空间爆满后,MySQL会发生什么事呢?又应该怎么应对?会发生什么事当磁盘空间写满了之后,MySQL是无法再写入任何数据的,包括对表数据的写入,以及binlog、binlog-index等文件。当然了,因为…

高晓松谈管理:自嘲总被员工管

6月11日,高晓松作为阿里巴巴钉钉在深圳卫视举办的“中国酷公司”超级发布会特邀嘉宾,在现场讲述了他对酷公司关键词“自驱力”的理解。 先来说说这场超级发布会的重头戏是阿里钉钉(企业应用软件)的3.5版本升级发布,钉钉…

as_hash ruby_Ruby中带有示例的Hash.each_pair方法

as_hash rubyHash.each_pair方法 (Hash.each_pair Method) In this article, we will study about Hash.each_pair Method. The working of this method can be predicted with the help of its name but it is not as simple as it seems. Well, we will understand this meth…

mysql杨辉三角_两个经典的小例子:杨辉三角和水仙花

package fllower;/*** 打印杨辉三角* author acer**/public class YangHui {public static void main(String[] args) {int[][] array new int[10][];//输出十行for(int i 0;i<10;i){//行是从0开始 列数加1array[i] new int[i1];//从第一行开始&#xff0c;依次给每行加不…

《Effective Modern C++》翻译--条款4:了解怎样查看推导出的类型

条款4&#xff1a;了解怎样查看推导出的类型 那些想要了解编译器怎样推导出的类型的人通常分为两个阵营。第一种阵营是实用主义者。他们的动力通常来自于编敲代码过程中(比如他们还在调试解决中)&#xff0c;他们利用编译器进行寻找&#xff0c;并相信这个能帮他们找到问题的根…

julia 数组类型转换_在Julia中确定类型的超类型

julia 数组类型转换To determine the supertype of a type – we use the supertype() function, it accepts a data type and returns the concrete supertype of the given type. 要确定类型的超类型 –我们使用supertype()函数 &#xff0c;该函数接受数据类型并返回给定类型…

【js】JavaScript parser实现浅析

最近笔者的团队迁移了webpack2&#xff0c;在迁移过程中&#xff0c;笔者发现webpack2中有相当多的兼容代码&#xff0c;虽然外界有很多声音一直在质疑作者为什么要破坏性更新&#xff0c;其实大家也都知道webpack1那种过于“灵活”的配置方式是有待商榷的&#xff0c;所以作者…

图形学 射线相交算法_计算机图形学中的阴极射线管(CRT)

图形学 射线相交算法什么是阴极射线管(CRT)&#xff1f; (What is Cathode Ray Tube (CRT)?) CRT stands for "Cathode Ray Tube". CRT代表“ 阴极射线管” 。 Cathode Ray Tube is a technology that is used widely in the traditional televisions and screens.…

mysql8安装目录linux7.5_Linux系统下 MySQL 5.7和8.0 版本安装指南

一. 准备工作1 删除本地CentOS7中的mariadb&#xff1a;查看系统中是否已安装 mariadb 服务&#xff1a;rpm -qa | grep mariadb或yum list installed | grep mariadb如果已安装则删除 mariadb及其依赖的包&#xff1a;yum -y remove mariadb-libs-5.5.44-2.el7.centos.x86_64关…

ruby array_Ruby中带有示例的Array.fill()方法(1)

ruby arrayArray.fill()方法 (Array.fill() Method) In this article, we will study about Array.fill() method. You all must be thinking the method must be doing something related to populate the Array instance. Well, we will figure this out in the rest of our …

python二分法查找程序_Python程序查找最大EVEN数

python二分法查找程序Input N integer numbers and we have to find the maximum even number. 输入N个整数&#xff0c;我们必须找到最大的偶数。 There are many ways of doing this but this time, we have to thought of most computationally efficient algorithm to do …

如何快速精确的和leader沟通

2019独角兽企业重金招聘Python工程师标准>>> 【缘起】 一个同学找我讨论个事情&#xff0c;沟通了一会还是不确定要表达什么&#xff0c;希望我配合什么。结合自己的经验&#xff0c;简单的聊聊“如何快速精准的和leader沟通一件事”。 【员工角度的潜在困惑&#x…

java字符串最长回文串_Java中的字符串回文程序

java字符串最长回文串Given a string and we have to check whether it is palindrome string or not. 给定一个字符串&#xff0c;我们必须检查它是否是回文字符串。 A string that is equal to its reverse string is known as palindrome string. To implement the program…

UOJ#31 【UR #2】猪猪侠再战括号序列

传送门http://uoj.ac/problem/31 大家好我是来自百度贴吧的_叫我猪猪侠&#xff0c;英文名叫_CallMeGGBond。 我不曾上过大学&#xff0c;但这不影响我对离散数学、复杂性分析等领域的兴趣&#xff1b;尤其是括号序列理论&#xff0c;一度令我沉浸其中&#xff0c;无法自拔。至…

li怎么让文字在图片下面_div+css(ul li)实现图片上文字下列表布局

css样式表代码&#xff1a;html布局代码&#xff1a;效果图&#xff1a;html布局部分&#xff0c;可根据自己需要添加对应的div即可。1、CSS关键样式单词解释1)、ul.imglist{ margin:0 auto; width:536px; overflow:hidden}使用margin:0 auto&#xff0c;让ul结构布局居中&…

如何使用React Native样式表?

Without wasting much time, a style sheet as commonly known in a CSS is an object or block of code of many styling properties and values which is applied in a code when called. 在不浪费大量时间的情况下&#xff0c;CSS中通常已知的样式表是具有许多样式属性和值的…

【iCore1S 双核心板_ARM】例程三:EXTI中断输入实验——读取ARM按键状态

实验原理&#xff1a; 按键的一端与STM32的GPIO(PB9)相连&#xff0c;且PB9外接一个1k大小的限流上接电阻。 初始化时把PB9设置成输入模式&#xff0c;当按键弹起时&#xff0c;PB9由于上拉电阻的作用呈高电平&#xff08;3.3V&#xff09;&#xff1b; 当按键按下时&#xff0…

MySQL小黑框怎么打开_打开你的小黑框命令行,来跟我一起嗨嗨嗨

文章更新于2020-03-16关于电脑位数&#xff1a;位数代表cpu可寻址的内存地址大小。32位的cpu最多可使用4GB内存&#xff0c;而64位cpu能处理的内存范围就高多了。操作系统也类似&#xff0c;只要看到操作系统里面能识别8GB内存就可以知道cpu和操作系统都是64位。一、常用的 cmd…

您如何从Python的stdin中读取信息?

Python supports following ways to read an input from stdin (standard input), Python支持以下方式从stdin(标准输入)读取输入 &#xff0c; 1)使用sys.stdin (1) Using sys.stdin) sys.stdin is a file-like object on which we can call functions read() or readlines()…

CentOS7下的AIDE***检测配置

1、AIDE的简单介绍AIDE通过扫描一台&#xff08;未被篡改&#xff09;的Linux服务器的文件系统来构建文件属性数据库&#xff0c;以后将服务器文件属性与数据库中的进行校对&#xff0c;然后在服务器运行时对被修改的索引了的文件发出警告。出于这个原因&#xff0c;AIDE必须在…