python中info的用法_Python pandas.DataFrame.info函数方法的使用

DataFrame.info(self, verbose=None, buf=None, max_cols=None, memory_usage=None, null_counts=None) [source]

打印DataFrame的简要摘要。

此方法显示有关DataFrame的信息，包括索引dtype和列dtype，非空值和内存使用情况。

参数：verbose ： bool，可选

是否打印完整的摘要。默认情况下，

pandas.options.display.max_info_columns

遵循中的设置。

buf ：可写缓冲区，默认为sys.stdout

将输出发送到哪里。默认情况下，

输出将打印到sys.stdout。如果需要进一步处理输出，

请传递可写缓冲区。

max_cols ： int，可选

何时从详细输出切换到截断输出。

如果DataFrame的列数超过max_cols列，

则使用截断的输出。默认情况下，

使用中的设置 pandas.options.display.max_info_columns。

memory_usage ： bool，str，可选

指定是否应显示DataFrame元素（包括索引）

的总内存使用情况。默认情况下，

这遵循pandas.options.display.memory_usage设置。

True始终显示内存使用情况。

False永远不会显示内存使用情况。

‘deep’ 的值等效于“真正的内省”。

内存使用情况以可读单位（以2为基数的表示形式）

显示。无需深入自省，

就可以根据列dtype和行数进行内存估计，

假设值为相应的dtype消耗相同的内存量。

使用深度内存自省，

将以计算资源为代价执行实际内存使用量计算。

null_counts ：布尔值，可选

是否显示非空计数。默认情况下，

仅当框架小于 pandas.options.display.max_info_rows

和时显示 pandas.options.display.max_info_columns。

值为True始终显示计数，而值为False则不显示计数。

返回值：None

此方法打印DataFrame的摘要并返回None。

例子>>> int_values = [1, 2, 3, 4, 5]

>>> text_values = ['alpha', 'beta', 'gamma', 'delta', 'epsilon']

>>> float_values = [0.0, 0.25, 0.5, 0.75, 1.0]

>>> df = pd.DataFrame({"int_col": int_values, "text_col": text_values,

... "float_col": float_values})

>>> df

int_col text_col float_col

0 1 alpha 0.00

1 2 beta 0.25

2 3 gamma 0.50

3 4 delta 0.75

4 5 epsilon 1.00

打印所有列的信息：>>> df.info(verbose=True)

RangeIndex: 5 entries, 0 to 4

Data columns (total 3 columns):

int_col 5 non-null int64

text_col 5 non-null object

float_col 5 non-null float64

dtypes: float64(1), int64(1), object(1)

memory usage: 248.0+ bytes

显示列数及其dtype的摘要，但不显示每列的信息：>>> df.info(verbose=False)

RangeIndex: 5 entries, 0 to 4

Columns: 3 entries, int_col to float_col

dtypes: float64(1), int64(1), object(1)

memory usage: 248.0+ bytes

将DataFrame.info的输出通过管道传递到缓冲区而不是sys.stdout，获取缓冲区内容并写入文本文件：>>> import io

>>> buffer = io.StringIO()

>>> df.info(buf=buffer)

>>> s = buffer.getvalue()

>>> with open("df_info.txt", "w",

... encoding="utf-8") as f: # doctest: +SKIP

... f.write(s)

260

该memory_usage参数允许深刻反省模式，为大DataFrames和微调内存优化特别有用：>>> random_strings_array = np.random.choice(['a', 'b', 'c'], 10 ** 6)

>>> df = pd.DataFrame({

... 'column_1': np.random.choice(['a', 'b', 'c'], 10 ** 6),

... 'column_2': np.random.choice(['a', 'b', 'c'], 10 ** 6),

... 'column_3': np.random.choice(['a', 'b', 'c'], 10 ** 6)

... })

>>> df.info()

RangeIndex: 1000000 entries, 0 to 999999

Data columns (total 3 columns):

column_1 1000000 non-null object

column_2 1000000 non-null object

column_3 1000000 non-null object

dtypes: object(3)

memory usage: 22.9+ MB>>> df.info(memory_usage='deep')

RangeIndex: 1000000 entries, 0 to 999999

Data columns (total 3 columns):

column_1 1000000 non-null object

column_2 1000000 non-null object

column_3 1000000 non-null object

dtypes: object(3)

memory usage: 188.8 MB

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/542516.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python中info的用法_Python pandas.DataFrame.info函数方法的使用

相关文章

第四次作业孙保平034 李路平029

php serialize error at offset,PHP Notice: unserialize(): Error at offset XX of XX bytes

Java ClassLoader setClassAssertionStatus（）方法与示例

python怎么变各种颜色_python – 如何淡化颜色

informatica中元数据管理

yii+php+当前目录,Yii应用的目录结构和入口脚本

8086 寻址方式_8086微处理器的不同寻址模式

决策树的value是什么意思_从零开始的机器学习实用指南(六)：决策树

Hive中生成随机唯一标识ID的方法

php从网页获得数据,php根据URL获得网页内容

2020知道python语言应用答案_2020知到Python语言应用答案章节期末答案

如何在Bootstrap中使用Jumbotron和页面标头类？

python中的数字类型格式与运算,python数字数据类型

getprocaddress得到为0_基于ZU+系列MPSoC芯片的USB3.0/2.0接口硬件设计

如何设置单词第一个字母大写_大写一行中每个单词的第一个和最后一个字母

php如何编造简历,在简历里编造内容需要注意哪些问题？

Java LinkedList公共对象pollLast（）方法（带示例）

python编写学生成绩排序_Python实现按学生年龄排序的实际问题详解

前方危险-让很多“高逼格”高管深刻反思的文章

oracle实例的概念组成,oracle体系结构的两个基本概念:数据库和实例