python的describe参数_python pandas DataFrame.describe用法及代码示例

生成描述性统计信息。

描述性统计数据包括总结数据集分布的集中趋势,离散度和形状的统计数据,但不包括NaN值。

分析数值和对象序列,以及DataFrame混合数据类型的列集。输出将根据提供的内容而有所不同。有关更多详细信息,请参阅以下注释。

参数:

percentiles:list-like of numbers, 可选参数要包含在输出中的百分比。全部应介于0和1之间。默认值为[.25, .5, .75],返回第25、50和75个百分位数。

include:‘all’, list-like of dtypes 或 None (default), 可选参数要包含在结果中的数据类型的白名单。忽略了Series。以下是选项:

‘all’:输入的所有列都将包含在输出中。

dtypes的list-like:将结果限制为提供的数据类型。限制结果为数字类型提交numpy.number。要将其限制为对象列,请提交numpy.object数据类型。字符串也可以以select_dtypes(例如。df.describe(include=['O']))。要选择 pandas 分类列,请使用'category'

无(默认):结果将包括所有数字列。

exclude:list-like of dtypes 或 None (default), optional,要从结果中忽略的数据类型黑名单。忽略了Series。以下是选项:

dtypes的list-like:从结果中排除提供的数据类型。排除数字类型提交numpy.number。要排除对象列,请提交数据类型numpy.object。字符串也可以以select_dtypes(例如。df.describe(include=['O']))。要排除 pandas 分类列,请使用'category'

无(默认):结果将不排除任何内容。

返回值:

Series提供的 Series 或 DataFrame 的摘要统计信息。

注意:

对于数字数据,结果的索引将包括count,mean,std,min,max以及更低50和较高的百分位数。默认情况下,较低的百分位数是25而较高的百分位数是75。的50百分位数与中位数相同。

对于对象数据(例如字符串或时间戳记),结果的索引将包括count,unique,top和freq。的top是最常见的价值。的freq是最常见的值的频率。时间戳记还包括first和last项目。

如果多个对象值的计数最高,则count和top结果将从计数最高的那些中任意选择。

对于通过DataFrame,默认值为仅返回对数字列的分析。如果 DataFrame 仅由对象和分类数据组成,而没有任何数字列,则默认值为返回对对象和分类列的分析。如果include='all'作为选项提供,结果将包括每种类型的属性的并集。

的include和exclude参数可用于限制DataFrame分析输出。分析参数时将忽略这些参数Series。

例子:

描述一个数字Series。

>>> s = pd.Series([1, 2, 3])

>>> s.describe()

count 3.0

mean 2.0

std 1.0

min 1.0

25% 1.5

50% 2.0

75% 2.5

max 3.0

dtype:float64

描述一个分类Series。

>>> s = pd.Series(['a', 'a', 'b', 'c'])

>>> s.describe()

count 4

unique 3

top a

freq 2

dtype:object

描述时间戳Series。

>>> s = pd.Series([

... np.datetime64("2000-01-01"),

... np.datetime64("2010-01-01"),

... np.datetime64("2010-01-01")

... ])

>>> s.describe()

count 3

unique 2

top 2010-01-01 00:00:00

freq 2

first 2000-01-01 00:00:00

last 2010-01-01 00:00:00

dtype:object

描述一个DataFrame。默认情况下,仅返回数字字段。

>>> df = pd.DataFrame({'categorical': pd.Categorical(['d','e','f']),

... 'numeric': [1, 2, 3],

... 'object': ['a', 'b', 'c']

... })

>>> df.describe()

numeric

count 3.0

mean 2.0

std 1.0

min 1.0

25% 1.5

50% 2.0

75% 2.5

max 3.0

描述一个的所有列DataFrame无论数据类型如何。

>>> df.describe(include='all')

categorical numeric object

count 3 3.0 3

unique 3 NaN 3

top f NaN c

freq 1 NaN 1

mean NaN 2.0 NaN

std NaN 1.0 NaN

min NaN 1.0 NaN

25% NaN 1.5 NaN

50% NaN 2.0 NaN

75% NaN 2.5 NaN

max NaN 3.0 NaN

描述一个列DataFrame通过将其作为属性进行访问。

>>> df.numeric.describe()

count 3.0

mean 2.0

std 1.0

min 1.0

25% 1.5

50% 2.0

75% 2.5

max 3.0

Name:numeric, dtype:float64

仅在DataFrame描述。

>>> df.describe(include=[np.number])

numeric

count 3.0

mean 2.0

std 1.0

min 1.0

25% 1.5

50% 2.0

75% 2.5

max 3.0

仅在字符串中包含字符串列DataFrame描述。

>>> df.describe(include=[np.object])

object

count 3

unique 3

top c

freq 1

仅包括来自DataFrame描述。

>>> df.describe(include=['category'])

categorical

count 3

unique 3

top f

freq 1

从中排除数字列DataFrame描述。

>>> df.describe(exclude=[np.number])

categorical object

count 3 3

unique 3 3

top f c

freq 1 1

从一个对象中排除对象列DataFrame描述。

>>> df.describe(exclude=[np.object])

categorical numeric

count 3 3.0

unique 3 NaN

top f NaN

freq 1 NaN

mean NaN 2.0

std NaN 1.0

min NaN 1.0

25% NaN 1.5

50% NaN 2.0

75% NaN 2.5

max NaN 3.0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/426873.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《React Native跨平台移动应用开发》PDF电子书分享

链接: https://pan.baidu.com/s/14r6xZPJ0u1mrZejEuV8RrA 密码: pqan 分享《React Native跨平台移动应用开发》PDF电子书,本书为高清PDF电子书,内容截图如下 转载于:https://www.cnblogs.com/meidongdiluo/p/9625607.html

实例28:python

#题目:有5个人坐在一起,问第五个人多少岁?他说比第4个人大2岁。 #问第4个人岁数,他说比第3个人大2岁。问第三个人,又说比第2人大两岁。 #问第2个人,说比第一个人大两岁。最后问第一个人,他说是1…

如何使用vs2017进行html开发,VS2017开发vue单页应用

我正在学vue开发,想用VS开发一个单页应用,按照网上的提示配置好了,但是始终无法运行起来,主要有以下两点:在main.js中使用了import Vue from vue,但是实际运行时提示 import 错误无法安装npm包,…

c++语言取整为什么要加0.5_c++ 取整:四舍五入 向上取整 向下取整

AngularJS 脏检查深入分析写在开头 关于Angular脏检查,之前没有仔细学习,只是旁听道说,Angular 会定时的进行周期性数据检查,将前台和后台数据进行比较,所以非常损耗性能. 这是大错而特错的.我甚至在新浪前端面试的时 ...python安装MySQLdb驱动安装了好几次了,索性几个笔记吧,经…

实例29:python

#题目:给一个不多于5位的正整数,要求:一、求它是几位数,二、逆序打印出各位数字 #!/usr/bin/python -- coding: UTF-8 -- x int(input(“请输入一个数:\n”)) a x / 10000 b x % 10000 / 1000 c x % 1000 / 100 d x % 100…

java中的Sort函数,你值得看

基于C语言中的sort如此这么方便,自然而然,java中也有类似C的sort函数。 1.普通数组:Arrays.sort(数组名,开始位置,结束位置)。 2.类中属性排序: 模板: class A { int n; } class cmp implement …

2021届定远三中高考成绩查询,定远各中学高考喜报!

原标题:定远各中学高考喜报!关注定远2019年高考实现多项新突破本科达线人数较上年增加340人(点击看大图)砥砺前行新时代,定远教育写华章。6月23日,全县人民高度关注的2019年高考成绩揭晓。我县教体系统广大师生不负众望&#xff0…

实例30:python

#一个5位数,判断它是不是回文数。即12321是回文数, #个位与万位相同,十位与千位相同。 x int(input(‘输入一个五位数:’)) a int(x / 10000) b int(x % 10000 / 1000) c int(x % 1000 / 100) d int(x % 100 / 10) e int(x …

休眠后gpio状态_1.Linux电源管理-休眠与唤醒

1.休眠方式在内核中,休眠方式有很多种,可以通过下面命令查看常用的休眠方式有freeze,standby, mem, diskfreeze:冻结I/O设备,将它们置于低功耗状态,使处理器进入空闲状态,唤醒最快,耗电比其它standby, mem, disk方式高standby:除了冻结I/O设备外,还会暂停系统,唤醒较快,耗电比其…

变换之时钟实现

为了更好的利用学过的知识&#xff0c;扎实一下知识&#xff0c;也方便日后的复习&#xff0c;则需要做一些东西热身热身一下 以下是实现的代码&#xff1a; <!DOCTYPE html> <html><head><meta charset"UTF-8"><title></title>…

计算机用户名登陆管理员权限,关于win10勿删用户账号下管理员身份导致无法登录系统的问题...

我昨天在控制面板-用户-管理计算机内置账户&#xff0c;在“Zhao Yikang”用户名(另外还有administrator用户&#xff0c;名我没动)属性里面&#xff0c;“隶属于”那个界面里面&#xff0c;删除了administrator账户&#xff0c;同时还保留有一个user账户没动没删。之后重启电脑…

实例31:python

#题目&#xff1a;请输入星期几的第一个字母来判断一下是星期几 #!/usr/bin/python -- coding: UTF-8 -- letter input(“please input:”) #while letter ! ‘Y’: if letter ‘S’: print (‘please input second letter:’) letter input(“please input:”) if lette…

python聚类分析结果很差_python中的聚类分析:value错误:x和y的大小必须相同

我尝试了以下代码&#xff0c;但在执行时&#xff0c;显示以下错误&#xff1a;(ValueError: x and y must be the same size)代码&#xff1a;import pandas as pdimport matplotlib.pyplot as pltfrom sklearn.preprocessing import StandardScalerfrom sklearn.cluster impo…

实例32:python

#按相反的顺序输出列表的值。 #!/usr/bin/python -- coding: UTF-8 -- a [‘one’, ‘two’, ‘three’] for i in a[::-1]: print (i)

整样运用计算机考试,2017年9月计算机二级考试《MS Office高级应用》上机操作题(2)...

字处理题12012级企业管理专业的林楚楠同学选修了“供应链管理”课程&#xff0c;并撰写了题目为“供应链中的库存管理研究”的课程论文。论文的排版和参考文献还需要进一步修改&#xff0c;根据以下要求&#xff0c;帮助林楚楠对论文进行完善。(1)在考生文件夹下&#xff0c;将…

mysql search yum_CentOS 7 yum安装配置mysql

首先去官网下载要用的yum源传送门&#xff1a;http://dev.mysql.com/downloads/repo/yum/yum源文件&#xff1a;/home/mysql57-community-release-el7-8.noarch.rpm是一个rpm包&#xff0c;如果是Gnome&#xff0c;可以选择centos7的软件包安装程序安装即可。也可以用命令的方式…

Django缓存和内置信号

缓存 简单概括就是将对数据库操作查询所得到的数据放入另外一台机器上(缓存)中&#xff0c;当用户再次请求时&#xff0c;直接去缓存中拿&#xff0c;避免对数据库的频繁操作&#xff0c;加快数据的显示时间&#xff0c;需要知道的是&#xff0c;缓存里面的数据一般都设置有超时…

实例33:python

#题目&#xff1a;按逗号分隔列表。 #!/usr/bin/python -- coding: UTF-8 -- L [1,2,3,4,5] s1 ‘,’.join(str(n) for n in L) print (s1)

大工19春计算机文化基础在线测试1,大工19春《计算机文化基础》在线测试1(含答案)...

1.[单选题]第四代计算机所采用的主要逻辑元件是( )。奥鹏作业答案奥鹏大连理工大学作业A.晶体管B.小规模集成电路C.电子管D.大规模和超大规模集成电路正确答案:——D——2.[单选题]二进制数11111010所对应的十进制数是( )。A.250B.252C.253D.255正确答案:——A——3.[单选题]下…

f2 柱状图滚动 钉钉小程序_详解钉钉小程序组件之自定义模态框(弹窗封装实现)...

背景开发钉钉小程序中需要用到模态框 文档里也没有 自己搞一个…效果大概长这个样点击指定按钮&#xff0c;弹出模态框&#xff0c;里面的内容可以自定义&#xff0c;可以是简单的文字提示&#xff0c;也可以输入框等复杂布局。操作完点击取消或确定关闭。开始封装上图所示文件…