pandas 合并所有列_图解Python表格操作包Pandas

328d15dd9cdfd118fa0d88ae5cc23a64.png

Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。经过多年不懈的努力,Pandas 离这个目标已经越来越近了。

下面对pandas常用的功能进行一个可视化的介绍,希望能让大家更容易理解和学习pandas。

1、Series序列

系列(Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引。

3ee10d05899e2dee6d0346d263a2ea3a.png

2、从ndarray创建一个系列

如果数据是ndarray,则传递的索引必须具有相同的长度。如果没有传递索引值,那么默认的索引将是范围(n),其中n是数组长度,即[0,1,2,3…. range(len(array))-1] - 1]。

09eaf16383e5272ad11ea8e5efcc1b4e.png

3、从字典创建一个系列

字典(dict)可以作为输入传递,如果没有指定索引,则按排序顺序取得字典键以构造索引。如果传递了索引,索引中与标签对应的数据中的值将被拉出。

2fc546a3b50e532c27008f62a842b27a.png

4、序列数据的访问

通过各种方式访问Series数据,系列中的数据可以使用类似于访问numpy中的ndarray中的数据来访问。

d14329dc32a908ba40e1bff8651ee444.png

5、序列的聚合统计

Series有很多的聚会函数,可以方便的统计最大值、求和、平均值等

3c6f35be7c855d48fdd93cf3a005e76c.png

6、DataFrame(数据帧)

DataFrame是带有标签的二维数据结构,列的类型可能不同。你可以把它想象成一个电子表格或SQL表,或者 Series 对象的字典。它一般是最常用的pandas对象。

c8fa52fde5bec3ebdfcb0c0f009f8585.png

9761783c552c2f9ccb34db1b571fe8d2.png

7、从列表创建DataFrame

从列表中很方便的创建一个DataFrame,默认行列索引从0开始。

da639c4fcf14317fc9294d8786898af8.png

8、从字典创建DataFrame

从字典创建DataFrame,自动按照字典进行列索引,行索引从0开始。

c94eb11ac0144b725b2484142e888f79.png

9、列选择

在刚学Pandas时,行选择和列选择非常容易混淆,在这里进行一下整理常用的列选择。

b0d09e117a0f7e9de0b0c15eb6af6367.png

10、行选择

整理多种行选择的方法,总有一种适合你的。

d3c0ec5e06622325c8495f1bdba1e61a.png

17f63f5b99150e40523ec1217c7020d3.png

f649af8f0d44fce1e3abca153c1c6a09.png

11、返回指定行列

pandas的DataFrame非常方便的提取数据框内的数据。

2d292e9917928d5afe128faa94c75e9d.png

12、条件查询

对各类数值型、文本型,单条件和多条件进行行选择

b6c8d2d752e53985d45d52e52d73995c.png

cfc324a09330e0f645adce989ae27bfa.png

13、聚合

可以按行、列进行聚合,也可以用pandas内置的describe对数据进行操作简单而又全面的数据聚合分析。

2d3041d7863e7fede0aff0bebc93e979.png

f89a372f1dcc78c78df5b3afad5ea07e.png

14、聚合函数

data.function(axis=0) 按列计算

data.function(axis=1) 按行计算

dd12eadd98bce86e871363419a35c867.png

15、分类汇总

可以按照指定的多列进行指定的多个运算进行汇总。

a9e40aa8d5de369241d1f530adc03e4a.png

16、透视表

透视表是pandas的一个强大的操作,大量的参数完全能满足你个性化的需求。

24741f1386e1dd1d86b25e3f8c0e07e1.png

17、处理缺失值

pandas对缺失值有多种处理办法,满足各类需求。

f7d9d40c1159e8e8d669a315a0a421b1.png

18、查找替换

pandas提供简单的查找替换功能,如果要复杂的查找替换,可以使用map(), apply()和applymap() 

c9ce0b361b3191a6add0d149ba702962.png

19、数据合并

两个DataFrame的合并,pandas会自动按照索引对齐,可以指定两个DataFrame的对齐方式,如内连接外连接等,也可以指定对齐的索引列。

f5f29168e37b7b8ceb79875795afbf1c.png

20、更改列名(columns index)

更改列名我认为pandas并不是很方便,但我也没有想到一个好的方案。

7012027bbc8ea0f5fdbcf4a47bfe5df2.png

21、apply函数

这是pandas的一个强大的函数,可以针对每一个记录进行单值运算而不需要像其他语言一样循环处理。

fce2a485925698b2a3fc758eeb83ed13.png

71e8b40cda50de96797db8d160b6e7f7.png

37ef67d998e88fd4657e69ab690c113b.png

如需联系EasyShu团队

请加微信:EasyCharts

微信公众号【EasyShu】博文代码集合地址

https://github.com/Easy-Shu/EasyShu-WeChat

数据可视化之美系列书籍

3b4a4861164816dc7e73438d15c62f11.png

《Python数据可视化之美》-配套源代码下载地址

Github

https://github.com/Easy-Shu/Beautiful-Visualization-with-python

《R语言数据可视化之美》-增强版配套源代码下载地址

Github

https://github.com/Easy-Shu/Beautiful-Visualization-with-R

e99c1a33206cd95705a0eebf7de79068.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/409350.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android ndk gcc,Android NDK GCC似乎是铿锵的 - 它应该是这样吗?

刚刚下载的NDK在链接旧项目时失败:/usr/bin/ld: unrecognised emulation mode: armelf_linux_eabi看来,clang隐藏在gcc的面具后面:/opt/android-ndk-r18b/toolchains/arm-linux-androideabi-4.9/prebuilt/linux-x86_64/bin/arm-linux-androideabi-gcc --versionAndroid (475164…

三年的php简历_PHP程序员个人简历

PHP程序员个人简历2003/10—现在:***公司所属行业:计算机软件*&*银沙网站PHP程序员主要职责:能独立应用PHPMySQL进行网站开发,合理的应用PHPMVC模式,并使用Smarty或使用自制的.类似Smarty缓冲机制的模版引擎。了解…

VC小技巧(网上搜的)

一、打开CD-ROM mciSendString("Set cdAudio door open wait",NULL,0,NULL); 二、关闭CD_ROM mciSendString("Set cdAudio door closed wait",NULL,0,NULL); 三、关闭计算机 OSVERSIONINFO OsVersionInfo; //包含操作系统版本信息的数据结构 OsVersionInfo…

html下划线 下移,css如何实现下划线滑动效果

本文主要讲述两种下划线动效效果,第一种悬停时X轴由内向外展开实现动画效果,第二种为左右自动展示,由左向右,或由右向左。实现的主要效果是利用伪类标签,以及hover,利用transfromm trition实现动画效果。x轴由内向外展…

已知网友建立html,职称计算机模拟试题:Dreamweaver网页设计模拟试题及答案(5)...

52、在使用时间链时,用“Record Path of Layer”命令记录层的路径,关于关键点的说法正确的是(CD)A、用户拖动层的速度越快,则划分出的关键点越多B、用户拖动层的速度越快,则划分出的关键点越少C、用户可以通过改变拖动的速度来变更…

r语言 将表格导出为csv_如何将R语言中表格数据输出为Excel文件.pdf

如何将R 语言中的表格数据输出为Excel 文件熊荣川六盘水师范学院生物信息学实验室xiongrongchuan126.com/u/Bearjazz平台的开放性使得R 语言具有了丰富的运算功能,使得一些表格数据不能在Excel 中实现的运算(或是较为繁琐的运算)可以在导入R 语言之后得到快速而容易…

安装Ecshop首页出现报错:Only variables should be passed by referen

出现下面这就话: Strict Standards: Only variables should be passed by reference in E:\Tools\ECShop_V2.7.3_UTF8_release1106\upload\includes\cls_template.phpon line 418第418行:$tag_sel array_shift(explode( , $tag)); 解决办法 1 5.3以上版…

html设计网页技巧,网页设计技巧:网页表格设计技巧总结

一个好的表格应该以易于理解,简单明了的方式传递大量的信息。真正的重点应该 放在信息上, 对表格的过度设计会抵消这种作用。从另一方面来说,巧妙的设计不仅可以使一个表格更具吸引力, 而且可以增加可读性。表格信息通常是很乏味的…

multi task训练torch_手把手教你使用PyTorch(2)-requires_gradamp;computation graph

import torch1. Requires_grad但是,模型毕竟不是人,它的智力水平还不足够去自主辨识那些量的梯度需要计算,既然如此,就需要手动对其进行标记。在PyTorch中,通用的数据结构tensor包含一个attributerequires_grad&#x…

【原】unity shader(3)反射贴图

改编自《cg教程--可编程实时图形学权威指南》上的demo。 反射向量计算公式 RI-2N(N*I) 备注N*I是点乘 I入射光线,N法向量 函数实现: float3 reflect(float3 I,float3 N) { return I-2.0*N*dot(N,I); } Shader "CG shader Reflect"{Propertie…

分时技术用户可以独占计算机资源,计算机基础第二章选择题(带答案修改版 )校过...

一,选择题(选择最确切的一个答案,将其代码填入括号中)1、操作系统是一种( ).A, 应用软件 B, 系统软件 C, 通用软件 D, 工具软件2、计算机系统的组成包括( ).A,程序和数据 B,处理器和内存 C,计算机硬件和计算机软件 D,处理器,存储器和外围设备3、下面关于计算机软件的描述正确的…

div显示在上层_DIV重叠 如何优先显示(div浮在重叠的div上面)

如果有2个div有重叠,默认是根据html解析顺序,最后加载的优先级最高(浮在最上面)。问题:如果想把前面加载的div显示在最上面?关键字:z-index举例:--原来的页面:first div是被second div盖住了&am…

计算机专业英语的时态特点,英语时态表的学习与整理

学习英语必须要了解英语的各种时态,不了解时态会说话时闹出笑话,也会引出歧义,做题的时候也会出错。所以英语的时态一定要分清也要记牢,无论什么时候运用英语的时候都不要忘记。现在就和沪江小编一起了解了解吧!英语时态表 时态名…

el replace 表达式_EL表达式运算符、常用函数详解

运算符&#xff1a;1.算术运算符有五个&#xff1a;、-、*或$、/或div、%或mod2.关系运算符有六个&#xff1a;或eq、!或ne、或gt、<或le、>或ge3.逻辑运算符有三个&#xff1a;&&或and、||或or、!或not4.其它运算符有三个&#xff1a;Empty运算符、条件运算符、…