python pandas serie简介及基本使用

本篇文章主要罗列了pandas模块中serie的基本使用。环境是jupyter notebook python 3.7。

serie是能够保存任何类型数据的一维数组,轴标签统称为索引,索引必须是唯一的散列且与数据的长度相同,默认情况下为np.arange(n)。

首先是import pandas模块

import pandas as pd

1.创建一个系列series create

\space\space\space\space    a.通过python list创建serie

arr = [0, 1, 2, 3, 4]
s1 = pd.Series(arr)

结果如下 :
在这里插入图片描述

\space\space\space\space    b.创建系列时,可以自定义index索引

arr = [0, 1, 2, 3, 4]
order = [1,2,3,4,5]
s2 = pd.Series(arr, index=order)

结果如下 :
在这里插入图片描述

\space\space\space\space    c.通过numpy Ndarray 创建系列

和python list一样,使用numpy ndarray也可以创建serie,同时索引不一定需要是自然数,可以是自定义的任何确定的数字,字符串。

import numpy as np
n = np.random.randn(5) # 创建一个随机的Ndarray
index = ['a','b','c','d','e']
s3 = pd.Series(n,index=index) #索引可以不是自然数

结果如下 :
在这里插入图片描述

\space\space\space\space    d. 通过字典创建serie

d = {'a':1, 'b':2, 'c':3, 'd':4, 'e':5}
s4 = pd.Series(d)

结果如下 :
在这里插入图片描述

2.对系列进行操作 serie manipulation

\space\space\space\space    a. 改变索引

s1.index = np.array(['A','B','C','D','E'])

结果如下:
将原先的0-5索引改为ABCDE
在这里插入图片描述

\space\space\space\space    b. 对serie进行切片

使用中括号可以获取serie的一部分,注意冒号是前包含后不包含的关系,例如在下面的例子中,切片部分索引的范围是[1,4)。

s1[1:4]
#s1[:]
#s1[3:]
#s1[:3]

结果如下:
在这里插入图片描述

\space\space\space\space    c. 在serie的末尾添加另一个serie

s4 = s1.append(s3)
print(s4)

结果如下:
在这里插入图片描述

\space\space\space\space    d.丢弃serie中的某一项

s4 = s4.drop('e')
print(s4)

结果如下:
在这里插入图片描述

\space\space\space\space    e.基本运算加减乘除

arr1 = [0,1,2,3,4,5,7]
arr2 = [6,7,8,9,5]
s5 = pd.Series(arr2)
s6 = pd.Series(arr1)
s5 = s5.add(s6)
print(s5)
#s5.sub(s6)
#s5.mul(s6)
#s5.div(s6)

使用add方法会对相对应的项进行加法运算,未定义的项在进行加减乘除运算后会变为np.nan未定义。
两个serie进行加法运算的结果如下:
在这里插入图片描述
其余的基本运算与加法类似。

\space\space\space\space     f. serie的统计学属性

使用describe方法可以输出serie的统计学属性

s5.describe()

结果如下:

在这里插入图片描述

参考:
pandas入门之serie
Youtube pandas tutorial

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/386991.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python pandas dataframe基本使用整理

dataframe是一种表格型的数据存储结构,可以看作是几个serie的集合。dataframe既有行索引,也有列索引。 以下代码环境为google colab/jupyter notebook。 接下来就对dataframe的基本使用进行整理。 dataframe也从属于pandas模块,因此还是老规矩…

常见开源分布式存储系统

对比说明 /文件系统 TFS FastDFS MogileFS MooseFS GlusterFS Ceph 开发语言 C C Perl C C C 开源协议 GPL V2 GPL V3 GPL GPL V3 GPL V3 LGPL 数据存储方式 块 文件/Trunk 文件 块 文件/块 对象/文件/块 集群节点通信协议 私有协议(T…

机器学习理论梳理1: PCA主成分分析

机器学习的理论部分学习知识点比较乱且杂。我这里通过几篇文章,简单总结一下自己对机器学习理论的理解,以防遗忘。第一篇文章主要概述了机器学习的基本任务以及一个常用的降维方法,主成分分析。 机器学习的基本任务 机器学习能实现许多不同…

NLP基础 : HMM 隐马尔可夫模型

Hidden Markov Model, HMM 隐马尔可夫模型,是一种描述隐性变量(状态)和显性变量(观测状态)之间关系的模型。该模型遵循两个假设,隐性状态i只取决于前一个隐性状态i-1,而与其他先前的隐形状态无关。观测状态也只取决于当前的隐形状态。因此我们…

关于秒杀系统优化方向

今天听了一节咕泡学院的公开课,有收获。 秒杀系统的特点: 1.限时;2.限量供应;3.并发量大;如何优化: 1.客户端数据缓存。 2.CDN加速。 3.nginx动静分离,静态资源缓存,负载均衡。 4.se…

RUNOOB python练习题1

用来练手的python 练习题,原链接 : python练习实例1 题干 : 有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少? import numpy as np cen np.array([1,2,3,4]) tens np.array([1,2,3,4])…

MySQL 亿级数据需求的优化思路(一),交易流水记录的查询

对MySQL的性能和亿级数据的处理方法思考,以及分库分表到底该如何做,在什么场景比较合适? 比如银行交易流水记录的查询 限盐少许,上实际实验过程,以下是在实验的过程中做一些操作,以及踩过的一些坑&#…

RUNOOB python练习题2

用来练手的python 练习题,原链接 : python练习实例2 题干 : 企业发放的奖金根据利润提成。利润(I)低于或等于10万元时,奖金可提10%;利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的…

MySQL 亿级数据需求的优化思路(二),100亿数据,1万字段属性的秒级检索

最近在研究亿级数据的时候,无意中看到了一个关于写58同城的文章 https://blog.csdn.net/admin1973/article/details/55251499?fromtimeline 其实上面讲的versionext的方式以及压缩json的思路,对于我来讲都可以看得懂,想得通,其…

RUNOOB python练习题3

用来练手的python 练习题,原链接 : python练习实例3 拿到题目就写了如下代码,思路是因为使用**0.5进行开平方操作时,python会将数据类型自动转换为float单精度浮点型。这里利用提取其整数部分,来判断这个数是否是完全平方数。 z…

使用git将项目上传到github(最简单方法)

使用git将项目上传到github(最简单方法) 首先你需要一个github账号,所有还没有的话先去注册吧! https://github.com/ 我们使用git需要先安装git工具,这里给出下载地址,下载后一路直接安装即可&#xff1…

RUNOOB python练习题4

用来练手的python习题其四, 原题链接: python练习实例4 题干: 输入某年某月某日,判断这一天是这一年的第几天? 这个题目比较简单,只需要注意闰年和非闰年的区别就可以了。我这里使用numpy矩阵存储每个月的天数,之后用…

GitHub入门:如何上传与下载工程?

由于经常要在家写代码,所以需要有个能够方便访问代码管理工具。最近尝试了一下GitHub。经过了一翻纠结之后,基本上掌握了他的使用方式。 要使用GitHub需要首先在其网站上进行注册。其官方网站是https://github.com/。注册的流程在这里就不多少了&#x…

如何解决PIP命令不可用

今天想用PIP装一个python包,发现PIP报错,不是内部或外部命令。。。 遇事百度,有两种说法,一,没安装包,不管那么多命令执行了再说 在命令行输入:python -m ensurepip 将pip.exe文件下载下来 再pi…

RUNOOB python练习题5

用来练手的python 练习题其五,原链接 : python练习实例5 题干 : 输入三个整数x,y,z,请把这三个数由小到大输出。 又是非常简单的排序算法,只要使用numpy矩阵的排序方法或者使用python list的排序算法就可以轻松解决。 源代码如下 : import …

初步使用github,并上传下载文件

使用GitHub需要先注册GitHub的账号,登陆进去 然后开始创建项目 start a project 创建完成,开始生成公私钥,可以不必每次都要输密码 ssh-keygen -t rsa -C "mghxy123163.com" //填写email地址,然后一直“回车”ok 然后把公钥导入GitHub中的key里面去,也…

NOIP2000提高组复赛C 单词接龙

题目链接:https://ac.nowcoder.com/acm/contest/248/C 题目大意: 略 分析: 注意点:1.前缀和后缀的公共部分应该选最短的。2.如果两个字符串前缀和后缀的公共部分恰好是其中一个字符串,那么这两个字符串不能合并。 代码…

右键Git Bash Here不见了怎么办,手把手教你还原!

第一步,window R,输入regedit回车进入注册表 依次进入HKEY_CLASSES_ROOT —-》 Directory —-》Background —-》 shell 右键点击shell,选择新建,然后选择项,命名为 Git Bash Here,成功后进入桌面右键发现…

RUNOOB python练习题6 斐波那契数列

用来练手的python 练习题其六,原链接 : python练习实例6 题干 : 斐波那契数列 斐波那契数列可以说是很好的递归理解工具了,这里就用递归实现一下斐波那契数列。 源代码如下: # 返回fibonacci数列中某一项的数值 def Fibonacci(n):if n 1:return 1eli…

github windows客户端

方法/步骤 1 1. 首先到官网下载Github客户端 2 2. 点击上图红框的按钮开始下载客户端。 3 3. 双击下载好的客户端,开始安装。 4 双击之后出现一个框 5 之后等待一段时间,出现一个在线下载界面 6 4. 在线下载完成之后开始进行安装。安装完成之后…