python pandas serie简介及基本使用

本篇文章主要罗列了pandas模块中serie的基本使用。环境是jupyter notebook python 3.7。

serie是能够保存任何类型数据的一维数组,轴标签统称为索引,索引必须是唯一的散列且与数据的长度相同,默认情况下为np.arange(n)。

首先是import pandas模块

import pandas as pd

1.创建一个系列series create

\space\space\space\space    a.通过python list创建serie

arr = [0, 1, 2, 3, 4]
s1 = pd.Series(arr)

结果如下 :
在这里插入图片描述

\space\space\space\space    b.创建系列时,可以自定义index索引

arr = [0, 1, 2, 3, 4]
order = [1,2,3,4,5]
s2 = pd.Series(arr, index=order)

结果如下 :
在这里插入图片描述

\space\space\space\space    c.通过numpy Ndarray 创建系列

和python list一样,使用numpy ndarray也可以创建serie,同时索引不一定需要是自然数,可以是自定义的任何确定的数字,字符串。

import numpy as np
n = np.random.randn(5) # 创建一个随机的Ndarray
index = ['a','b','c','d','e']
s3 = pd.Series(n,index=index) #索引可以不是自然数

结果如下 :
在这里插入图片描述

\space\space\space\space    d. 通过字典创建serie

d = {'a':1, 'b':2, 'c':3, 'd':4, 'e':5}
s4 = pd.Series(d)

结果如下 :
在这里插入图片描述

2.对系列进行操作 serie manipulation

\space\space\space\space    a. 改变索引

s1.index = np.array(['A','B','C','D','E'])

结果如下:
将原先的0-5索引改为ABCDE
在这里插入图片描述

\space\space\space\space    b. 对serie进行切片

使用中括号可以获取serie的一部分,注意冒号是前包含后不包含的关系,例如在下面的例子中,切片部分索引的范围是[1,4)。

s1[1:4]
#s1[:]
#s1[3:]
#s1[:3]

结果如下:
在这里插入图片描述

\space\space\space\space    c. 在serie的末尾添加另一个serie

s4 = s1.append(s3)
print(s4)

结果如下:
在这里插入图片描述

\space\space\space\space    d.丢弃serie中的某一项

s4 = s4.drop('e')
print(s4)

结果如下:
在这里插入图片描述

\space\space\space\space    e.基本运算加减乘除

arr1 = [0,1,2,3,4,5,7]
arr2 = [6,7,8,9,5]
s5 = pd.Series(arr2)
s6 = pd.Series(arr1)
s5 = s5.add(s6)
print(s5)
#s5.sub(s6)
#s5.mul(s6)
#s5.div(s6)

使用add方法会对相对应的项进行加法运算,未定义的项在进行加减乘除运算后会变为np.nan未定义。
两个serie进行加法运算的结果如下:
在这里插入图片描述
其余的基本运算与加法类似。

\space\space\space\space     f. serie的统计学属性

使用describe方法可以输出serie的统计学属性

s5.describe()

结果如下:

在这里插入图片描述

参考:
pandas入门之serie
Youtube pandas tutorial

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/386991.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux系统中nc工具那些不为人知的用法

Linux nc命令用法 参考地址&#xff1a;https://www.cnblogs.com/jjzd/p/6306273.html -g<网关>&#xff1a;设置路由器跃程通信网关&#xff0c;最多设置8个; -G<指向器数目>&#xff1a;设置来源路由指向器&#xff0c;其数值为4的倍数; -h&#xff1a;在线帮助;…

python pandas dataframe基本使用整理

dataframe是一种表格型的数据存储结构&#xff0c;可以看作是几个serie的集合。dataframe既有行索引&#xff0c;也有列索引。 以下代码环境为google colab/jupyter notebook。 接下来就对dataframe的基本使用进行整理。 dataframe也从属于pandas模块&#xff0c;因此还是老规矩…

常见开源分布式存储系统

对比说明 /文件系统 TFS FastDFS MogileFS MooseFS GlusterFS Ceph 开发语言 C C Perl C C C 开源协议 GPL V2 GPL V3 GPL GPL V3 GPL V3 LGPL 数据存储方式 块 文件/Trunk 文件 块 文件/块 对象/文件/块 集群节点通信协议 私有协议&#xff08;T…

[十二省联考2019]皮配

题目链接 选一个派系和一个阵营可以唯一确定一名导师 因为每一个阵营里的导师都分别来自不同派系&#xff0c;所以k0时&#xff0c;对阵营的选择是不影响对派系的选择的 唯一的限制就是同城市的要在同一个阵营 所以以每个城市为物品&#xff0c;物品大小为该城市的人数&#xf…

机器学习理论梳理1: PCA主成分分析

机器学习的理论部分学习知识点比较乱且杂。我这里通过几篇文章&#xff0c;简单总结一下自己对机器学习理论的理解&#xff0c;以防遗忘。第一篇文章主要概述了机器学习的基本任务以及一个常用的降维方法&#xff0c;主成分分析。 机器学习的基本任务 机器学习能实现许多不同…

29 _react-router说明

一、SPA的理解 1.单页面web应用(single page web application ,SPA) 2.整个应用只有一个完整的页面 3.点击页面中的链接不会刷新页面&#xff0c;本身也不会向服务器发请求 4.当点击路由链接时&#xff0c;只会做页面的局部更新 5.数据都需要通过ajax请求获取&#xff0c;并在前…

Java程序员如何快速理解Kubernetes

我们希望微服务是可复制的&#xff0c;可替换的工作节点&#xff0c;这样可以轻松进行升级或降级&#xff0c;同时无需任何停机时间&#xff0c;并花费最少代价的管理。我们可以说我们希望他们成为我们的小黄人&#xff08;minions&#xff09;。本文我们将通过一个简单的例子来…

NLP基础 : HMM 隐马尔可夫模型

Hidden Markov Model, HMM 隐马尔可夫模型&#xff0c;是一种描述隐性变量(状态)和显性变量(观测状态)之间关系的模型。该模型遵循两个假设&#xff0c;隐性状态i只取决于前一个隐性状态i-1&#xff0c;而与其他先前的隐形状态无关。观测状态也只取决于当前的隐形状态。因此我们…

关于秒杀系统优化方向

今天听了一节咕泡学院的公开课&#xff0c;有收获。 秒杀系统的特点&#xff1a; 1.限时&#xff1b;2.限量供应&#xff1b;3.并发量大&#xff1b;如何优化&#xff1a; 1.客户端数据缓存。 2.CDN加速。 3.nginx动静分离&#xff0c;静态资源缓存&#xff0c;负载均衡。 4.se…

Mysql插入很慢,找到了稍微快点的方法

MYSQL批量插入数据库实现语句性能分析 假定我们的表结构如下 代码如下 CREATE TABLE example ( example_id INT NOT NULL, name VARCHAR( 50 ) NOT NULL, value VARCHAR( 50 ) NOT NULL, other_value VARCHAR( 50 ) NOT NULL ) 通常情况下单条插入的sql语句我们会这么写&…

Linux - 时间相关命令 - ntpdate, date, hwclock

1. 概述 最近也不知道写啥了, 把之前的老文档整理一下, 凑个数什么的配置时间这种工作, 偶尔还是要用一下主要描述 3 个命令的简单适用 ntpdatehwlock2. ntpdate 1. 概述 用于同步时钟的命令2. 机制 通常是有一个服务器对外提供时间客户端可以与时间服务器同步ntp 是他们之间交…

RUNOOB python练习题1

用来练手的python 练习题&#xff0c;原链接 : python练习实例1 题干 : 有四个数字&#xff1a;1、2、3、4&#xff0c;能组成多少个互不相同且无重复数字的三位数&#xff1f;各是多少&#xff1f; import numpy as np cen np.array([1,2,3,4]) tens np.array([1,2,3,4])…

mysql explain用法和结果的含义

explain显示了mysql如何使用索引来处理select语句以及连接表。可以帮助选择更好的索引和写出更优化的查询语句。 使用方法&#xff0c;在select语句前加上explain就可以了&#xff1a; 如&#xff1a; explain select surname,first_name form a,b where a.idb.id EXPLAIN列…

日志模块logging用法

一、常用日志记录场景及最佳解决方案&#xff1a; 日志记录方式 最佳记录日志方案 普通情况下&#xff0c;在控制台显示输出 print() 报告正常程序操作过程中发生的事件 logging.info()(或者更详细的logging.debug()) 发出有关特定事件的警告 warnings.warn()或者loggin…

MySQL 亿级数据需求的优化思路(一),交易流水记录的查询

对MySQL的性能和亿级数据的处理方法思考&#xff0c;以及分库分表到底该如何做&#xff0c;在什么场景比较合适&#xff1f; 比如银行交易流水记录的查询 限盐少许&#xff0c;上实际实验过程&#xff0c;以下是在实验的过程中做一些操作&#xff0c;以及踩过的一些坑&#…

RUNOOB python练习题2

用来练手的python 练习题&#xff0c;原链接 : python练习实例2 题干 : 企业发放的奖金根据利润提成。利润(I)低于或等于10万元时&#xff0c;奖金可提10%&#xff1b;利润高于10万元&#xff0c;低于20万元时&#xff0c;低于10万元的部分按10%提成&#xff0c;高于10万元的…

dubbo负载均衡策略和集群容错策略

dubbo负载均衡策略 random loadbalance 默认情况下&#xff0c;dubbo是random load balance随机调用实现负载均衡&#xff0c;可以对provider不同实例设置不同的权重&#xff0c;会按照权重来负载均衡&#xff0c;权重越大分配流量越高&#xff0c;一般就用这个默认的就可以了。…

MySQL 亿级数据需求的优化思路(二),100亿数据,1万字段属性的秒级检索

最近在研究亿级数据的时候&#xff0c;无意中看到了一个关于写58同城的文章 https://blog.csdn.net/admin1973/article/details/55251499?fromtimeline 其实上面讲的versionext的方式以及压缩json的思路&#xff0c;对于我来讲都可以看得懂&#xff0c;想得通&#xff0c;其…

RUNOOB python练习题3

用来练手的python 练习题&#xff0c;原链接 : python练习实例3 拿到题目就写了如下代码&#xff0c;思路是因为使用**0.5进行开平方操作时&#xff0c;python会将数据类型自动转换为float单精度浮点型。这里利用提取其整数部分&#xff0c;来判断这个数是否是完全平方数。 z…

使用git将项目上传到github(最简单方法)

使用git将项目上传到github&#xff08;最简单方法&#xff09; 首先你需要一个github账号&#xff0c;所有还没有的话先去注册吧&#xff01; https://github.com/ 我们使用git需要先安装git工具&#xff0c;这里给出下载地址&#xff0c;下载后一路直接安装即可&#xff1…