【4】数据分析基础(pandas中的series 1)

学习目标2

pandas模块的学习。

pandas是一个基于NumPy的模块,它的功能在于数据的筛选清洗和处理,与NumPy模块相比,pandas模块更擅长处理二维数据。

pandas模块主要有Series和DataFrame两种数据结构。

接下来,我们先学习Series的相关知识:

1. Series的概念

2. 构造一个Series

3. 访问Series数据

4. Series的常用属性

安装与导入pandas

安装pandas

在使用pandas前,我们需要先安装pandas
在终端中输入代码:pip install pandas即可。
如果在自己电脑上安装不上或安装缓慢,可在命令后添加如下配置进行加速:
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple/

示例:

导入pandas

在使用pandas模块最开始,由于pandas不是Python的内置模块,我们需要在代码的开头,将pandas模块导入。
为了让其方便调用,我们通常会将其简写成pd。

导入了pandas模块,我们就可以进行数据集的操作啦。接下来, 我们先学习Series的概念和创建。

Series

定义

Series,中文叫做序列,pandas模块的一种数据类型。

是一个一维的、带索引(index)的数组对象。

目前可以先不关注代码的部分,只关注Series。

隐喻

Series,就像排行榜,可以通过有次序的名次,找到对应的玩家名字。

右侧是一个print出来的Series,它由3部分构成。
左侧是索引(index),右侧是值(values),下面是值(values)的数据类型。
一个索引对应一个值。索引和值之间,有空格隔开。

Series和字典,有一定的相似之处。

一个字典中,通过键(key),可以访问所对应的值(value)。

Series也是如此,一个Series的索引(index)在左边,值(values)在右边,可以通过左边的索引index访问到右边对应的值values。

和字典不同的是:

Series中的数据是有顺序的。

除了直接通过index访问外,还能通过0,1,2这样的位置进行访问。

Series的index是可以定义的。

如果没有定义index,index就会默认从0开始生成。

Series的值(values)可以是多种数据类型:字符串、整型、浮点型、布尔型。

一个Series在print输出时,值的数据类型会在底部,用dtype标示出来。

需要注意的是,一个Series里的所有值,数据类型都是一样的。

代码的作用

这几行代码,构造了一个Series。

第1行,导入pandas模块。

第3行和第4行,定义了两个列表。

第6行,使用pd.Series()构造函数,创建了一个Series,并赋值给了变量info。

第8行,输出info。

import pandas as pd

GDP = [80855, 77388, 68024, 47251, 40471]

city = ['GD','JS','SD','ZJ','HN']

info = pd.Series(GDP,index = city)

print(info)

代码的具体解释:

pd.Series( )

通过调用pandas模块里的Series()函数,可以构造一个Series。

import pandas as pd

GDP = [80855, 77388, 68024, 47251, 40471]

city = ['GD','JS','SD','ZJ','HN']

info = pd.Series(GDP,index = city)

print(info)

第一个常用参数:data

pd.Series()中,参数data表示需要传入的数据,可以是列表,常量,数组等。

示例中,GDP是一个列表,传入了pd.Series()函数中,列表中的元素会成为Series中的值(values)。

注意:如果不传入数据,会生成一个空的Series。

import pandas as pd

GDP = [80855, 77388, 68024, 47251, 40471]

city = ['GD','JS','SD','ZJ','HN']

info = pd.Series(GDP,index = city)

print(info)

第二个常用参数:index

参数index用于定义Series的索引(index)。

只需要将另一个列表赋值给参数index。

示例中,我们将定义的列表city赋值给参数index。

city中的值,会成为Series的index。

若不传入参数index,那么生成的Series的索引(index)就会默认从0开始生成。

需要注意:作为index的列表,和作为值的列表,元素个数需要一致,否则会报错。

import pandas as pd

GDP = [80855, 77388, 68024, 47251, 40471]

city = ['GD','JS','SD','ZJ','HN']

info = pd.Series(GDP,index = city)

print(info)

赋值的变量

将pd.Series()函数创建的Series,赋值给了info这个变量。

将info输出可以看到,它是一个Series对象。

值(values)是由列表GDP的值组成;

索引(index)是由列表city的值组成;

值(values)的数据类型是整型。

import pandas as pd

GDP = [80855, 77388, 68024, 47251, 40471]

city = ['GD','JS','SD','ZJ','HN']

info = pd.Series(GDP,index = city)

print(info)

总结:

1. 传入列表

导入pandas模块后,我们定义了两个列表GDP和rank。

我们尝试用Series构造函数,传入列表GDP作为Series的值,传入列表rank作为Series的index,赋值给变量info,并将其输出。

2. 传入数组

对于pd.Series(data,index),对参数data传入列表是最为常见的。

其实,参数data还可以传入数组。

我们尝试用Series构造函数,传入一维数组GDP作为Series的值,传入列表rank作为Series的index,赋值给变量info,并将其输出。

3. 传入常量

pd.Series(data,index)的参数data若是常量,则必须提供索引。

此时常量才能按照索引(index)的数量进行重复,并与其一一对应。

通过常量构造series的代码如下:

总结:

Series构造函数

调用pandas模块里的Series函数,用于构造一个Series。
传入一个列表作为必选参数,列表中的元素,会成为Series中的值(values)。
传入一个列表作为可选参数,列表中的元素,会成为Series中的索引(index)。如果不传入可选参数,index就会默认从0开始生成。

前面,我们了解了Series这种数据结构,学习了如何创建一个Series。

接下来,我们学习访问Series的数据的两种方式

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/889102.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

创建项目,并且上传到git

第一步 本地新建新项目 第二步 git上新建空项目 第三步 将本地项目添加为git项目 1、复制初始化命令 在新建项目中登录git 2、将本地项目设置为git项目 在IDEA中执行一下命令 3、完成上述操作,IDEA会将本地项目识别为git项目,就可以执行git commit操…

Cisco Packet Tracer | Cisco Packet Tracer - VLAN 实验 - 交换机的 VLAN 划分

关注这个工具的其它相关笔记:Cisco Packet Tracer —— 使用教程合集-CSDN博客 0x01:VLAN 划分 - 单个交换机 0x0101:拓扑搭建流程 从软件底部拖出一台交换机(笔者选择的型号是 2960 IOS15): 然后再拖出四…

ICP和EDI许可证办理审核专用的网站系统源码程序下载—专供审核易过使用

在现代互联网及电子商务企业中,ICP许可证和EDI许可证不仅是法律要求,更是企业立足市场的重要基础。这两种许可证能够帮助企业爬梳合规问题,规避法律风险,并提升自身的信誉,增强客户的信任感。本文将详细介绍ICP许可证和…

MySQL Binlog 日志监听与 Spring 集成实战

MySQL Binlog 日志监听与 Spring 集成实战 binlog的三种模式 MySQL 的二进制日志(binlog)有三种常见的格式:Statement 模式、Row 模式和Mixed 模式。每种模式的设计目标不同,适用于不同的场景,以下是它们的详细对比和…

攻防世界安卓刷题笔记(新手模式)1-4

1.基础android 进入后是这样的页面。查看源代码看看。首先要注意这个软件并没有加壳,所以我们可以直接着手分析。搜索错误提示“Failed”定位到关键代码,看样子就是检验输入的内容 注意到这里有一行关键代码,cond_39对应的正是failed那个地方…

C++核心day3作业

作业: 1.整理思维导图 2.整理课上代码 3.把课上类的三个练习题的构造函数写出来 函数全部类内声明,类外定义 定义一个矩形类Rec,包含私有属性length、width,包含公有成员方法: void set_length(int l); //设置长度v…

Scala:正则表达式

object test03 {//正则表达式def main(args: Array[String]): Unit {//定义一个正则表达式//1.[ab]:表示匹配一个字符,或者是a,或者是b//2.[a-z]:表示从a到z的26个字母中的任意一个//3.[A-Z]:表示从A到Z的26个字母中的任意一个//4.[0-9]:表示从0到9的10…

可视化建模以及UML期末复习篇----UML图

这是一篇相对较长的文章,如你们所见,比较详细,全长两万字。我不建议你们一次性看完,直接跳目录找你需要的知识点即可。 --------欢迎各位来到我UML国! 一、UML图 总共有如下几种: 用例图(Use Ca…

[创业之路-191]:《华为战略管理法-DSTE实战体系》-2-BLM战略规划与执行的基本框架

目录 一、战略规划:BLM的核心内容 1. 战略规划部分 2 战略执行部分(战略解码) 二、BLM模型对企业战略制定和执行的价值 2.1 说法1: 1、共同的目标 2、同一种语言:提高团队协作效率 3、最基本的方法 4、执行的…

go引入skywalking

前置条件:安装好jdk11,linux服务器(centos7.9),go版本(我的是1.18,1.21都可以) 1.下载skywalking Downloads | Apache SkyWalking 2.下载agent源码 Downloads | Apache SkyWalkin…

操作系统Lesson11 - 进程调度和批处理系统调度

文章目录 调度三个问题: 进程行为何时调度调度分类依据时钟中断来分类系统环境分类 调度 调度: 一个程序。 调度对象:进程和内核级线程。 1.调度程序调度P1,读取PCB块在CPU中恢复它的现场(ctx); 2.当CPU执行完了P1之…

java各种锁介绍

1. synchronized锁: • 定义:Java内置的关键字锁,用于实现线程间的同步。它可以修饰方法或代码块。 • 特性:隐式获取和释放锁,自动处理锁的粒度(方法级或代码块级),支持重入性。 •…

国产化(三):中间件——东方通TongWeb7.0

一、准备工作 1、软件包和license文件 2、检查jdk是否安装 二、安装 1、创建tongweb文件夹 我是把软件包放在了桌面,通过命令将软件包移动到指定文件夹下。 1—切换到opt文件夹 cd /opt 2—查看文件夹里的文件 ls 3—创建tongweb文件夹 sudo mkdir tongweb 4—检…

Java面试题精选:设计模式(二)

1、装饰器模式与代理模式的区别 1)代理模式(Proxy Design Pattern ) 原始定义是:让你能够提供对象的替代品或其占位符。代理控制着对于原对象的访问,并允许将请求提交给对象前后进行一些处理。 代理模式的适用场景 功能增强 当需要对一个对…

Java版-图论-最小生成树-Prim算法

实现描述 如图: Prim算法的基本思想是从一个顶点开始,逐步构建最小生成树。具体步骤如下: 随机选取一个顶点作为起始点,并将其加入最小生成树的集合中。从该顶点出发,选择一条边连接到其他未被访问的顶点中的最小权…

Linux WEB服务器的部署及优化

1.用户常用关于web的信息 1.1.什么是www www是world wide web的缩写,及万维网,也就是全球信息广播的意思。 通常说的上网就是使用www来查询用户所需要的信息。 www可以结合文字、图形、影像以及声音等多媒体,超链接的方式将信息以Internet…

【HarmonyOS学习日志(13)】计算机网络之TCP/IP协议族(二)

文章目录 TCP/IP协议族ARPDNS标志字段:协商具体的通信方式和反馈通信状态DNS查询问题的格式资源记录(Resource Record, RR)格式:被用于应答字段、授权字段和额外信息字段 IP协议IP服务的特点无状态无连接不可靠 IP头部结构IPv4头部…

Python + Playwright:集成 Applitools 进行视觉回归测试(快速入门)

集成 Applitools 进行视觉回归测试(快速入门) 简介Applitools 的核心特点Applitools 的应用场景1. 准备工作2. 获取示例项目2.1 下载示例代码2.2 安装依赖2.3 选择测试运行方式3. 代码解析3.1 测试用例示例4. 运行测试4.1 设置 Applitools API 变量4.2 设置 Applitools Eyes …

javaScript交互补充

1、元素的三大系列 1.1、offset系列 1.1.1、offset初相识 使用offset系列相关属性可以动态的得到该元素的位置(偏移)、大小等 ●获得元素距离带有定位祖先元素的位置 ●获得元素自身的大小(宽度高度) ●注意:返回的…

【Linux】-学习笔记09

第六章、nfs网络文件系统 1.nfs网络文件系统简介 NFS(Network File system,网络文件系统)是由SUN公司研制的UNIX表示层协议,它允许网络中的计算机(不同的计算机、不同的操作系统)之间通过TCP/IP网络共享资源,主要在unix系列操作系统上使用。…