Python数据处理 ——展现Pandas 的强大

一、简介

Pandas是一个基于NumPy的分析结构化数据的工具集,NumPy为其提供了高性能的数据处理能力。Pandas被普遍用于数据挖掘和数据分析,同时也提供数据清洗、数据I/O、数据可视化等辅助功能。Pandas不仅简洁,还拥有出众的数据处理能力和完备的辅助功能。归纳起来,Pandas有以下5大特点。

  • 具有极强的自适应能力。无论是Python还是NumPy的数据对象,即使是结构不规则的数据也可以轻松转换为DataFrame。Pandas还可以自动处理缺失数据,类似NumPy的掩码数组。
  • NumPy为其提供了快速的数据组织和处理能力。Pandas支持任意增删数据列,支持合并、连接、重塑、透视数据集,支持聚合、转换、切片、花式索引、子集分解等操作。
  • 完善的时间序列。Pandas支持日期范围生成、频率转换、移动窗口统计、移动窗口线性回归、日期位移等时间序列功能。
  • 拥有全面的I/O工具。Pandas支持读取文本文件(CSV等支持分隔符的文件)、Excel文件、HDF文件、SQL表数据、json数据、html数据,甚至可以直接从url下载并解析数据,也可以将数据保存为CSV文件或Excel文件。
  • 对用户友好的显示格式。不管数据复杂程度如何,Pandas展现出的数据结构总是最清晰的,它支持自动对齐对象和标签,必要时也可以忽略标签。

二、Series与 DataFrame的介绍

  • 1.1 第一件事,导入所需的扩展库:NumPy 和 Pandas
import numpy as np
print(np.__version__)   # 查看NumPy版本
import pandas as pd
print(pd.__version__)   # 查看Pandas版本
  • 1.2 使用Pandas读取csv文件,了解Pandas的数据结构: DataFrame 和 Series
df = pd.read_csv(r'./data/scores.csv', encoding = 'gbk')  # .data
df
  • 注:以上代码构建了一个带标签的二维数据表格。总分、学号、性别、操作系统、算法分析与设计、数据仓库与挖掘技术、平均分是每列数据的标签,所有列的标签称为列名;0-19是每一行数据的标签,所有行的标签称为索引。这个带标签的二维数据表格就是Pandas最核心的数据结构DataFrame,所有关于Pandas的操作和技巧几乎都是围绕着DataFrame这个结构进行的。
  • Series是由一组同一类型的数据和一组与数据对应的标签(Index)组成的数据结构,这个标签又称为索引,索引是允许重复的。Pandas提供了多种生成Series的方式。简言之,Series就是带标签的一维数组。
  • 默认索引是从0开始的整型序列,也可以指定索引。如下所示:
pd.Series([1,2,3])   # 默认索引
pd.Series([1,2,3],index = [2020, 2021, 2022])   #指定索引
pd.Series([1,2,3],index = [2020, 2020, 2022])   #指定索引

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/599124.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

DevOps(3)

目录 11.描述root账户? 12.如何在发出命令时打开命令提示符? 14.Linux系统下交换分区的典型大小是多少? 15.什么是符号链接? 11.描述root账户? root账户就像一个系统管理员账户,允许你完全控制系统。 …

经常戴耳机有什么危害呢?一文读懂长时间使用耳机都有哪些危害

经常佩戴耳机可能会出现滋生细菌、引起炎症反应、损伤听力等危害。 1、滋生细菌:长时间戴耳机,会导致耳道堵塞,从而导致耳内潮湿,容易滋生细菌。 2、引起炎症反应:长时间戴耳机,会对耳道口造成机械性的压…

多线程和JVM

一,多线程实现的四种方式 1. 实现Runnable接口 普通实现: public class MyRunnable implements Runnable {Overridepublic void run() {System.out.println("线程执行中...");} }public class Main {public static void main(String[] arg…

采用intellij idea作为IDE的java项目由于*.iml文件导致无法编译问题

将项目中所有的iml文件删除,然后idea重新打开项目、编译,问题解决。 从git上将spring boot项目下载,用intellij idea打开,结果无法编译,提示“程序包com.fasterxml.jackson.core不存在”。编译来编译去,又…

口语化描述Maven的依赖范围(scope),简略不详细

文章目录 一、compile(默认范围)二、test(用于测试)三、provide四、import(用来管理依赖版本)五、system六、runtime版本仲裁 一、compile(默认范围) 范围最大哪里都能用 二、test…

vmware workstation的三种网络模式通俗理解

一、前言 workstations想必很多童鞋都在用,经常会用来在本机创建不同的虚拟机来做各种测试,那么对于它支持的网络模式,在不同的测试场景下应该用哪种网络模式,你需要做下了解,以便可以愉快的继续测(搬&…

全年重磅!《2023年度TikTok电商行业趋势白皮书》发布!

2023年,似乎所有的东西都往相反的方向发展。疫情消退后经济没有明朗,局部冲突愈演愈烈没有消停,打工人辛苦工作工资没有涨,疯狂买买买的双十一也开始变得冷清... 似乎是不友好的一年,那你有听到“增长的声音”吗&…

uniCloud 云函数

相对于云函数,官方更推荐使用 云对象 新建云函数 编辑云函数 uniCloud-aliyun/cloudfunctions/hello_func/index.js use strict; exports.main async (event, context) > {let {name} eventreturn 你好,${name}! };云函数接收的参数从event中解构获…

ARM+FPGA多通道信号采集与处理模块开发方案

多通道信号采集与处理模块开发方案 开发一套多通道光电信号采集与处理模块,实现对64通道传感信号采集、处理与存储功能。主要包括数据采集与处理电路,系统控制软件,信号处理算法实现及数据存储。其中包括8通道ADC,每一路ADC采样数…

【PostgreSQL】约束-排他约束

【PostgreSQL】约束链接 检查 唯一 主键 外键 排他 排他约束 排他约束是一种数据库约束,用于确保某一列或多个列中的值在每一条记录中都是唯一的。这意味着任何两条记录都不能具有相同的值。 排他约束可以在数据库中创建唯一索引或唯一约束来实现。当尝试插入或更…

CTFHub | 存储型

0x00 前言 CTFHub 专注网络安全、信息安全、白帽子技术的在线学习,实训平台。提供优质的赛事及学习服务,拥有完善的题目环境及配套 writeup ,降低 CTF 学习入门门槛,快速帮助选手成长,跟随主流比赛潮流。 0x01 题目描述…

SQLServer性能优化分析--执行计划、耗时SQL排查和死锁处理

目录 1 常用系统存储过程2 查看执行计划3 查看磁盘使用率(STATISTICS IO)4 查询时间耗时较长的语句5 死锁处理 1 常用系统存储过程 1.1 查询表结构 EXEC sp_columns your_table, column_name table_column1.2 查询表索引 EXEC sp_helpindex your_tab…

linux usb 驱动之创urb的创建和销毁

struct urb 结构在驱动中必须不被静态创建, 或者在另一个结构中, 因为这可能破坏 USB 核心给 urb 使用的引用计数方法. 它必须使用对 usb_alloc_urb 函数的调用而被创 建. 这个函数有这个原型: struct urb *usb_alloc_urb(int iso_packets, int mem_flags); 第一个参数, iso_pa…

js逆向第9例:猿人学第2题-js混淆-动态cookie1

题目2:提取全部5页发布日热度的值,计算所有值的加和,并提交答案 (感谢蔡老板为本题提供混淆方案) 既然题目已经给出了cookie问题,那就从cookie入手,控制台找到数据请求地址 可以看到如下加密字符串m类似md5,后面跟着时间戳 m=45cc41dcdb15159ebb50564635f8e362|1704301…

偌依 项目部署及上线步骤

准备实验环境,准备3台机器 1.作为前端服务器,mysql,redis服务器--同时临时作为代码打包服务器 192.168.2.65 nginx-server 2.作为后端服务器 192.168.2.66 java-server-1 192.168.2.67 java-server-2 安装nginx/mysql #安装nginx [rootweb-nginx ~]…

智能视频监控技术在旅游业中如何发挥最大作用,助力旅游业发展

随着“南方小土豆勇闯哈尔滨”的词条霸榜热搜,大众旅游热情再次点燃。最近哈尔滨游客爆满的情况,极易发生游客迷路、景区瘫痪、交通堵塞等情况,当地有关部门的压力不言而喻。对于节假日或者“破天富贵”、“报复性旅游”的情况,景…

webrtc报文记录

tcp.port 10443 || tcp.port 6080 || udp.port 8000 https://download.csdn.net/download/dualvencsdn/88706745

如何使用ArcGIS Pro转换单个点坐标

坐标转换作为基础的功能,一般的GIS软件都支持,大多数情况下,我们是转换整个图层,如果想要转换单个坐标点,在ArcGIS Pro内也是支持的,这里为大家介绍一下转换方法,希望能对你有所帮助。 拾取坐标…

trino 433 开启密码验证

什么要开启密码验证 因为不加密的话,所有人都可以查询所配置的数据库 摘要 采用最简单的账号密码认证。 准备 trino 已经开启了https。trino 开启httpspassword.db。用户密码文件,一行就是一个用户名密码,用户密码用:隔开,比…

AUTOSAR系统服务篇-WdgM

文章目录 简介受监督的实体和校验点监督机制的交互监督函数存活监督(Alive Supervision)死线监督逻辑监督看门狗处理错误处理受监督实体中的错误处理硬件狗复位立即MCU复位术语功能详述监督功能的交互综述本地监督状态