Pandas 33个冷知识 0721

Pandas 33个冷知识

  1. 从Excel读取数据: 使用 pd.read_excel('file.xlsx') 来读取Excel文件。

  2. 写入Excel: 使用 df.to_excel('file.xlsx', index=False) 将DataFrame写入Excel文件。

  3. 创建日期索引: 使用 df.set_index(pd.to_datetime(df['date'])) 创建日期索引。

  4. 向后填充缺失值: 使用 df.fillna(method='bfill') 向后填充缺失值。

  5. 按索引选取多行: 使用 df.loc[[1, 2, 5]] 按索引选取多行。

  6. 按位置选取多行: 使用 df.iloc[[0, 2, 4]] 按位置选取多行。

  7. 创建空Series: 使用 pd.Series(dtype='float64') 创建一个空Series。

  8. 重置列顺序: 使用 df = df[['col2', 'col1']] 重新排列DataFrame的列顺序。

  9. 按多列排序: 使用 df.sort_values(by=['col1', 'col2'], ascending=[True, False]) 按多列排序。

  10. 按列查找最大值的行: 使用 df.loc[df['col'].idxmax()] 查找列中最大值所在的行。

  11. 按列查找最小值的行: 使用 df.loc[df['col'].idxmin()] 查找列中最小值所在的行。

  12. 按条件删除行: 使用 df.drop(df[df['col'] < 10].index) 按条件删除行。

  13. 按条件更新值: 使用 df.loc[df['col'] < 10, 'col'] = 10 按条件更新值。

  14. 按列计算累计最大值: 使用 df['cummax'] = df['col'].cummax() 计算列的累计最大值。

  15. 按列计算累计最小值: 使用 df['cummin'] = df['col'].cummin() 计算列的累计最小值。

  16. 按列计算累计乘积: 使用 df['cumprod'] = df['col'].cumprod() 计算列的累计乘积。

  17. 计算百分比变化: 使用 df['pct_change'] = df['col'].pct_change() 计算列的百分比变化。

  18. 滚动窗口最大值: 使用 df['rolling_max'] = df['col'].rolling(window=3).max() 计算滚动窗口最大值。

  19. 滚动窗口最小值: 使用 df['rolling_min'] = df['col'].rolling(window=3).min() 计算滚动窗口最小值。

  20. 检测重复值: 使用 df.duplicated() 检测重复值。

  21. 删除所有重复值: 使用 df.drop_duplicates() 删除所有重复值。

  22. 替换值中的空字符串: 使用 df.replace('', np.nan, inplace=True) 替换值中的空字符串。

  23. 数据透视表(多值): 使用 pd.pivot_table(df, values=['val1', 'val2'], index='col1', columns='col2') 创建数据透视表。

  24. 分组并计算自定义函数: 使用 df.groupby('col').apply(lambda x: x.max() - x.min()) 进行分组并计算自定义函数。

  25. 扩展列表到多行: 使用 df.explode('col') 将列表扩展到多行。

  26. 按列计算频率表: 使用 pd.crosstab(df['col1'], df['col2']) 计算频率表。

  27. 将列名改为小写: 使用 df.columns = df.columns.str.lower() 将所有列名改为小写。

  28. 将列名改为大写: 使用 df.columns = df.columns.str.upper() 将所有列名改为大写。

  29. 按列值绘制直方图: 使用 df['col'].hist() 绘制列值的直方图。

  30. 按列值绘制密度图: 使用 df['col'].plot(kind='kde') 绘制列值的密度图。

  31. 按列值绘制箱线图: 使用 df.boxplot(column='col') 绘制列值的箱线图。

  32. 按列值绘制散点图: 使用 df.plot.scatter(x='col1', y='col2') 绘制列值的散点图。

  33. 数据框列值字符串替换: 使用 df['col'].str.replace('old', 'new') 替换列中的字符串。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/47341.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【深入理解SpringCloud微服务】浅析微服务注册中心Eureka与nacos,手写实现一个微服务注册中心

【深入理解SpringCloud微服务】浅析微服务注册中心Eureka与nacos&#xff0c;手写实现一个微服务注册中心 注册中心手写实现一个注册中心服务端设计客户端设计 注册中心 注册中心是微服务体系里面非常重要的一个核心组件&#xff0c;它最重要的作用就是实现服务注册与发现。 …

【MyBatisPlus】快速掌握MP插件使用方法

一、MyBatis-Plus简介 1.1 简介 1.2 特性 无侵入&#xff1a;只做增强不做改变&#xff0c;引入它不会对现有工程产生影响&#xff0c;如丝般顺滑损耗小&#xff1a;启动即会自动注入基本 CURD&#xff0c;性能基本无损耗&#xff0c;直接面向对象操作强大的 CRUD 操作&#x…

【ACM独立出版|EI检索稳定】2024年智能感知与模式识别国际学术会议(ISPC 2024,9月6日-8)

2024年智能感知与模式识别国际学术会议 (ISPC 2024)将于2024年9月6日-8日于中国青岛召开。 会议将围绕智能感知与模式识别等领域中的最新研究成果&#xff0c;为来自国内外高等院校、科学研究所、企事业单位的专家、教授、学者、工程师等提供一个分享专业经验&#xff0c;扩大…

初谈Linux信号-=-信号的产生

文章目录 概述从生活角度理解信号Linux中信号信号常见的处理方式理解信号的发送与保存 信号的产生core、term区别 概述 从生活角度理解信号 你在网上买了很多件商品&#xff0c;再等待不同商品快递的到来。但即便快递没有到来&#xff0c;你也知道快递来临时&#xff0c; 你该…

机械臂泡水维修|机器人雨后进水维修措施

如果机器人不慎被水淹&#xff0c;别慌&#xff01;我们为你准备了一份紧急的机械臂泡水维修抢修指南&#xff0c;帮助你解决这个问题。 【机器人浸水被淹后紧急维修抢修&#xff5c;如何处理&#xff1f;】 机械臂被淹进水后维修处理方式 1. 机械手淹水后断电断网 首先&am…

Redis 深度历险:核心原理与应用实践 - 读书笔记

目录 第一章 基础应用篇Zset并发问题 - 分布式锁再谈分布式锁客户端在请求时加锁失败策略redis异步队列位图Hyperloglog布隆过滤器GeoHashscan 命令字典结构rehash扩容大 key 扫描 第二章 原理篇线程IO模型RESP 序列化协议持久化管道事务PubSub内存管理 第三章 集群篇CAP主从同…

Grid Puzzle

可以看看官方题解&#xff0c;说一下我的赛时做法 肯定操作二看起来都要优秀得多 不难发现&#xff0c;相邻两行不可能放两个及以上操作一&#xff0c;否则的话直接用两个操作二替代 利用数学归纳法考虑&#xff0c;对于第一行&#xff0c;我们要么用操作二&#xff0c;然后…

shell脚本教程学习

Bash 是 Linux 和 Mac 的默认 Shell&#xff08;命令行环境&#xff09;&#xff0c;系统管理和服务器开发都需要用。 echo命令 echo作用是在屏幕上输入一行文本&#xff0c;可以将该命令的参数输出。一般样式 $ echo "<HTML><HEAD><TITLE>Page Titl…

spring整合mybatis,junit纯注解开发(包括连接druid报错的所有解决方法)

目录 Spring整合mybatis开发步骤 第一步&#xff1a;创建我们的数据表 第二步&#xff1a;编写对应的实体类 第三步&#xff1a;在pom.xml中导入我们所需要的坐标 spring所依赖的坐标 mybatis所依赖的坐标 druid数据源坐标 数据库驱动依赖 第四步&#xff1a;编写SpringC…

Random,ThreadLocalRandom,SecureRandom有什么区别

private final Random randomnew Random(); Make sure that using this pseudorandom number generator is safe here. sonar给出的提示&#xff0c;应该如何修改代码? 根据Sonar的提示&#xff0c;为了确保在多线程环境下使用Random是安全的&#xff0c;您可以使用ThreadL…

linux在ssh的时候询问,yes or no 如何关闭

解决&#xff1a; 在~/.ssh/config文件中添加如下配置项&#xff1a; Host *StrictHostKeyChecking no

数据可视化配色新工具,颜色盘多达2500+类

好看的配色,不仅能让图表突出主要信息,更能吸引读者,之前分享过很多配色工具,例如, 👉可视化配色工具:颜色盘多达3000+类,数万种颜色! 本次再分享一个配色工具pypalettes,颜色盘多达2500+类。 安装pypalettes pip install pypalettes pypalettes使用 第1步,挑选…

Java 语言及其常用集合类的操作,以及反射机制与注解

目录 一、Java 语言概述 二、Java 集合框架 ArrayList 操作示例&#xff1a; HashMap 操作示例&#xff1a; 三、反射机制 1. 反射的示例 五、总结 Java 是一种广泛使用的高级编程语言&#xff0c;因其平台独立性、简洁性及丰富的 API 而备受开发者青睐。 一、Java 语言…

【LeetCode】分隔链表

目录 一、题目二、解法完整代码 一、题目 给你一个链表的头节点 head 和一个特定值 x &#xff0c;请你对链表进行分隔&#xff0c;使得所有 小于 x 的节点都出现在 大于或等于 x 的节点之前。 你应当 保留 两个分区中每个节点的初始相对位置。 示例 1&#xff1a; 输入&a…

JVM中的GC流程与对象晋升机制

JVM中的GC流程与对象晋升机制 1、JVM堆内存结构2、Minor GC流程3、Full GC流程4、总结 &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&#x1f496; 在Java虚拟机&#xff08;JVM&#xff09;中&#xff0c;垃圾回收&#xff08;GC&#xff09;是自动管…

VTK源码分析:Type System

作为一款开源跨平台的数据可视化代码库&#xff0c;VTK以其清晰的流水线工作方式、丰富的后处理算法、异种渲染/交互方式&#xff0c;而被众多CAx软件选作后处理实施方案。而异种渲染/交互方式的实现&#xff0c;主要是倚重于VTK的类型系统&#xff0c;因此&#xff0c;有必要对…

最新 Docker 下载镜像超时解决方案:Docker proxy

现在Docker换源也下载失败太常见了&#xff0c;至于原因&#xff0c;大家懂得都懂。本文提供一种简洁的方案&#xff0c; 利用 Docker 的http-proxy&#xff0c;代理至本机的 proxy。 文章目录 前言Docker proxy 前言 这里默认你会安装 clash&#xff0c;然后有配置和数据库。…

排序算法

排序算法 内部排序&#xff1a;指将需要处理的所有数据都加载到内部存储器中进行排序 外部排序&#xff1a;数据量过大&#xff0c;无法全部加载到内存中&#xff0c;需要借助外部存储进行排序 算法的时间复杂度 一个算法花费的时间与算法中语句的执行次数成正比&#xff0c;…

Unity XR Interaction Toolkit(VR、AR交互工具包)记录安装到开发的流程,以及遇到的常见问题(一)!

提示&#xff1a;文章有错误的地方&#xff0c;还望诸位大神不吝指教&#xff01; 文章目录 前言一、XR Interaction Toolkit是什么&#xff1f;二、跨平台交互三、 AR 功能四、XR Interaction Toolkit的特点五、XR Interaction Toolkit 示例总结 前言 随着VR行业的发展&#…

7.21 复习数据结构相关知识【主链表】

顺序表 链表 栈 队列之间的关系 顺序表&#xff1a;array list---->基于数组实现的线性表&#xff0c;元素在内存中是连续存储的。链表&#xff1a;linked list ---->通过指针将一系列节点连接起来的线性表 单链表&#xff1a;next指针双链表&#xff1a;priornext指针 …