Python基础之pandas:字符串操作与透视表

文章目录

  • 一、字符串操作
      • 备注:如果想要全部行都能输出,可输入如下代码
    • 1、字符检索
    • 2、字符转换
    • 3、字符类型判断
    • 4、字符调整
    • 5、字符对齐与填充
    • 6、字符检索
    • 7、字符切割
    • 8、字符整理
  • 二、透视表
    • 1、pd.pivot_table
    • 2、多级透视表

一、字符串操作

备注:如果想要全部行都能输出,可输入如下代码

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity='all'

在这里插入图片描述
Series中的字符串如果包含缺失值,最快的处理办法是pandas字符串操作方法
在这里插入图片描述

1、字符检索

  • find()返回字符串第一次出现的位置,如果没有匹配项则返回 -1
  • rfind()返回字符串最后一次出现的位置,如果没有匹配项则返回 -1
    在这里插入图片描述

2、字符转换

  • lower():全部转为小写
  • upper():全部转为大写
  • title:将每个单词的第一个字符转换为大写和保持小写。
  • capitalize():将第一个字符转换为大写字母保持小写。
  • swapcase() :将大写转换为小写,小写转换为大写。
  • translate():字符串转换
    在这里插入图片描述
    在这里插入图片描述

3、字符类型判断

  • islower():是否小写
  • isupper():是否大写
  • isnumeric():是否数字或数字字符串
  • isalnum()是否为字母或数字
  • isdecimal()是否字符串中的所有字符都是十进制
  • isalpha()是否字符串中的所有字符都是字母字符
  • isdigit()是否字符串只包含数字
  • isspace()是否字符串中只包含空格
  • istitle()是否所有单词首字母大写,其余字母小写
    在这里插入图片描述

4、字符调整

  • ljust():定长,左补
  • rjust():定长,右补
    在这里插入图片描述

5、字符对齐与填充

  • startswith()检查字符串是否以指定的前缀开头
  • endswith()检查字符串是否是指定的后缀
  • center()将字符串居中并填充指定的字符,使达到指定的长度
  • zfill()在字符串的左侧填充指定数量的零(zero),使字符串达到指定的长度
    在这里插入图片描述

6、字符检索

  • index()从左至右寻找指定字符,找不到则报错
  • rindex()从右至左寻找指定字符,找不到则报错
  • find()找不到字符,则返回-1
    在这里插入图片描述

7、字符切割

  • split()将字符串按照指定的分隔符进行分割,返回一个字符串列表
  • rsplit()将一个字符串从右边分割成多个子字符串,并将它们放在一个列表中返回
  • partition()在左开始第一次出现分隔符的位置将字符串分割,并返回一个由三个字符串组成的元组,分别是分隔符之前的部分、分隔符本身和分隔符之后的部分
  • rpartition()在右开始第一次出现分隔符的位置将字符串分割,并返回一个由三个字符串组成的元组,分别是分隔符之前的部分、分隔符本身和分隔符之后的部分
    在这里插入图片描述

8、字符整理

  • strip():去除字符串前后空格
  • rstrip():去除字符串后面的空格
  • lstrip():删除字符串开头的指定字符(默认为空格)或字符集
    在这里插入图片描述

二、透视表

1、pd.pivot_table

pd.pivot_table(values=None, index=None, columns=None,fill_value=None, aggfunc=np.sum,margins=False,dropna=True,margins_name='All)

  • values要筛选的列,可选
  • index在数据投失败索引上分组的键
  • columns在数据透视表列上分组的键
  • aggfunc:function,function of list,dict,default numpy.mean
    如果传递的函数列表,则生成的透视表将具有分层列
    如果传递了dict,则键是要聚合的列,值是函数或函数列表
  • fill_value标量,默认无,用于替换缺失值的值
  • margins布尔值,默认False,添加索引行/列(例如,对于小计/总计)
  • dropna布尔值,默认True,不包括条目全部为NaN的列
  • margins_name:String,默认为All,当边距为真时,将包含总计的行/列的名称
    在这里插入图片描述
    在这里插入图片描述
    打印出现乱码时,原因大概率为字体方面,可通过运行以下代码解决:
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['Microsoft YaHei'] # 指定默认字体:解决plot不能显示中文问题
mpl.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题

在这里插入图片描述

2、多级透视表

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/790203.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[力扣]根据前中序构造二叉树--详细解析

根据前中序遍历顺序构建一个二叉树 力扣练习链接 过程 总体框架 设preorder的左边界为pleft,右边界为pright[注意这里是闭区间能取到]同时设inorder的左边界为ileft,有边界为iright[同样也是可以取到的索引区间]我们生成每一个区间的树的头结点,然后向上返回,对于他的父亲结点…

Python搭建编程环境—安装Python3解释器

✅作者简介:CSDN内容合伙人、阿里云专家博主、51CTO专家博主、新星计划第三季python赛道Top1🏆 📃个人主页:hacker707的csdn博客 🔥系列专栏:零基础学Python 💬个人格言:不断的翻越一…

Day18-【Java SE进阶】多线程

一、线程 1. 什么是线程? 线程(Thread)是一个程序内部的一条执行流程。程序中如果只有一条执行流程,那这个程序就是单线程的程序。 2. 多线程 多线程是指从软硬件上实现的多条执行流程的技术(多条线程由CPU负责调度执行) 3. 如何在程序中创建出多条线程? Ja…

数据文件大小扩容或缩容必备技能

欢迎关注“数据库运维之道”公众号,一起学习数据库技术! 本期将为大家分享“数据文件大小扩容或缩容必备技能” 。 关键词:Resize Datafile、ORA-03297、高水位线 表空间跟数据文件是一对多的关系,数据文件存放到磁盘或ASM磁盘组。当磁盘空间…

计算机视觉——图像金字塔理解与代码示例

图像金字塔 有时为了在图像中检测一个物体(例如人脸、汽车或其他类似的物体),需要调整图像的大小或对图像进行子采样,并进行进一步的分析。在这种情况下,会保持一组具有不同分辨率的同一图像。称这种集合为图像金字塔…

人大金仓数据库介绍与使用指南

人大金仓数据库是一款强大的关系型数据库管理系统,具有简单易用、高性能和稳定可靠的特点。本文将介绍人大金仓数据库的安装方法、常用的SQL语法以及相关工具的使用。 一、安装方法: 1、下载人大金仓数据库安装程序; 2、运行安装程序&#…

自动驾驶之心规划控制笔记

Search-based Path Planning Methods Path Finding Problem 一般来说指标有距离,耗费时间,能量,或者多目标。 左图是拓扑地图,蓝色的点就是顶点,绿色的线是连接关系。最后得到的是一个从哪里走的一个最优,并非精细解。 右图是栅格地图,这个搜索出来的是在相对分辨率比…

SSL证书有哪些种类?有免费的吗?

SSL证书主要有以下几种类型: 1. 域名验证型SSL证书 (DV SSL): - 仅对申请者的域名所有权进行验证,无需人工验证申请单位的真实身份。 - 审核快速,通常适用于个人网站、小型组织或各类加密应用。 2. 组织验证型SSL证书 (OV…

C++的并发世界(五)——线程状态切换

0.线程状态 初始化:该线程正在被创建; 就绪:该线程在列表中就绪,等待CPU调度; 运行:该线程正在运行; 阻塞:该线程被阻塞挂机,Blocked状态包括:pend&#xff…

顶级Layer-3 通证正在飙升,布局龙头Degen Chain(含bitget教程)

近期以太坊生态内,Base 一枝独秀,其 TVL 突破 25 亿美元,创历史新高。并且生态内的社交文化和 DeFi 板块的龙头都很惹眼。 Farcaster 协议上的 meme 币 DEGEN 目前价格为 0.018 美元,7 日涨幅达 376%。 DEGEN 兴起于 Farcaster 的…

知识产权与标准化

根据希赛相关视频课程汇总整理而成,是个人软考的复习笔记,仅供参考 知识产权概述 知识产权类型: ①著作权(版权、文学产权) ② 工业产权(产业产权) 知识产权的特点: 无形性、独占性…

PS从入门到精通视频各类教程整理全集,包含素材、作业等(7)复发

PS从入门到精通视频各类教程整理全集,包含素材、作业等 最新PS以及插件合集,可在我以往文章中找到 由于阿里云盘有分享次受限制和文件大小限制,今天先分享到这里,后续持续更新 PS敬伟01——90集等文件 https://www.alipan.com/s…

【学习笔记】java项目—苍穹外卖day07

文章目录 苍穹外卖-day07课程内容1. 缓存菜品1.1 问题说明1.2 实现思路1.3 代码开发1.4 功能测试1.5 代码提交 2. 缓存套餐2.1 Spring Cache2.1.1 介绍2.1.2 常用注解2.1.3 入门案例 2.2 实现思路2.3 代码开发2.4 功能测试2.5 代码提交 3. 添加购物车3.1 需求分析和设计3.1.1 产…

Leetcode刷题-数组(二分法、双指针法、窗口滑动)

数组 1、二分法 704. 二分查找 - 力扣&#xff08;LeetCode&#xff09; 需要注意区间的问题。首先在最外面的循环判断条件是left<right。那就说明我们区间规定的范围就是【left,right】 属于是左闭右闭&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&…

基于java实现的沙县小吃点餐系统

开发语言&#xff1a;Java 框架&#xff1a;ssm 技术&#xff1a;JSP JDK版本&#xff1a;JDK1.8 服务器&#xff1a;tomcat7 数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09; 数据库工具&#xff1a;Navicat11 开发软件&#xff1a;eclipse/myeclip…

WebKit简介

1、简介&#xff08;WebKit&#xff09; WebKit 是一个开源的浏览器引擎&#xff0c;最初由苹果公司基于KHTML&#xff08;K Desktop Environment的HTML渲染引擎&#xff09;开发&#xff0c;并广泛应用于Safari浏览器&#xff0c;后来也被其他多款浏览器和应用采用。WebKit负…

Redis高可用与持久化

目录 一、Redis高可用 二、Redis持久化 1、持久化的功能&#xff1a; 2、Redis 提供两种方式进行持久化&#xff1a; 三、RDB持久化 1、触发条件 1.手动触发 2.自动触发 3.其他自动触发机制 2、执行流程 3、启动时加载 四、AOF持久化 1、开启AOF 2、执行流程 1.…

vue3+elementPlus:实现数字滚动效果(用于大屏可视化)

自行封装注册一个公共组件 案例一&#xff1a; //成功案例&#xff1a; //NumberScroll.vue /* 数字滚动特效组件 NumberScroll */<template><span class"number-scroll-grow"><spanref"numberScroll":data-time"time"class&qu…

构建知识图谱的基石:理解本体和数据模型

构建知识图谱的基石&#xff1a;理解本体和数据模型 一、本体的基本概念 1. 定义与重要性 本体&#xff08;Ontology&#xff09;在计算机科学和信息科学中&#xff0c;尤其是在知识图谱领域&#xff0c;扮演着重要的角色。它提供了一种形式化的描述知识领域的方法&#xff0…

金融案例:构建高效统一的需求登记与管理方案

在金融行业数字化转型背景下&#xff0c;银行等金融机构面临着业务模式创新与数据应用的深度融合。业务上所需要的不再是单纯的数据&#xff0c;而是数据背后映射的业务趋势洞察&#xff0c;只有和业务相结合转化为业务度量指标&#xff0c;经过数据分析处理呈现为报表进行展示…