03-Pandas的方法介绍

  1. str.startwith(),用于检查列中的值是否以指定的字符串开头

    df = patients[patients['conditions'].str.startswith("DIAB1") | patients["conditions"].str.contains(" DIAB1", regex=False)]
    

    regex=False代表不使用正则表达式进行匹配,而是直接查找子字符串。

  2. str.contains()用于检查值是否包含指定的字符串,示例见1

    df = patients[patients['conditions'].str.contains("DIAB1", case=False, na=False)]
    

    case=False表示不区分大小写,na=False将缺失值视为不匹配。

  3. pivot()方法用于重塑DataFrame,用于将行转换为列,或者将列转换为行

    result = department.pivot(index='id', columns='month', values='revenue').reindex(columns=columns).rename(columns=lambda x:f'{x}_Revenue').reset_index()
    

    其中参数index表示新DataFrame的索引列,即原DataFrame中的行标签
    参数columns表示DataFrame的列,即原DataFrame中的列标签
    参数values表示要填充到新DataFrame中的值,通常是原DataFrame中的数据

  4. reindex()用于重新索引,可以用于DataFrameSeries,可以填充缺失值

  5. dropna=False指定保留存在缺失值的行

    df = transactions.groupby(['country','month'],dropna = False).agg(...)
    

    pandas中,groupby方法不接受dropna参数,它本身就是默认保留所有行的,而在聚合函数内部会默认忽略缺失值,它通常用于DataFrame.dropna(),上述代码中agg()是一个聚合函数

  6. agg()是Pandas 中一个非常强大的函数,它允许用户对 DataFrame或 Series对象的分组数据进行多种聚合操作。

    result = sales_df.groupby(['country', 'year']).agg({  
    'sales': ['sum', 'mean', 'max']  
    })  
    result.columns = ['total_sales', 'average_sales', 'max_sales'] 
    

    当使用字典作为 agg() 的参数时,字典的键是列名,值是聚合函数的名称或自定义函数。

    result_df = transactions_copy.groupby(['month', 'country'], dropna=False).agg(trans_count=('id', 'count'),  # 计算总交易数量approved_count=('state', lambda x: (x == 'approved').sum()),  # 计算已批准交易数量trans_total_amount=('amount', 'sum'),  # 计算总交易金额approved_total_amount=('amount', lambda x:sum(x[transactions_copy["state"]=="approved"]))  # 计算已批准交易总金额
    ).reset_index()
    
  7. strftime()datetime模块中的函数,用于格式化日期和时间

    transactions_copy['trans_date'] = pd.to_datetime(transactions_copy['trans_date'])
    transactions_copy['month'] = transactions_copy['trans_date'].dt.strftime('%Y-%m')
    

    %Y是年份,%m是月份,%d是日期,%H是小时,%M是分钟,%S是秒钟

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/778043.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3.28总结

1.java学习记录 1.方法的重载 重载换而言之其实就是函数名不变,但是其中的参数需要改变,可以三个方面改变(参数类型,参数顺序,参数个数这三个方面入手,这样可以运用的) 但是:注意…

2024.3.21|华北水利水电大学江淮校区ACM社团训练赛

2024.3.21|华北水利水电大学江淮校区ACM社团训练赛 1.数字拆解 2.矩阵修改 3.因子数 4.回文数 5.中位数 心有猛虎,细嗅蔷薇。你好朋友,这里是锅巴的C\C学习笔记,常言道,不积跬步无以至千里,希望有朝一日我们积累的滴…

通俗易懂:如何通过JVM参数来调整内存大小?

调整Java虚拟机(JVM)的内存大小主要是为了优化应用程序性能,防止内存不足而导致的OutOfMemoryError异常。以下是一些关键的JVM参数用于调整内存大小: 1. 堆内存(Heap Memory) - -Xms:设置JVM的初…

【联邦学习】kubefate安装(docker-compose版)

概念介绍 联邦学习:(待补充) fate介绍:(待补充) kubefate介绍:分布式版fate 官网:https://fate.fedai.org/ github:https://github.com/FederatedAI/ 安装 背景 本文…

springboot+vue在idea上面的使用小结

1.在mac上面删除java的jdk方法: sudo rm -rfjdk的路径 sudo rm -rf /Users/like/Library/Java/JavaVirtualMachines/corretto-17.0.10/Contents/Home 2.查询 Mac的jdk版本和路径: /usr/libexec/java_home -V 3.mac上面查询和关闭idea的网页端口&…

快速上手Spring Cloud五:Spring Cloud与持续集成/持续部署(CI/CD)

快速上手Spring Cloud 一:Spring Cloud 简介 快速上手Spring Cloud 二:核心组件解析 快速上手Spring Cloud 三:API网关深入探索与实战应用 快速上手Spring Cloud 四:微服务治理与安全 快速上手Spring Cloud 五:Spring …

samba实现linux共享文件夹

一、samba安装 sudo apt install samba 二、配置Samba 编辑Samba配置文件sudo vi /etc/samba/smb.conf 在文件末尾添加以下内容,设置一个简单的共享目录(替换path_to_share为实际的共享目录路径): [Share] path /path_to_sha…

鱼眼相机的测距流程及误差分析[像素坐标系到空间一点以及测距和误差分析]

由于最近在整理单目测距的内容,顺手也总结下鱼眼相机的测距流程和误差分析,如果有错误,还请不吝赐教。 参考链接: 鱼眼镜头的成像原理到畸变矫正(完整版) 相机模型总结(针孔、鱼眼、全景) 三维…

多模态系列-综述MM-LLMs: Recent Advances in MultiModal Large Language Models

Homepage:https://mm-llms.github.io/ Paper: https://arxiv.org/abs/2401.13601 1 摘要 在过去的一年中,多模态大型语言模型(MM-LLMs)取得了实质性的进展,通过高效的训练策略,增强了现成的语言模型,以支持多模态输入或输出。由此产生的模型不仅保留了语言模型的固有…

Unity照片墙简易圆形交互效果总结

还要很多可以优化的点地方,有兴趣的可以做 比如对象的销毁和生成可以做成对象池,走到最左边后再移动到最右边循环利用 分析过程文件,采用Blender,资源已上传,可以播放动画看效果,下面截个图: …

关系型数据库mysql(8)sql高级语句②

目录 一.子查询——Subquery 语法 环境准备 In——查询已知的值的数据记录 子查询——Insert 子查询——Update 子查询——Delete Not In——表示否定,不在子查询的结果集里 Exists——判断查询结果集是否为空 子查询——别名 ​编辑 二.视图 理论&a…

图论之路径条数专题

一直忙着金工实习蓝桥杯,好久没有看图论了,今天就小试几题享受下被虐的快感。 1.最短路拓扑 首先来几个结论: 1.最短路图没有环(可以用反证法证明) 2.dis[u]edge[u,v]dis[v],那么u,v端点的边一定在最短路…

方差分析(ANOVA)

方差分析(ANOVA,Analysis of Variance)是一种统计方法,用于比较两个或多个组之间的平均数是否存在显著差异。其原理基于对总方差的分解,将总方差分解为组内方差和组间方差。通过比较组内方差和组间方差的大小&#xff…

selenium自动化测试

selenium自动化测试 1、Javaselenium环境搭建2、测试,打开任意网页3、selenium 常见的Api3.1元素定位findElement3.1.1 css 选择语法3.1.2 xpath 选择语法 1、Javaselenium环境搭建 下载chromedriver,版本要与Chrome浏览器版本一致。 下载之后将chro…

数据库【QSqlQueryaModel】

QSqlQueryModel Class 描述 QSqlQueryModel是用于执行SQL语句和遍历结果集的高级接口。它构建在较低级别的QSqlQuery之上,可用于为视图类(如QTableView)提供数据。例如 QSqlQueryModel *model new QSqlQueryModel;model->setQuery(&quo…

C++经典面试题目(九)

1、什么是组合?请举例说明如何在C中实现组合。 组合是一种面向对象编程中的概念,用于描述类之间的关系。它表示一个类包含另一个类的对象作为成员变量的情况。在组合中,一个类的对象可以包含其他类的对象,这种关系通常表现为“拥…

第P1周:实现mnist手写数字识别

>- **🍨 本文为[🔗365天深度学习训练营](https://mp.weixin.qq.com/s/0dvHCaOoFnW8SCp3JpzKxg) 中的学习记录博客** >- **🍖 原作者:[K同学啊 | 接辅导、项目定制](https://mtyjkh.blog.csdn.net/)** 目录 一、前言 二、我…

Docker版本:18.06.1安装

1、操作系统:CentOS 7.5以上 2、Docker版本:18.06.1 1、解压 tar -xvf docker-18.06.1-ce.tgz2、将解压出来的docker文件内容移动到 /usr/bin/ 目录下 cp docker/* /usr/bin/3、将docker注册为service vim /etc/systemd/system/docker.service将下列…

vant checkbox 复选框 样式改写

修改前 修改后 基于 vant&#xff1a; 4.8.3 unocss: 0.53.4 <van-checkbox-group v-model"query.zczb" shape"square" class"text-16 w-100% flex flex-wrap"><template v-for"item in registerCapitalOption"><v…

LeetCode 27 移除元素

给你一个数组 nums 和一个值 val&#xff0c;你需要 原地 移除所有数值等于 val 的元素&#xff0c;并返回移除后数组的新长度。 不要使用额外的数组空间&#xff0c;你必须仅使用 O(1) 额外空间并 原地 修改输入数组。 元素的顺序可以改变。你不需要考虑数组中超出新长度后面…