初识Pandas函数是Python的一个库(继续更新...)

    
学习网页: 

Welcome to Python.orghttps://www.python.org/https://www.python.org/icon-default.png?t=N7T8https://www.python.org/

Pandas函数库

Pandas是一个Python库,提供了大量的数据结构和数据分析工具,包括DataFrame和Series等。Pandas的函数非常丰富,可以用于数据的各种操作和处理。

以下是一些Pandas函数的基本用法

  1. 读取数据

    • pandas.read_csv(filename):读取CSV文件。
    • pandas.read_excel(filename):读取Excel文件。
    • pandas.read_sql(sql, con):从SQL数据库中读取数据。
  2. 数据清洗

    • DataFrame.dropna():删除含有空值的行或列。
    • DataFrame.fillna(value):填充空值。
    • DataFrame.replace():替换值。
  3. 数据筛选

    • DataFrame.loc[]:基于标签进行筛选。
    • DataFrame.iloc[]:基于整数位置进行筛选。
  4. 数据排序

    • DataFrame.sort_values():根据列的值进行排序。
  5. 数据聚合

    • DataFrame.groupby():根据某一列或多列的值进行分组。
    • DataFrame.agg():对分组后的数据进行聚合操作,如求和、求平均等。
  6. 数据重塑

    • DataFrame.pivot():创建数据透视表。
    • DataFrame.melt():将宽格式数据转换为长格式数据。
  7. 数据连接

    • pandas.concat(objs, axis=0):沿着axis=0(即行方向)连接多个对象。
  8. 绘图

    • DataFrame.plot():绘制图表。
  9. 缺失值处理

    • DataFrame.dropna():删除含有空值的行或列。
    • DataFrame.fillna():填充空值。
  10. 重复值处理

  • DataFrame.drop_duplicates():删除重复的行。11.
  •      .时间序列处理: 
  • pandas.to_datetime():将字符串、整数、浮点数或日期对象转换为日期时间对象。
  • pandas.resample():对时间序列数据进行重采样。

    12.其他常用函数

  • DataFrame.info():显示DataFrame的信息概览。
  • DataFrame.describe():显示DataFrame的描述统计信息。
  • Series.map()Series.apply():对Series中的每个元素应用函数。
  • DataFrame.apply()DataFrame.applymap():对DataFrame中的每个元素或每个单元格应用函数。

小结

这只是Pandas功能的一个子集,Pandas还有许多其他功能和函数,建议查看官方文档或相关教程以获得更全面的了解。

  • 以下是一些Pandas函数的示例

  • 1、读取数据

    • 读取CSV文件:

      python`import pandas as pd df = pd.read_csv('data.csv')`

    • 读取Excel文件:

      python`import pandas as pd 
      df = pd.read_excel('data.xlsx')`

  • 2、数据清洗

    • 删除空值:

      python`df = df.dropna() # 删除含有空值的行或列`

    • 填充空值:

      python`df['column_name'].fillna(value='new_value', inplace=True) # 填充指定列的空值`

  • 3、数据筛选和查询

    • 使用标签选择数据:

      python`df = df.loc[df['column_name'] == 'value'] # 选择某一列中值为'value'的行`

  • 4、数据排序

    • 根据某一列的值进行排序:

      python`df = df.sort_values('column_name') # 对指定列进行升序排序`

  • 5、数据聚合和统计:

    python`df = df.groupby('column_name').sum() # 对按指定列分组的每组数据进行求和操作`

  • 6、数据重塑和转换

    • 将宽格式数据转换为长格式数据:
      ```pythondf = df.melt('column_name') # 将宽表转换为长表,'column_name'为转换的键列

      “举个栗子”

    • 以下是一个使用Pandas进行数据处理的实际例子:

      假设我们有一个包含员工信息的CSV文件,文件名为"employees.csv",内容如下:

      id,name,age,department  
      1,Alice,28,Sales  
      2,Bob,30,Marketing  
      3,Charlie,25,HR  
      4,David,35,Sales  
      5,Eve,29,Marketing

      我们想要对员工信息进行以下处理:

    • 读取CSV文件并将其转换为DataFrame对象。
    • 删除空值和重复行。
    • 下面是相应的Pandas代码示例:

    • 根据部门对员工进行分组,并计算每个部门的平均年龄。
    • 筛选出平均年龄大于25岁的部门。
    • 显示每个部门的员工人数。
      import pandas as pd  # 读取CSV文件  
      df = pd.read_csv('employees.csv')  # 删除空值和重复行  
      df = df.dropna().drop_duplicates()  # 根据部门对员工进行分组,并计算每个部门的平均年龄  
      average_age = df.groupby('department')['age'].mean()  # 筛选出平均年龄大于25岁的部门  
      filtered_departments = average_age[average_age > 25].index.tolist()  # 显示每个部门的员工人数  
      department_counts = df[df['department'].isin(filtered_departments)]['department'].value_counts()  print(department_counts)

      运行以上代码后,将输出每个部门的员工人数,其中平均年龄大于25岁的部门将被筛选出来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/226445.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java泛型(1)

我是南城余!阿里云开发者平台专家博士证书获得者! 欢迎关注我的博客!一同成长! 一名从事运维开发的worker,记录分享学习。 专注于AI,运维开发,windows Linux 系统领域的分享! 本…

基于FFmpeg,实现播放器功能

一、客户端选择音视频文件 MainActivity package com.anniljing.ffmpegnative;import android.Manifest; import android.content.ContentResolver; import android.content.Context; import android.content.Intent; import android.database.Cursor; import android.net.Ur…

【每日一题】统计区间中的整数数目

文章目录 Tag题目来源解题思路方法一:平衡二叉搜索树 写在最后 Tag 【平衡二叉搜索树】【设计类】【2023-12-16】 题目来源 2276. 统计区间中的整数数目 解题思路 方法一:平衡二叉搜索树 思路 用一棵平衡二叉搜索树维护插入的区间,树中的…

Redis常用内存淘汰策略?

从淘汰范围来说可以分为不淘汰任何数据、只从设置了到期时间的键中淘汰和从所有键中淘汰三类。而从淘汰算法来分,又主要分为 random(随机),LRU(最近最少使用),以及 LFU(最近最不常使…

Linux--LAMP 平台部署及应用

5.1 LAMP平台概述 LAMP架构是目前成熟的企业网站应用模式之一,指的是协同工作的一整套系统和相关软件,能够提供动态Web站点服务及其应用开发环境。LAMP是一个缩写词,具体包括Linux操作系统,Apache 网站服务器、MySQL数据库服务器&…

【人工智能 | 知识表示】问题规约法 谓词/符号逻辑,良好的知识表示是解题的关键!(笔记总结系列)

🤵‍♂️ 个人主页: AI_magician 📡主页地址: 作者简介:CSDN内容合伙人,全栈领域优质创作者。 👨‍💻景愿:旨在于能和更多的热爱计算机的伙伴一起成长!!&…

c#可变参数(params)关键字

通过使用 params 关键字,可以指定采用可变数量参数的方法参数。 可以发送参数声明中指定类型的参数的逗号分隔列表,也可以发送指定类型的参数数组。您也可以不发送任何参数。如果未发送任何参数,则参数列表的长度为零。 方法声明中的 param…

早上好,我的leetcode(第一期)

写在前面:每天早上到实验室早上昏昏欲睡,那不如写一题吧~ 文章目录 371. 两整数之和面试题08.05.递归乘法29.两数相除50.Pow(x,n)面试题 16.07. 最大数值2119. 反转两次的数字69. x 的平方根70.爬楼梯1631.最小体力消耗路径 371. 两整数之和 两整数之和…

基于ssm轻型卡车零部件销售平台源码和论文

随着信息化时代的到来,管理系统都趋向于智能化、系统化,轻型卡车零部件销售平台也不例外,但目前国内的市场仍都使用人工管理,市场规模越来越大,同时信息量也越来越庞大,人工管理显然已无法应对时代的变化&a…

Caused by: java.net.ConnectException: 拒绝连接: hadoop104/192.168.124.130:4142

项目场景:hadoop102接收消息,自定义拦截器,包含hello的发往hadoop103,不包含的发往hadoop104 报错原因: 原因1: 应该先开启接收方(服务端),hadoop103,hadoop104,最后开启hadoop10…

QDialog子类的使用

背景: 我用Qt designer实现了如下效果: 但在实际使用的时候,发现OK和Cancel按钮点是点不动的。 解决方法: 需要手动添加相关信号槽函数: connect(ui.buttonBox, SIGNAL(accepted()), this, SLOT(accept()));connect…

yarn或者pnpm第一次执行的时候遇到报错yarn : 无法加载文件......因为在此系统上禁止运行脚本

报错: yarn : 无法加载文件 C:\Users\rina2\AppData\Roaming\npm\yarn.ps1,因为在此系统上禁止运行脚本。有关详细信息,请参阅 https:/http://go.microsoft.com/fwlink/?LinkID135170 中的 about_Execution_Policies。 解决方案&#xff1a…

AWS-CDN只能备用域名访问-使用Lambda@Edge(禁止分配的域名访问)

场景:cdn使用备用域名后,希望用户只能从备用域名访问,而不是自动分配的cdn域名,这也将是一个安全漏洞,被扫描到cdn域名访问刷流量等! 【建议部署前查看】参考链接: 1.官方cdn返回示例 2.lambdae…

算法训练第三十九天|62. 不同路径、63. 不同路径 II

62. 不同路径: 题目链接 一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。 问总共有…

云服务配置docker镜像容器以及常用操作命令

首先通过ssh进入云服务器。如何ssh进入云服务器。 简单讲解一下docker中镜像和容器,打个比方,镜像相当于印钱的那个模板,容器相当于从模板上拓下来的钱,不同的模板可以印出不同的钱。但容器被修改后也可以变成新的镜像&#xff0…

Postman中参数填写方式

Postman中参数填写和请求方法有关,一般接口用例请求方法GET与POST常用,所以主要是这两种请求方法请求参数填写 一、GET请求方法参数填写 1、直接在URL中填写请求参数,如直接在URL中填写: http://www.example.com:8089/userapi?unamelisi&…

c++_01_名字空间_复合类型_缺省参数_哑元函数

0 前言 C和C一样,都属于编译型语言 C和C一样,都属于强类型语言 C对C完全兼容,并提供更多面向对象的特性:语言风格更加简洁,类型检查更加严格 1 名字空间 namespace WHY?划分更精细的逻辑单元(逻辑空间)&…

Faulhaber 2.5代运动控制系统 25mNm/13W

2.5代控制系统; PWM输出; 四象限控制带; RS232或CANopen通信接口; 2250_BX4_CxD 选件,电缆和连接信息: 适配部件:

谷歌的开源供应链安全

本内容是对Go项目负责人Russ Cox 在 ACM SCORED 活动上演讲内容[1]的摘录与整理。 SCORED 是Software Supply Chain Offensive Research and Ecosystem Defenses的简称, SCORED 23[2]于2023年11月30日在丹麦哥本哈根及远程参会形式举行。 摘要 💡 谷歌在开源软件供应…

【面经】2024年软件测试面试题大全(持续更新)附答案

📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!📢交流讨论:欢迎加入我们一起学习!📢资源分享:耗时200小时精选的「软件测试」资…