数据分析必备:一步步教你如何用Pandas做数据分析(6)

1、Pandas 函数应用

Pandas 重建索引操作实例
要将您自己或其他库的函数应用于Pandas对象,您应该了解三个重要的方法。方法如下所述。要使用的适当方法取决于您的函数是希望对整个数据帧进行操作,还是行操作还是按列操作,还是按元素操作。
表函数应用程序:pipe()
行或列函数应用程序:apply()
元素级函数应用程序:applymap()

1.1、表函数应用程序

可以通过传递函数和适当数量的参数作为管道参数来执行对DataFrame自定义操作

加法器函数
例如,将2个值添加到DataFrame中。加法器功能将两个数字值相加并返回总和。

  def adder(ele1,ele2):return ele1+ele2

我们使用自定义函数对DataFrame进行操作.

df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])df.pipe(adder,2)

我们看下完整的程序:

import pandas as pd
import numpy as np
def adder(ele1, ele2):return ele1 + ele2
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
df.pipe(adder, 2)
print(df.apply(np.mean))

运行结果

       col1 col2 col30 2.176704 2.219691 1.5093601 2.222378 2.422167 3.9539212 2.241096 1.135424 2.6964323 2.355763 0.376672 1.1825704 2.308743 2.714767 2.130288

1.2、行或列函数应用程序

可以使用apply()方法沿DataFrame或Panel的轴应用任意函数,该方法与描述性统计方法一样,采用可选的axis参数。默认情况下,该操作按列执行,将每一列视为类似数组的形式。

实例 1

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
df.apply(np.mean)
print(df.apply(np.mean))

运行结果:

col1   -0.241399
col2    0.141497
col3   -0.102721
dtype: float64

通过传递 axis 参数,可以逐行执行操作。

实例 2

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
df.apply(np.mean, axis=1)
print(df.apply(np.mean))

运行结果:

col1   -0.361706
col2    0.034588
col3    0.337259
dtype: float64

实例 3

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
df.apply(lambda x: x.max() - x.min())
print(df.apply(np.mean))

运行结果

col1    0.081140
col2    0.772552
col3    0.749451
dtype: float64

1.3、元素级函数应用程序

并非所有函数都可以向量化(NumPy数组既不返回另一个数组,也不返回任何值),DataFrame上的applymap() 方法和Series上的map() 类似地接受任何采用单个值并返回单个值的Python函数。
实例 1

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
# 自定义函数
df['col1'].map(lambda x: x * 100)
print(df.apply(np.mean))

运行结果:

col1   -0.062886
col2    0.404082
col3    0.026754
dtype: float64

实例 2

import pandas as pd
import numpy as np
# 自定义函数
df = pd.DataFrame(np.random.randn(5, 3), columns=['col1', 'col2', 'col3'])
df.applymap(lambda x: x * 100)
print(df.apply(np.mean))

运行结果:

col1    0.022429
col2    0.764061
col3    0.036986
dtype: float64

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/13768.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

多进程操作文件

最近在调试多进程编程的时候,发现父进程打开过文件后,创建子进程,子进程会拷贝父进程的文件描述符, 举例,比如是串口设备,父进程打开串口后又关闭了串口,可是下次再打开就打不开了, …

模拟面试题

1.装箱和拆箱是指什么? 装箱——把栈中内容迁移到堆中去(值转引用) 拆箱——把堆中内容迁移到栈中去(引用转值) 2.值和引用类型在变量赋值时的区别是什么? 值类型:赋值时复制数据本身&a…

Gitee在已有项目基础上创建仓库中遇到的问题和解决

问题一:fatal: remote origin already exists 解释:当前仓库添加了一个名为"origin"的远程仓库配置,此时输入 git remote add origin https://xxx就会提示上面的内容。 解决方案1:移除旧的origin git remote remove origin 解决方案…

C++——mapset红黑树

目录 一补充知识 1关联式容器 2键值对 二set 1set的介绍 2set的使用 三map 1map的说明 2map的使用 四容器在oj中的使用 五AVL树 1概念 2插入 3AVL的旋转 3.1右单旋 3.2左单旋 3.3左右双旋 3.4右左双旋 4判断AVL树是否平衡 完整源代码 六红黑树 1概念 2性…

【Shader】Unity曲面弯曲效果

本期分享一个弯曲效果的Shader,类似于地铁跑酷的跑道 1、Shaer代码 Shader "Unlit/CurvedUnlit" { Properties{_MainTex ("Texture", 2D) "white" {}}SubShader{Tags { "RenderType""Opaque" }LOD 100Pass{CGP…

紫光展锐突破创新终端品类,搭载展锐芯的全球首款二合一5G云电脑正式发布

近日,搭载紫光展锐5G芯片T760的中兴云电脑逍遥系列正式发布,亮点: 全球首款二合一5G云电脑,支持本地/云端双模式,一键切换,用户可同时享有Android平板和Windows云电脑两种形态;支持5G蜂窝网络&…

C++相关概念和易错语法(13)(string的模拟实现)

string由于存在字符串和单字符的概念,使得它的一些接口,实现要比vector多一些。本质上来看string的实现是在顺序表的基础上加入串相关的操作。下面我会分享如何模拟实现string,这可以进一步提高我们对string的熟练程度。 1.构造函数、拷贝构…

附代码:策略常用-正余弦优化算法

正余弦优化算法作为群智能优化算法的一种, 正弦余弦算法 (sine cosine algorithm, SCA) 是 2016 年由 Mirjalili 提出的一种新型仿自然优化算法, 通过创建多个随机候选解, 利用正余弦函数的数学性质来平衡算法在搜系过程中的全局探索和局部开发能力。该算法具有结构简单、参数少…

docker三种自定义网络(虚拟网络) overlay实现原理

docker提供了三种自定义网络驱动:bridge、overlay、macvlan。 bridge驱动类似默认的bridge网络模式。 overlay和macvlan是用于创建跨主机网络。 支持自定义网段、网关,docker network create --subnet 172.77.0.0/24 --gateway 172.77.0.1 my_n…

PPT大珩助手新功能-生成迷宫

大珩助手是一款功能丰富的办公软件插件,它主要分为两个版本:PPT大珩助手和Word大珩助手。这两个版本都旨在提高用户在处理演示文稿和文档时的效率。 PPT大珩助手 这是一款专门为Microsoft PowerPoint设计的插件。它提供了多种功能,例如素材…

类与对象:抽象类、Object类和内部类

一.抽象类 1.概念 在面向对象的概念中,所有的对象都是通过类来描绘的,但是反过来,并不是所有的类都是用来描绘对象的,如果一个类中没有包含足够的信息来描绘一个具体的对象,这样的类就是抽象类。 抽象类也是类&#…

盲人社区生活支持体系:织就一张温暖的网

在当今社会,构建一个全面、包容的盲人社区生活支持体系成为了推动社会进步、保障残障人士权益的重要议题。随着科技的不断革新,一款名为“蝙蝠避障”的辅助软件走进了盲人的日常生活,它如同一位无形的向导,通过实时避障与拍照识别…

element DatePicker 日期选择器设置禁用未来日期,时间范围为60天

需要用到 DatePicker 里面的 picker-options 方法 disabledDate onPick方法 <el-date-pickerv-model"form.xxxx"type"daterange"value-format"yyyy-MM-dd":clearable"false":picker-options"pickerOptions"start-placeho…

运行Android项目时,提示错误: 程序包javax.annotation.processing不存在

今天在运行项目时提示错误: 错误: 程序包javax.annotation.processing不存在 import javax.annotation.processing.Generated; 最后是修改了Android Studio的JDK的路径修改为你安装的JDK路径&#xff0c;完成的修复&#xff1a;

5.23 Linux中超时检测方式+模拟面试

1.IO多路复用的原理&#xff1f; IO多路复用使得一个或少量线程资源处理多个连接的IO事件的技术。对于要处理的多个阻塞的IO操作&#xff0c;建立集合并存储它们的文件描述符&#xff0c;利用单个阻塞函数去监控集合中文件描述符事件到达的情况&#xff0c;&#xff08;如果到…

Web测试中的BUG定位与分析

在Web测试过程中&#xff0c;页面内容或数据显示错误、不显示等问题是常见的挑战。为了高效地定位并解决这些问题&#xff0c;我们可以利用浏览器自带的开发者工具、数据库等工具进行排查和分析定位BUG。 一、发现BUG 保存现场并复现&#xff1a;遇到问题时&#xff0c;首先截…

cPanel中如何移除之前添加的域名

我这边想要移除我之前绑定到主机的域名&#xff0c;但是不知道如何在主机上面进行移除&#xff0c;由于我使用的Hostease的Linux虚拟主机产品默认带普通用户权限的cPanel面板&#xff0c;但是不知道如何在cPanel上操作移除域名&#xff0c;因为也是对于Hostease主机产品不是很了…

技术驱动创新:淘宝扭蛋机小程序的技术实现与挑战

随着科技的飞速发展和人们生活方式的转变&#xff0c;小程序已经成为人们日常生活中不可或缺的一部分。淘宝扭蛋机小程序&#xff0c;作为一种集购物、娱乐于一体的新型电商模式&#xff0c;凭借其独特的创意和便捷的使用体验&#xff0c;受到了广大用户的喜爱。然而&#xff0…

Linux磁盘高级操作

RAID RAID存储系统是一种数据存储虚拟化技术&#xff0c;它将多个物理磁盘驱动器组合成一个或多个逻辑单元&#xff0c;以提供数据冗余和/或提高性能。 1. RAID 0 无奇偶校验与冗余&#xff08;磁盘容错&#xff09;的条带存储&#xff08;带区卷/条带卷&#xff09; 由两块…

基于windows通过kind部署轻量级便携式k8s集群

感谢老师的视频教程&#xff1a; 基于windows通过kind部署轻量级便携式k8s集群 wsl windows下的linux wsl --set-default-version 2 wsl --help wsl --list --online wsl --install -d Ubuntu wsl -l -v &#xff08;看看版本是不是2&#xff0c;否则docker那边识别不到&…