pandas(day6 图表)

一. 计算效率

1. 测量代码运行时间  %%time  %%timeit

单纯计算 代码块执行的时长
%%time
_sum(np.arange(6))
CPU times: total: 0 ns
Wall time: 1.66 ms用于多次运行代码块并计算平均执行时间
%%timeit
_sum(np.arange(6))738 ns ± 10.7 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)

2. 装饰器  @nb.jit     (import numba as nb) (提高执行的速度)

这个函数接受一个可迭代对象 x,并返回其所有元素的总和。
通过使用 @nb.jit(nopython=True) 装饰器,
函数将在 Numba 中被编译为机器码,以提高执行速度。@nb.jit(nopython = True)
def _sum(x):result = 0for i in x:result += ireturn result _sum(np.arange(100))

3. 闭包

  •  在一个函数内部定义了另一个函数,并且这个内部函数引用了外部函数的局部变量
  • 简单说就是函数下嵌套一个函数       
这里的outer 返回 inner 函数,然后 inner再当调用 outer("yx") 时,它会返回一个函数 inner,并且这个 inner 函数中的 x 被设定为 "yx"。
但是,inner 函数并不会立即执行,而是被返回给调用者。我们将返回的函数赋值给变量 func。
此时,func 实际上是一个函数,即 inner 函数。def outer(x):def inner(y):return x +  " like "+ yreturn innerfunc = outer("yx")
func("apple")结果是  yx  like apple

3.1 闭包和装饰器的结合


def outer(func):def inner(y):x = "吴雨龙"return func(x + "吃" + y)return inner@outer     #outer(my_func)
def my_func(text):return textresult = my_func("苹果")
print(result)  # 输出:吴雨龙吃苹果解释: @outer 装饰器 相当于把 my_func(苹果)整体 传给了 outer,
所以 outer(my_func(苹果))  -- inner(苹果)-- 

4. swifter   提高并行处理能力

通过 switer 可以提升 并行处理能力
import swifter 
df.swifter.apply(lambda x : x["数量"] * x["单价"],axis=1)

5. pandarallel

from pandarallel import pandarallelpandarallel.initialize(nb_workers=8)
初始化 Pandarallel 库,设置并行处理的工作线程数为 8。
这意味着在后续的 Pandas 操作中,可以同时使用多达 8 个工作线程来并行处理数据,
以提高数据处理速度。df.parallel_apply(np.sum,axis=1)
parallel_apply 函数会在多个工作线程上并行应用 np.sum 函数到数据框的每一行上,从而加速了计算过程。

二. 快速构图

1. np.linspace()  创建等间隔数组

用于创建等间隔的一维数组(向量)
np.linspace(1,10,num=20,endpoint=False)  
'''
array([1.  , 1.45, 1.9 , 2.35, 2.8 , 3.25, 3.7 , 4.15, 4.6 , 5.05, 5.5 ,5.95, 6.4 , 6.85, 7.3 , 7.75, 8.2 , 8.65, 9.1 , 9.55])
'''
闭区间  endpoint可以控制区间类型start  end ,  endpoint = True  区间是闭区间

2.  建立 x,y 轴. X大写, y 小写

  •    import scipy.stats as stats     
  • 使用 stats 来执行各种统计分析,比如计算均值、方差、概率密度函数、累积分布函数
# y = f(x)
X = np.linspace(-5,5,200)#概率密度函数  均值=中位数=众数=0   标准差=1
y = stats.norm.pdf(X) / np.max(stats.norm.pdf(X))

3. 线型图的绘制

3.1  需要的库
from matplotlib import pyplot as plt  #画图层
from matplotlib import style
import warnings
warnings.filterwarnings("ignore")
import scipy.stats as stats

 

 3.2  配置图的大小 颜色 字体等
获取所有的背景主题
print(style.available)#配置
style.use("fivethirtyeight")  #颜色主题plt.rcParams["figure.figsize"] = (10,6.18) # 尺寸大小 单位是英寸plt.rcParams["figure.dpi"] = 100   #清晰度plt.rcParams["font.sans-serif"] = ["SimHei"]  #微软黑体字plt.rcParams["axes.unicode_minus"] = False   #调控负号问题

 3.3 画图
线形图
plt.plot(X,y,label="PDF") label 是标签plt.fill(X,y,alpha=0.5) #透明度 y1 = stats.norm.cdf(X)  #累积分布函数plt.plot(X,y1,label="CDF")  plt.legend()  # 添加图例,就是说明那条线是哪一个刻度控制
plt.xticks(np.arange(-5,6)) #np.arange() 是左闭右开的  
plt.yticks(np.arange(0,11)/10)刻度轴标题
plt.xlabel("x的标题",fontsize=15)
plt.ylabel("y的标题",fontsize=15,c="red")注释部分
plt.text(-3.5,0.7,"我是注释")去除背景
plt.grid()保存图形
plt.savefig("./demo.png",dpi=100)

4.点线面控制
%matplotlib inline
X = np.linspace(-5,5,20)y = np.sin(X)'''
ls : 线的样式 - 实线  -- 虚线  : 虚线  -.感叹线
lw : 线宽
marker : 点样式 o s D d x X 
markersize : 点大小
markerfacecolor : 面的颜色
markeredgecolor : 边缘颜色
'''
plt.plot(X,y,ls=":",lw=1,marker="X",markersize=20,markerfacecolor="white",markeredgecolor="orange")标记数据for a,b in list(zip(X,y)):plt.text(a-0.15,b-0.01,s=round(b,2),fontsize=10,color="#ff00005f")s = : s后面写的是你要标记的数据

4.柱状图


#不要使用 数字以外 的数据作为轴plt.bar(np.arange(data.index.size),data.金额,width=.4) 画图的时候 ,x轴使用的  城市的 下标xticks 可以执行映射  把数字部分 替换程  文字部分
plt.xticks(np.arange(data.index.size),data.index,rotation=90)
rotation 是把横坐标 字进行转动for a,b in list(zip(np.arange(data.index.size),data.金额)):plt.text(a-.1,b,b,rotation=90)这里的 zip(np.arange(data.index.size) 是因为 直接使用 文字作为横坐标
下面不能 调整 他的位置,因为不能对齐进行加减

 空画布画法: 

        针对某一个画布时:要用set_xticks

plt.figure(figsize=(20,6))
#不要使用 数字以外 的数据作为轴#1.生成一个空画布
axes1 = plt.gca()#2.把金额的柱状图绘制在 画布1
axes1.bar(np.arange(data.index.size),data.金额,width=.4,color='r',label="销售额")  #画图的时候 ,x轴使用的  城市的 下标#3. 公用一条轴
axes2 = axes1.twinx()   #返回画布2# +.4 偏移图形
axes2.bar(np.arange(data.index.size)+.4,data.数量,width=.4,label="销量")#xticks 可以执行映射  把数字部分 替换程  文字部分
axes1.set_xticks(np.arange(data.index.size),data.index,rotation=90)for a,b in list(zip(np.arange(data.index.size),data.金额)):axes1.text(a-.1,b,b,rotation=90)for a,b in list(zip(np.arange(data.index.size),data.数量)):axes2.text(a+.25,b,b,rotation=90)axes1.grid(False)
axes2.grid(False)#调节legend的位置
axes1.legend(loc=[0,1])  # 当前的 1 比例是整个画布的长度或宽度比例
axes2.legend(loc=[0.1,1])

5.多图组合

#1.先设置空画布axes1 = plt.gca()#2.在空画布当中绘制图形  ,x轴 最好使用 索引
inds = np.arange(data.index.size)axes1.bar(inds,data.金额,color="purple",label="销售额")#3.将x轴进行映射
axes1.set_xticks(inds,data.index,rotation=90,fontsize=10)#4.设置共轴axes2 = axes1.twinx()axes2.plot(inds,data.数量,color="orange",alpha=0.8,ls="--",lw=1.5,marker="o",markerfacecolor="b",label="销量")#5.设置y轴的标签
axes1.set_ylabel("销售额(元)")axes2.set_ylabel("销量(件)")#6.设置图例
axes1.legend(loc=[0,1.1])
axes2.legend(loc=[0,1.04])axes1.grid(False)

6. 直方图 

pd.cut(d,bins=10)  分箱
plt.hist(d,bins=10)

7. 饼图

import seaborn as sns   颜色调色板
sns.palplot(sns.color_palette("hls",10)) 设置的颜色#获取最大值索引
mi = da.金额.reset_index(drop=True).idxmax()
#飞离效果 数组生成
ex = np.zeros(da.shape[0])
ex[mi]=0.1a = plt.pie(da.金额,labels=da.index,colors = sns.color_palette("hls",da.shape[0]),autopct="%.2f%%",  # 计算每块的比例explode = ex,       # 分离效果wedgeprops={"width":.4},  # 宽带边缘属性pctdistance=0.75,          # 就是调整比例数值位置textprops={"fontsize":10,"color":"k"} #比例数字属性
)plt.legend(labels=[f"{a}={b}元" for a,b in  zip(da.index,da.金额)],loc=[0,-.4],ncol=2)

8. 旭日图 

plt.pie(total.金额,colors = sns.color_palette("summer",total.shape[0]),autopct="%.2f%%",radius=0.5, #半径
)a = plt.pie(tmp.金额,labels=tmp.省份,colors = sns.color_palette("summer",tmp.shape[0]),explode=np.full(tmp.shape[0],0.01),wedgeprops={"width":.4},pctdistance=0.75,textprops={"fontsize":10,"color":"k"}
)plt.text(0.1,0.1,"中国")# plt.text(0.1,-0.1,"日本")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/798025.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java流式计算Stream

java流式计算Stream 流(Stream)到底是什么呢? 是数据渠道,用于操作数据源(集合、数组等)所生成的元素序列。 “集合讲的是数据,流讲的是计算! ” 特点: Stream自己不会存储元素。 Stream不会改变源对象。相反&#x…

金三银四面试题(十六):MySQL面试都问什么(1)

在开发岗位面试中,MySQL基本是必考环节。所以接下来我们就进入MySQL八股文环节,看看都有哪些高频考题。 MySQL 中有哪些不同的表格? 在MySQL中,可以创建多种不同类型的表格,其中一些常见的类型包括: InnoD…

性能优化-如何爽玩多线程来开发

前言 多线程大家肯定都不陌生,理论滚瓜烂熟,八股天花乱坠,但是大家有多少在代码中实践过呢?很多人在实际开发中可能就用用Async,new Thread()。线程池也很少有人会自己去建,默认的随便用用。在工作中大家对…

ThingsBoard通过MQTT发送属性数据

MQTT基础 客户端 MQTT连接 属性上传API 案例 MQTT基础 MQTT是一种轻量级的发布-订阅消息传递协议,它可能最适合各种物联网设备。 你可以在此处找到有关MQTT的更多信息,ThingsBoard服务器支持QoS级别0(最多一次)和QoS级别1&…

3D打印技术引领压铸模具制造新变革

随着工业4.0浪潮的席卷,3D打印技术以其独特优势,正逐渐成为新一轮工业革命中的璀璨明星。这一技术不仅为“中国制造”向“中国智造”的转型提供了强大动力,也为压铸模具这一铸造行业的重要分支带来了前所未有的变革。 压铸模具,作…

文心一言指令词宝典之咨询分析篇

作者:哈哥撩编程(视频号、抖音、公众号同名) 新星计划全栈领域优秀创作者博客专家全国博客之星第四名超级个体COC上海社区主理人特约讲师谷歌亚马逊演讲嘉宾科技博主极星会首批签约作者 🏆 推荐专栏: 🏅…

NAT网络地址转换原理解析

NAT(Network Address Translation),即网络地址转换,是一种在1994年提出的地址转换技术。它的主要目的是在本地网络中使用私有地址,在连接互联网时转而使用全局IP地址。NAT实际上是为解决IPv4地址短缺而开发的技术。NAT…

以诚待人,用心做事,做到最好,追求更好

无数个日日夜夜,终于换来了这样一份努力的证明。 2023年,收获满满,前一阵子拿到了证书,忘记拍照了,今天抽空记录一下 收获!又得到一份肯定,这份荣誉证书将伴随我一直为了进步而奋斗&#xff1a…

基于SSM的基于个人需求和地域特色的外卖推荐系统(有报告)。Javaee项目。ssm项目。

演示视频: 基于SSM的基于个人需求和地域特色的外卖推荐系统(有报告)。Javaee项目。ssm项目。 项目介绍: 采用M(model)V(view)C(controller)三层体系结构&…

非关系型数据库(缓存数据库)redis的集群

目录 一.群集模式——Cluster 1.原理 2.作用 3.特点 4.工作机制 哈希槽 哈希槽的分配 哈希槽可按照集群主机数平均分配(默认分配) 根据主机的性能以及功能自定义分配 redis集群的分片 分片 如何找到给定key的分片 优势 二. 搭建Redis群集…

TAB标签美化 - SVG作为mask

今天觉得V3的标签不是很好看,忽然想起来之前看过Vue Admin Beautiful Pro的样式挺好的,顺手研究了一把。发现Vue Admin Beautiful是采用PNGmask css来解决的。于是乎打算把V3的标签页做点小美化,但是迁移过程发生些小插曲,在此记录…

【算法】动态规划练习(一)

目录 1137. 第 N 个泰波那契数 分析 代码 面试题 08.01. 三步问题 分析 代码 746. 使用最小花费爬楼梯 分析 代码 泰波那契序列 Tn 定义如下: T0 0, T1 1, T2 1, 且在 n > 0 的条件下 Tn3 Tn Tn1 Tn2 给你整数 n,请返回第 n 个泰波…

计算机网络——34LANs

LANs MAC地址和ARP 32bit IP地址 网络层地址用于使数据到达目标IP子网:前n - 1跳从而到达子网中的目标节点:最后一跳 LAN(MAC/物理/以太网)地址: 用于使帧从一个网卡传递到与其物理连接的另一个网卡(在同…

数位排序(Comparator<int[]>())

题目 import java.util.Arrays; import java.util.Comparator; import java.util.Scanner;public class Main {public static void main(String[] args) {Scanner sc new Scanner(System.in);int n sc.nextInt();int m sc.nextInt();int[][] a new int[n][2];for(int i0;i…

C语言进阶课程学习记录-第25课 - # 和 ## 操作符使用分析

C语言进阶课程学习记录-第25课 - # 和 ## 操作符使用分析 #运算符实验-#转化字符串预处理后代码 实验-#输出函数名预处理后的代码 ##运算符实验-##定义变量预处理后代码 实验-##定义结构体预处理后的代码 小结 本文学习自狄泰软件学院 唐佐林老师的 C语言进阶课程,图…

libVLC 音频输出设备切换

libvlc_audio_output_list_get和libvlc_audio_output_device_list_get是libVLC 库中用于处理音频输出的两个函数。 libvlc_audio_output_list_get函数用于获取可用的音频输出模块列表。这个列表通常包括不同的音频输出方式,例如 Pulseaudio、ALSA 等。通过这个函数…

算法第三十九天-验证二叉树的前序序列化

验证二叉树的前序序列化 题目要求 解题思路 方法一:栈 栈的思路是「自底向上」的想法。下面要结合本题是「前序遍历」这个重要特点。 我们知道「前序遍历」是按照「根节点-左子树-右子树」的顺序遍历的,只有当根节点的所有左子树遍历完成之后&#xf…

使用 Docker 部署 Photopea 在线 PS 工具

1)Photopea 介绍 GitHub:https://github.com/photopea/photopea 官方手册:https://www.photopea.com/learn/ Adobe 出品的「PhotoShop」想必大家都很熟悉啦,但是「PhotoShop」现在对电脑配置要求越来越高,体积越来越大…

流行的API架构学习

几种流行的API架构风格图 SOAP(Simple Object Access Protocol) 优点:SOAP 是一种基于 XML 的通信协议,具有良好的跨平台和跨语言支持。它提供了丰富的安全性和事务管理功能,并支持复杂的消息交换模式。 缺点&#xf…

windows,web端网页唤起打开本地的客户端程序

这里写自定义目录标题 需求&#xff1a;在电脑浏览器网页唤起本地的应用程序 使用类似以下代码 <a href"myprotocol:">打开飞书</a>在客户端安装的时候在注册表会有自己的协议&#xff0c;若是没有的可自定义注册表 自定义注册表步骤 1.winr 运行 regedi…