graphpad做折线图坐标轴数字_pandas做数据可视化具体操作,快来看看吧

来自公众号:大邓和他的Python

2afa65eda54a61190136e249cdf07695.png

常见的数据可视化库有:

  • matplotlib 是最常见的2维库,可以算作可视化的必备技能库,由于matplotlib是比较底层的库,api很多,代码学起来不太容易。

  • seaborn 是建构于matplotlib基础上,能满足绝大多数可视化需求。更特殊的需求还是需要学习matplotlib

  • pyecharts 上面的两个库都是静态的可视化库,而pyecharts有很好的web兼容性,可以做到可视化的动态效果。

但是在数据科学中,几乎都离不开pandas数据分析库,而pandas可以做

  • 数据采集 如何批量采集网页表格数据?

  • 数据读取  pd.read_csv/pd.read_excel

  • 数据清洗(预处理)  理解pandas中的apply和map的作用和异同

  • 可视化,兼容matplotlib语法(今天重点)

在本文我们可以学到用pandas做

  • 导入数据

  • 绘制最简单的图plot()

  • 多个y的绘制图

  • 折线图、条形图、饼形图和散点图绘制

  • 统计信息绘图

  • 箱型图

  • 轴坐标刻度

  • plot()更多精细化参数

  • 可视化结果输出保存

准备工作

如果你之前没有学过pandas和matpltolib,我们先安装好这几个库

!pip3 install numpy

!pip3 install pandas

!pip3 install matplotlib

已经安装好,现在我们导入这几个要用到的库。使用的是伦敦天气数据,一开始我们只有12个月的小数据作为例子

#jupyter notebook中需要加这行代码

%matplotlib inline

import matplotlib.pyplot as plt

import numpy as np

import pandas as pd

#读取天气数据

df = pd.read_csv('data/london2018.csv')

df

e5ee256b92fce60f4c037f8f1ff8ac57.png

plot最简单的图

选择Month作为横坐标,Tmax作为纵坐标,绘图。

大家注意下面两种写法

#写法1

df.plot(x='Month', y='Tmax')

plt.show()

a92307994470f8980cf5a229a868b7d7.png

  • 横坐标轴参数x传入的是df中的列名Month

  • 纵坐标轴参数y传入的是df中的列名Tmax

折线图

上面的图就是折线图,折线图语法有三种

  • df.plot(x='Month', y='Tmax')

  • df.plot(x='Month', y='Tmax', kind='line')

  • df.plot.line(x='Month', y='Tmax')

df.plot.line(x='Month', y='Tmax')

plt.show()

a92307994470f8980cf5a229a868b7d7.png

#grid绘制格线

df.plot(x='Month', y='Tmax', kind='line', grid=True)

plt.show()

9bb8ccdee4c74f1aff7aac8a8aee7131.png

多个y值

上面的折线图中只有一条线, 如何将多个y绘制到一个图中

比如Tmax, Tmin

df.plot(x='Month', y=['Tmax', 'Tmin'])

plt.show()

608d186e9178b7d7911837abd348afc5.png

条形图

df.plot(x='Month',

y='Rain',

kind='bar')

#同样还可以这样画

#df.plot.bar(x='Month', y='Rain')

plt.show()

6ab143e008772158cb42920f1c56fa7d.png

水平条形图

bar环卫barh,就可以将条形图变为水平条形图

df.plot(x='Month',

y='Rain',

kind='barh')

#同样还可以这样画

#df.plot.bar(x='Month', y='Rain')

plt.show()

d0381927b01601c242a7d225f0229cc1.png

多个变量的条形图

df.plot(kind='bar',

x = 'Month',

y=['Tmax', 'Tmin'])

plt.show()

383dc3dd077ebf57ae17f744c4edb1d3.png

散点图

df.plot(kind='scatter',

x = 'Month',

y = 'Sun')

plt.show()

24dfcbe90100cbdbe49357510393f146.png

饼形图

df.plot(kind='pie', y='Sun')

plt.show()

397f56cda6f301f8fff0c74c3e447fd4.png

上图绘制有两个小问题:

  • legend图例不应该显示

  • 月份的显示用数字不太正规

df.index = ['Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec']

df.plot(kind='pie', y = 'Sun', legend=False)

plt.show()

49cfd0ed1febf6f1621ee42a2f6f1e91.png

更多数据

一开头的数据只有12条记录(12个月)的数据,现在我们用更大的伦敦天气数据

import pandas as pd

df2 = pd.read_csv('data/londonweather.csv')

df2.head()

08074094b99d38f833f976ddd3532243.png

df2.Rain.describe()

count 748.000000

mean 50.408957

std 29.721493

min 0.300000

25% 27.800000

50% 46.100000

75% 68.800000

max 174.800000

Name: Rain, dtype: float64

上面一共有748条记录, 即62年的记录。

箱型图

df2.plot.box(y='Rain')

#df2.plot(y='Rain', kind='box')

plt.show()

cfa033b85a9f18c6e208df9b2fe52203.png

直方图

df2.plot(y='Rain', kind='hist')

#df2.plot.hist(y='Rain')

plt.show()

96e9f5224a68706995596f269ec424e7.png

纵坐标的刻度可以通过bins设置

df2.plot(y='Rain', kind='hist', bins=[0,25,50,75,100,125,150,175, 200])

#df2.plot.hist(y='Rain')

plt.show()

ac17c797707fff436f1e8cd7c00593ad.png

多图并存

df.plot(kind='line',

y=['Tmax', 'Tmin', 'Rain', 'Sun'], #4个变量可视化

subplots=True, #多子图并存

layout=(2, 2), #子图排列2行2列

figsize=(20, 10)) #图布的尺寸

plt.show()

9e83833f8d9156aec4b03e8b664e4b9a.png

df.plot(kind='bar',

y=['Tmax', 'Tmin', 'Rain', 'Sun'], #4个变量可视化

subplots=True, #多子图并存

layout=(2, 2), #子图排列2行2列

figsize=(20, 10)) #图布的尺寸

plt.show()

0c513ed857131c60421e750d91a4093c.png

加标题

给可视化起个标题

df.plot(kind='bar',

y=['Tmax', 'Tmin'], #2个变量可视化

subplots=True, #多子图并存

layout=(1, 2), #子图排列1行2列

figsize=(20, 5),#图布的尺寸

title='The Weather of London') #标题

plt.show()

3bd035b2dca63e983a4e432013a0d21f.png

保存结果

可视化的结果可以存储为图片文件

df.plot(kind='pie', y='Rain', legend=False, figsize=(10, 5), title='Pie of Weather in London')

plt.savefig('img/pie.png')

plt.show()

cf8940b7e1a6c77fe0feeaa04c99e7d2.png

df.plot更多参数

df.plot(x, y, kind, figsize, title, grid, legend, style)

  • x 只有dataframe对象时,x可用。横坐标

  • y 同上,纵坐标变量

  • kind 可视化图的种类,如line,hist, bar, barh, pie, kde, scatter

  • figsize 画布尺寸

  • title 标题

  • grid 是否显示格子线条

  • legend 是否显示图例

  • style 图的风格

查看plot参数可以使用help

import pandas as pd

help(pd.DataFrame.plot)

377e1b2208603cd7ddcc7354e2356111.png


●编号936,输入编号直达本文

●输入m获取文章目录

38a8a373d2dc8a1cf60da6febe991427.gif

往期推荐

用Python,炫酷地图轻松绘制,一起来学习吧

世界Python开发调查统计报告,请查收

用Python,Bilibili二次元妹子视频轻松搞到手!

三个操作,让Python编程更细腻

这个大厂的副总裁又出事了!

3d54a60a59ac91cf0f7a62745a541918.png

708a35fb52010dbc2092dbcf262572c4.png

点击“阅读原文”,领取 2020 年最新免费技术资料大全

↓↓↓ 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/534279.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux课堂笔记(4)

常用指令:mv 1,隐藏文件 (1)windows通过设置属性隐藏文件 attrib h s 文件 attrib h s d:\net.txt attrib h s d:\net.txt (2)linux系统文件以点开始命名隐藏文件 mv /路径/源文件 /路径/目标…

实现输入提示 layui_ASP.NET Core SignalR :学习消息通讯,实现一个消息通知

什么是 SignalR目前我用业余时间正在做一个博客系统,其中有个功能就是评论通知,就是假如A用户评论B用户的时候,如果B用户首页处于打开状态,那么就会提示B用户有未读消息。暂时用SignalR来实现这个功能。我也是看了两天的资料才明白…

linux课堂笔记(5)

vi编辑器 1,vi版本:vi —— vim ps:查看进程 进程 ID 时间 终端 进程名称 ps -t 终端(查看指定终端进程) vi 回车(提示vi版本信息) 2,vi特点 (1)…

两个字和三个字一样宽_武汉国庆出行 记好三个字

武汉国庆出行国庆黄金周带你一起见证奇迹乐在武汉国庆去哪儿玩?记住:三 个 字欢乐谷记住【欢乐谷】三个字,你就不会迷路!不算白来。欢乐谷有啥好?免费!国庆期间,欢乐谷面向全国人民免费开放&…

linux课堂笔记(6)

设置文件访问权限: 1,通过字母设置:参数 字母 (1)用户类型: u 拥有者 g 同组用户 o 其他用户 a所有用户 (2)权限:r 读 w 写 x执行 注:目录权…

什么标签用于在表单中构建复选框_UI/UX笔记之如何设计好表单

原文链接:UI/UX笔记之如何设计好表单 | 须臾所学免费设计资源网​presentationvip.com无论是注册流程,多视图步骤程序还是单调的数据输入界面,表单都是数字产品设计中最重要的组成部分之一。本文重点介绍表单设计的常见事项。请记住&#xff…

linux课堂笔记(7)

编译器&#xff1a;gcc 格式&#xff1a;gcc [参数] <源程序> gcc test.c 注&#xff1a;默认生成可执行程序a.out&#xff08;windows默认test.exe&#xff09; ./a.out gcc -o 可执行文件 源程序 gcc -o test.exe test.c&#xff08;windows&#xff09; g…

mqtt 发送消息过多_阿里云MQTT服务端注解式消息处理分发与同步调用实践小结

一、前言前段时间公司预研了设备app端与服务端的交互方案&#xff0c;出于多方面考量最终选用了阿里云的微服务队列MQTT方案&#xff0c;基于此方案&#xff0c;本人主要实践有&#xff1a;1. 封装了RocketMQ实现MQTT订阅与发布的实现细节&#xff1b;2. 实现了注解式分发处理&…

linux课堂笔记(8)

磁盘分区工具&#xff08;parted&#xff09; 1&#xff0c;语法&#xff1a; parted 磁盘 注&#xff1a;磁盘类型&#xff08;根据接口划分&#xff09; &#xff08;1&#xff09;IDE-hd&#xff0c;hda&#xff0c;hdc&#xff08;光驱&#xff09;&#xff0c;hdd 加…

css引入矢量图标_WEB 项目开发中的图标管理解决方案

相信很多前端开发人员在项目开发过程中都会遇到这样一个问题&#xff1a;页面的图标发生改动&#xff0c;需要往图标文件中追加新的图标&#xff0c;却因为图标文件已经打包好而无从下手&#xff0c;重新制作一份图标文件吧&#xff0c;要考虑替换整个项目的图标&#xff0c;工…

判断按键值_Pygame(九)按键事件(2)

Pygame(九)按键事件(2)前情提要前情提要作业解析完整代码# /usr/bin/python3# Author: 爱编程的章老师# Time: 2021/1/7 0007# E-mail: Bluesand2010163.comimport pygame, sys, timefrom random import randintdef homework():作业 挡板接球 一个宽100 ,高10的棕色挡板,…

动态添加input_前端提效必备:动态模版生成

前言在日常开发中&#xff0c;我们需要不停的新建页面和组件。以 Vue 项目为例&#xff0c;我们在新建一个页面的时候&#xff0c;需要经历一遍又一遍重复的过程&#xff1a;1、先新建一个文件夹2、然后新建一个 .vue 文件&#xff0c;写上 、", "" ],"…

在dom最前面插入_JavaScript中的DOM

1. 关于DOM文档对象模型(DocumentObject Model)&#xff0c;是基于浏览器编程的一套API接口&#xff0c;W3C出台的推荐标准&#xff0c;每个浏览器都有一些细微的差别&#xff0c;其中以Mozilla(火狐)的浏览器最与标准接近。通过 DOM&#xff0c;可以访问所有的 HTML元素&#…

python 快速删除程序_如何快速一次性卸载所有python包(第三方库)呢

很多时候我们都会有一个麻烦事&#xff0c;就是打开pycharm或者VScode等的时候&#xff0c;都有可能因为自己电脑上面安装的第三方模块过多&#xff0c;导致电脑很卡&#xff0c;风扇转速不停地增加&#xff0c;这时候我们就会想去卸载一些不太用得着的第三方模块&#xff0c;但…

python正则表达式修饰符_Python正则表达式

正则表达式是一个特殊的字符序列&#xff0c;它能帮助你方便的检查一个字符串是否与某种模式匹配。re 模块使 Python 语言拥有全部的正则表达式功能。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。r…

当代最值得收藏的画家作品_当代最具潜力和收藏价值的十大画家

原标题&#xff1a;当代最具潜力和收藏价值的十大画家当代从事绘画的人成千上万&#xff0c;哪些名家作品值得收藏&#xff1f;当前都有哪些“潜力股”&#xff0c;相关专家综合市场分析&#xff0c;纯从艺术水准上列出值得收藏的“潜力股”&#xff0c;供爱好书画收藏的各界人…

备抵附加账户的期末余额_会计账户的分类(二)

待摊费用账户的格式和运用方法同盘存类账户&#xff0c;即&#xff1a;期初如果有余额在借方&#xff0c;本期发生额的增加数在借方&#xff0c;本期发生额的减少数在贷方&#xff0c;期末如果有余额在借方。预提费用账户是指用来核算和监督按规定预先提取计入当期&#xff0c;…

mysql union all 别名_mysql union和union all

如下先创建2个表&#xff0c;aa bb.CREATE table aa(uid int(20) not null,name VARCHAR(30) not null)engineinnodb default charsetutf8mb4 COLLATE utf8mb4_general_ci;INSERT INTO aa(uid, name) VALUES (10, 张芳);INSERT INTO aa(uid, name) VALUES (11, 王凯);INSERT IN…

MySQL不走联合索引_mysql group by 多列优化思路?为什么不走联合索引?

explain SELECT a, b, COUNT(*) FROM tbnameGROUP BY a, border by a DESClimit 1a 和 b 列已经设置联合索引&#xff0c; 为什么这种操作也会执行全表扫描呢&#xff1f;explain SELECT a, b FROM tbnameGROUP BY a, border by a DESC去掉 COUNT 和 limit 则走索引没有扫描&am…

mysql ddl 锁_MySQL Online DDL导致全局锁表案例分析

MySQL Online DDL导致全局锁表案例分析我这边遇到了什么问题?线上给某个表执行新增索引SQL, 然后整个数据CPU打到100%, 连接数暴增到极限, 最后导致所有访问数据库的应用都奔溃.SQL如下:ALTER TABLE bookADD INDEX idx_sub_title (sub_title ASC);能看到什么?10063293, root,…