graphpad做折线图坐标轴数字_pandas做数据可视化具体操作,快来看看吧

来自公众号:大邓和他的Python

2afa65eda54a61190136e249cdf07695.png

常见的数据可视化库有:

  • matplotlib 是最常见的2维库,可以算作可视化的必备技能库,由于matplotlib是比较底层的库,api很多,代码学起来不太容易。

  • seaborn 是建构于matplotlib基础上,能满足绝大多数可视化需求。更特殊的需求还是需要学习matplotlib

  • pyecharts 上面的两个库都是静态的可视化库,而pyecharts有很好的web兼容性,可以做到可视化的动态效果。

但是在数据科学中,几乎都离不开pandas数据分析库,而pandas可以做

  • 数据采集 如何批量采集网页表格数据?

  • 数据读取  pd.read_csv/pd.read_excel

  • 数据清洗(预处理)  理解pandas中的apply和map的作用和异同

  • 可视化,兼容matplotlib语法(今天重点)

在本文我们可以学到用pandas做

  • 导入数据

  • 绘制最简单的图plot()

  • 多个y的绘制图

  • 折线图、条形图、饼形图和散点图绘制

  • 统计信息绘图

  • 箱型图

  • 轴坐标刻度

  • plot()更多精细化参数

  • 可视化结果输出保存

准备工作

如果你之前没有学过pandas和matpltolib,我们先安装好这几个库

!pip3 install numpy

!pip3 install pandas

!pip3 install matplotlib

已经安装好,现在我们导入这几个要用到的库。使用的是伦敦天气数据,一开始我们只有12个月的小数据作为例子

#jupyter notebook中需要加这行代码

%matplotlib inline

import matplotlib.pyplot as plt

import numpy as np

import pandas as pd

#读取天气数据

df = pd.read_csv('data/london2018.csv')

df

e5ee256b92fce60f4c037f8f1ff8ac57.png

plot最简单的图

选择Month作为横坐标,Tmax作为纵坐标,绘图。

大家注意下面两种写法

#写法1

df.plot(x='Month', y='Tmax')

plt.show()

a92307994470f8980cf5a229a868b7d7.png

  • 横坐标轴参数x传入的是df中的列名Month

  • 纵坐标轴参数y传入的是df中的列名Tmax

折线图

上面的图就是折线图,折线图语法有三种

  • df.plot(x='Month', y='Tmax')

  • df.plot(x='Month', y='Tmax', kind='line')

  • df.plot.line(x='Month', y='Tmax')

df.plot.line(x='Month', y='Tmax')

plt.show()

a92307994470f8980cf5a229a868b7d7.png

#grid绘制格线

df.plot(x='Month', y='Tmax', kind='line', grid=True)

plt.show()

9bb8ccdee4c74f1aff7aac8a8aee7131.png

多个y值

上面的折线图中只有一条线, 如何将多个y绘制到一个图中

比如Tmax, Tmin

df.plot(x='Month', y=['Tmax', 'Tmin'])

plt.show()

608d186e9178b7d7911837abd348afc5.png

条形图

df.plot(x='Month',

y='Rain',

kind='bar')

#同样还可以这样画

#df.plot.bar(x='Month', y='Rain')

plt.show()

6ab143e008772158cb42920f1c56fa7d.png

水平条形图

bar环卫barh,就可以将条形图变为水平条形图

df.plot(x='Month',

y='Rain',

kind='barh')

#同样还可以这样画

#df.plot.bar(x='Month', y='Rain')

plt.show()

d0381927b01601c242a7d225f0229cc1.png

多个变量的条形图

df.plot(kind='bar',

x = 'Month',

y=['Tmax', 'Tmin'])

plt.show()

383dc3dd077ebf57ae17f744c4edb1d3.png

散点图

df.plot(kind='scatter',

x = 'Month',

y = 'Sun')

plt.show()

24dfcbe90100cbdbe49357510393f146.png

饼形图

df.plot(kind='pie', y='Sun')

plt.show()

397f56cda6f301f8fff0c74c3e447fd4.png

上图绘制有两个小问题:

  • legend图例不应该显示

  • 月份的显示用数字不太正规

df.index = ['Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec']

df.plot(kind='pie', y = 'Sun', legend=False)

plt.show()

49cfd0ed1febf6f1621ee42a2f6f1e91.png

更多数据

一开头的数据只有12条记录(12个月)的数据,现在我们用更大的伦敦天气数据

import pandas as pd

df2 = pd.read_csv('data/londonweather.csv')

df2.head()

08074094b99d38f833f976ddd3532243.png

df2.Rain.describe()

count 748.000000

mean 50.408957

std 29.721493

min 0.300000

25% 27.800000

50% 46.100000

75% 68.800000

max 174.800000

Name: Rain, dtype: float64

上面一共有748条记录, 即62年的记录。

箱型图

df2.plot.box(y='Rain')

#df2.plot(y='Rain', kind='box')

plt.show()

cfa033b85a9f18c6e208df9b2fe52203.png

直方图

df2.plot(y='Rain', kind='hist')

#df2.plot.hist(y='Rain')

plt.show()

96e9f5224a68706995596f269ec424e7.png

纵坐标的刻度可以通过bins设置

df2.plot(y='Rain', kind='hist', bins=[0,25,50,75,100,125,150,175, 200])

#df2.plot.hist(y='Rain')

plt.show()

ac17c797707fff436f1e8cd7c00593ad.png

多图并存

df.plot(kind='line',

y=['Tmax', 'Tmin', 'Rain', 'Sun'], #4个变量可视化

subplots=True, #多子图并存

layout=(2, 2), #子图排列2行2列

figsize=(20, 10)) #图布的尺寸

plt.show()

9e83833f8d9156aec4b03e8b664e4b9a.png

df.plot(kind='bar',

y=['Tmax', 'Tmin', 'Rain', 'Sun'], #4个变量可视化

subplots=True, #多子图并存

layout=(2, 2), #子图排列2行2列

figsize=(20, 10)) #图布的尺寸

plt.show()

0c513ed857131c60421e750d91a4093c.png

加标题

给可视化起个标题

df.plot(kind='bar',

y=['Tmax', 'Tmin'], #2个变量可视化

subplots=True, #多子图并存

layout=(1, 2), #子图排列1行2列

figsize=(20, 5),#图布的尺寸

title='The Weather of London') #标题

plt.show()

3bd035b2dca63e983a4e432013a0d21f.png

保存结果

可视化的结果可以存储为图片文件

df.plot(kind='pie', y='Rain', legend=False, figsize=(10, 5), title='Pie of Weather in London')

plt.savefig('img/pie.png')

plt.show()

cf8940b7e1a6c77fe0feeaa04c99e7d2.png

df.plot更多参数

df.plot(x, y, kind, figsize, title, grid, legend, style)

  • x 只有dataframe对象时,x可用。横坐标

  • y 同上,纵坐标变量

  • kind 可视化图的种类,如line,hist, bar, barh, pie, kde, scatter

  • figsize 画布尺寸

  • title 标题

  • grid 是否显示格子线条

  • legend 是否显示图例

  • style 图的风格

查看plot参数可以使用help

import pandas as pd

help(pd.DataFrame.plot)

377e1b2208603cd7ddcc7354e2356111.png


●编号936,输入编号直达本文

●输入m获取文章目录

38a8a373d2dc8a1cf60da6febe991427.gif

往期推荐

用Python,炫酷地图轻松绘制,一起来学习吧

世界Python开发调查统计报告,请查收

用Python,Bilibili二次元妹子视频轻松搞到手!

三个操作,让Python编程更细腻

这个大厂的副总裁又出事了!

3d54a60a59ac91cf0f7a62745a541918.png

708a35fb52010dbc2092dbcf262572c4.png

点击“阅读原文”,领取 2020 年最新免费技术资料大全

↓↓↓ 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/534279.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

实现输入提示 layui_ASP.NET Core SignalR :学习消息通讯,实现一个消息通知

什么是 SignalR目前我用业余时间正在做一个博客系统,其中有个功能就是评论通知,就是假如A用户评论B用户的时候,如果B用户首页处于打开状态,那么就会提示B用户有未读消息。暂时用SignalR来实现这个功能。我也是看了两天的资料才明白…

两个字和三个字一样宽_武汉国庆出行 记好三个字

武汉国庆出行国庆黄金周带你一起见证奇迹乐在武汉国庆去哪儿玩?记住:三 个 字欢乐谷记住【欢乐谷】三个字,你就不会迷路!不算白来。欢乐谷有啥好?免费!国庆期间,欢乐谷面向全国人民免费开放&…

什么标签用于在表单中构建复选框_UI/UX笔记之如何设计好表单

原文链接:UI/UX笔记之如何设计好表单 | 须臾所学免费设计资源网​presentationvip.com无论是注册流程,多视图步骤程序还是单调的数据输入界面,表单都是数字产品设计中最重要的组成部分之一。本文重点介绍表单设计的常见事项。请记住&#xff…

mqtt 发送消息过多_阿里云MQTT服务端注解式消息处理分发与同步调用实践小结

一、前言前段时间公司预研了设备app端与服务端的交互方案,出于多方面考量最终选用了阿里云的微服务队列MQTT方案,基于此方案,本人主要实践有:1. 封装了RocketMQ实现MQTT订阅与发布的实现细节;2. 实现了注解式分发处理&…

css引入矢量图标_WEB 项目开发中的图标管理解决方案

相信很多前端开发人员在项目开发过程中都会遇到这样一个问题:页面的图标发生改动,需要往图标文件中追加新的图标,却因为图标文件已经打包好而无从下手,重新制作一份图标文件吧,要考虑替换整个项目的图标,工…

判断按键值_Pygame(九)按键事件(2)

Pygame(九)按键事件(2)前情提要前情提要作业解析完整代码# /usr/bin/python3# Author: 爱编程的章老师# Time: 2021/1/7 0007# E-mail: Bluesand2010163.comimport pygame, sys, timefrom random import randintdef homework():作业 挡板接球 一个宽100 ,高10的棕色挡板,…

动态添加input_前端提效必备:动态模版生成

前言在日常开发中,我们需要不停的新建页面和组件。以 Vue 项目为例,我们在新建一个页面的时候,需要经历一遍又一遍重复的过程:1、先新建一个文件夹2、然后新建一个 .vue 文件,写上 、", "" ],"…

在dom最前面插入_JavaScript中的DOM

1. 关于DOM文档对象模型(DocumentObject Model),是基于浏览器编程的一套API接口,W3C出台的推荐标准,每个浏览器都有一些细微的差别,其中以Mozilla(火狐)的浏览器最与标准接近。通过 DOM,可以访问所有的 HTML元素&#…

当代最值得收藏的画家作品_当代最具潜力和收藏价值的十大画家

原标题:当代最具潜力和收藏价值的十大画家当代从事绘画的人成千上万,哪些名家作品值得收藏?当前都有哪些“潜力股”,相关专家综合市场分析,纯从艺术水准上列出值得收藏的“潜力股”,供爱好书画收藏的各界人…

mysql union all 别名_mysql union和union all

如下先创建2个表,aa bb.CREATE table aa(uid int(20) not null,name VARCHAR(30) not null)engineinnodb default charsetutf8mb4 COLLATE utf8mb4_general_ci;INSERT INTO aa(uid, name) VALUES (10, 张芳);INSERT INTO aa(uid, name) VALUES (11, 王凯);INSERT IN…

ci框架 乱码 mysql_mysql容器乱码问题

在docker-compose.yml文件中定义mysql导入utf-8的万国码services:mysql:image:mysql:5.7# command: [--character-set-serverutf8mb4, --collation-serverutf8mb4_unicode_ci]volumes:-./data/docker/mysql:/var/lib/mysql-./mysql/:/docker-entrypoint-initdb.d/-./conf/mys…

mysql分表 查询 优化_MySQL性能管理及架构(查询优化、分库分表)一遍文章搞定...

相关配置参数:slow_query_log # 启动停止记录慢查日志,慢查询日志默认是没有开启的可以在配置文件中开启(on)slow_query_log_file # 指定慢查日志的存储路径及文件,日志存储和数据从存储应该分开存储long_query_time # 指定记录慢查询日志SQL…

mysql临时表 清空_在数据库中临时表什么时候会被清除呢

展开全部我们仍使用 实验 05 中的环境,略去准备数据的过程。我们仍然使用两个会话,62616964757a686964616fe59b9ee7ad9431333433646439一个会话 run,用于运行主 SQL;另一个会话 ps,用于进行 performance_schema 的观察…

python医学图像分割_基于cv2的医学图像分割

例如,图像如下所示:import cv2import numpy as npimg cv2.imread("mdb168.pgm",0)import matplotlib.pyplot as pltplt.imshow(img, cmap"gray")我想删除图像中所有的伪影和不必要的部分。在为此,我首先对图像进行二值化…

ubuntu下使用python将ppt转成图片_Ubuntu下使用Python实现游戏制作中的切分图片功能...

本文实例讲述了Ubuntu下使用Python实现游戏制作中的切分图片功能。分享给大家供大家参考,具体如下:why拿到一个人物行走的素材,要用TexturePacker打包。TexturePacker打包后,助于游戏加载图片效率,且比较好管理。目前得…

世上最简单的mysql_mysql这样学最简单|基本操作上

这是数据库系列的第一篇文章,主要是对mysql的基本操作有一个了解。本系列的教程会先从基础出发,逐步过渡到优化。一、前提在这里我们不会从如何去安装数据库开始讲起,而是在安装完之后从操作数据库开始,文中所有的代码均在我自己的…

zabbix4.0添加mysql报警_Zabbix4.0系统告警“Zabbix server is not running”

第一步: 查看系统日志,进一步确认原因1 cat /var/log/zabbix/zabbix_server.log问题出现在数据库。第二步 数据库确认1 mysql -u root -p #root用户登陆数据库如果登录不成功,就看一下登录密码是否正确以及zabbix用户是否有权限登录数据库。1…

影响索引的mysql函数_mysql索引对排序的影响实例分析

本文实例讲述了mysql索引对排序的影响。分享给大家供大家参考,具体如下:索引不仅能提高查询速度,还可以添加排序速度,如果order by 后面的语句用到了索引,那么将会提高排序的速度。测试1、创建测试表:t15表…

php如何对 mysql 中text类型拆分存入一个数组_PHP递归实现无限级分类,可选返回字符串和数组...

正 文:在一些复杂的系统中,要求对信息栏目进行无限级的分类,以增强系统的灵活性。那么PHP是如何实现无限级分类的呢?我们在本文中使用递归算法并结合mysql数据表实现无限级分类。递归,简单的说就是一段程序代码的重复调…

python 开发框架 ant_Golang/python语言开发的分布式游戏服务器框架 mqant

软件介绍mqantmqant 是一款基于 Golang 语言的简洁,高效,高性能的分布式游戏服务器框架,研发的初衷是要实现一款能支持高并发,高性能,高实时性的游戏服务器框架,也希望 mqant 未来能够做即时通讯和物联网方…