python boxplot orient_Python 可视化 | Seaborn5 分钟入门 (三)——boxplot 和 violinplot

微信公众号:「Python读财」

如有问题或建议,请公众号留言

Seaborn是基于matplotlib的Python可视化库。 它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,不需要经过大量的调整就能使你的图变得精致。

注:所有代码均在IPython notebook中实现

boxplot

箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。它能显示出一组数据的最大值、最小值、中位数及上下四分位数。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。图解如下:

接下来我们介绍Seaborn中的箱型图的具体实现方法,这是boxplot的API:

seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)

我们从具体的实例出发

%matplotlib inline

import pandas as pd

import numpy as np

import seaborn as sns

import matplotlib.pyplot as plt

plt.rc("font",family="SimHei",size="15")  #解决中文乱码问题

本文所使用的数据集是鸢尾花卉数据集

data.head(6)

x,y:dataframe中的列名(str)或者矢量数据

data:dataframe或者数组

sns.boxplot(x=data["pw"],data=data)

palette:调色板,控制图像的色调

fig,axes=plt.subplots(1,2,sharey=True)

sns.boxplot(x="catagory",y="pw",data=data,ax=axes[0]) #左图

sns.boxplot(x="catagory",y="pw",data=data,palette="Set3",ax=axes[1]) #右图

hue(str):dataframe的列名,按照列名中的值分类形成分类的条形图

sns.boxplot(x="color",y="pl",data=data,hue="catagory",palette="Set3")

order, hue_order (lists of strings):用于控制条形图的顺序

sns.boxplot(x="catagory",y="pw",data=data,palette="Set3",order=[2,1,0])

orient:"v"|"h" 用于控制图像使水平还是竖直显示(这通常是从输入变量的dtype推断出来的,此参数一般当不传入x、y,只传入data的时候使用)

fig,axes=plt.subplots(2,1)

sns.boxplot(data=data,orient="v",palette="Set3",ax=axes[0])  #竖直显示

sns.boxplot(data=data,orient="h",palette="Set3",ax=axes[1])  #水平显示

fliersize:float,用于指示离群值观察的标记大小

fig,axes=plt.subplots(1,2)

sns.boxplot(x="color",y="pl",data=data,ax=axes[0]) #fliersize默认为5

sns.boxplot(x="color",y="pl",data=data,fliersize=20,ax=axes[1])

whis: 确定离群值的上下界(IQR超过低和高四分位数的比例),此范围之外的点将被识别为异常值。IQR指的是上下四分位的差值。

fig,axes=plt.subplots(1,2)

sns.boxplot(x="color",y="pl",data=data,whis=1,ax=axes[0])  #左图

sns.boxplot(x="color",y="pl",data=data,whis=2,ax=axes[1])  #右图

width: float,控制箱型图的宽度

fig,axes=plt.subplots(1,2)

sns.boxplot(x="color",y="pl",data=data,width=0.3,ax=axes[0])  #左图

sns.boxplot(x="color",y="pl",data=data,width=0.8,ax=axes[1])  #右图

violinplot

violinplot与boxplot扮演类似的角色,它显示了定量数据在一个(或多个)分类变量的多个层次上的分布,这些分布可以进行比较。不像箱形图中所有绘图组件都对应于实际数据点,小提琴绘图以基础分布的核密度估计为特征。具体用法如下:

seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True, gridsize=100, width=0.8, inner='box', split=False, dodge=True, orient=None, linewidth=None, color=None, palette=None, saturation=0.75, ax=None, **kwargs)

实例所用的数据集如下:

data.head(6)

在这里就不再介绍x,y,hue,data,order,hue_order,palette 参数的用法,这些参数的用法和之前介绍的图形的用法是一样的,如有需要可以查看之前的内容。

先来画一个小提琴图:

sns.violinplot(x="gender",y="age",data=data)

split: 将split设置为true则绘制分拆的violinplot以比较经过hue拆分后的两个量:

fig,axes=plt.subplots(2,1)

ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",split=True,ax=axes[0]) #上图,拆分后的图

ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",ax=axes[1])  #下图

scale_hue:bool,当使用色调变量(hue参数)嵌套小提琴时,此参数确定缩放是在主要分组变量(scale_hue = true)的每个级别内还是在图上的所有小提琴(scale_hue = false)内计算出来的。

fig,axes=plt.subplots(2,1)

ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",split=True,scale_hue=False,ax=axes[0]) #上图

ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",split=True,scale_hue=True,ax=axes[1])  #下图

orient:"v"|"h" 用于控制图像使水平还是竖直显示(这通常是从输入变量的dtype推断出来的,此参数一般当不传入x、y,只传入data的时候使用)

fig,axes=plt.subplots(2,1)

sns.violinplot(data=data[["height","weight","age"]],orient="v",ax=axes[0]) #上图

sns.violinplot(data=data[["height","weight","age"]],orient="h",ax=axes[1]) #下图

inner:控制violinplot内部数据点的表示,有'box','quartile','point','stick'四种方式。

fig,axes=plt.subplots(2,2)

sns.violinplot(x="color",y="age",data=data,inner="box",ax=axes[0,0])  #钢琴图内显示箱型图(左上)

sns.violinplot(x="color",y="age",data=data,inner="quartile",ax=axes[0,1])  #钢琴图内显示四分位数线(右上)

sns.violinplot(x="color",y="age",data=data,inner="point",ax=axes[1,0])  #钢琴图内显示具体数据点(左下)

sns.violinplot(x="color",y="age",data=data,inner="stick",ax=axes[1,1])  #钢琴图内显示具体数据棒(右下)

scale: 该参数用于缩放每把小提琴的宽度,有'area','count','width'三种方式

fig,axes=plt.subplots(3,1)

sns.violinplot(x="color",y="age",data=data,scale="area",ax=axes[0]) #如果为"area",每把小提琴将有相同的面积(上图)

sns.violinplot(x="color",y="age",data=data,scale="count",ax=axes[1])  #如果为"count",小提琴的宽度将根据该小组中观察的数量来缩放(中图)

sns.violinplot(x="color",y="age",data=data,scale="width",ax=axes[2])  #如果为"age",每把小提琴将有相同的宽度(下图)

cut: float,距离,以带宽大小为单位,以控制小提琴图外壳延伸超过内部极端数据点的密度。设置为0以将小提琴范围限制在观察数据的范围内(即,在ggplot中具有与trim = true相同的效果)

fig,axes=plt.subplots(2,1)

sns.violinplot(x="age",y="gender",data=data,ax=axes[0]) #上图

sns.violinplot(x="age",y="gender",data=data,cut=0,ax=axes[1])  #下图

width: float,控制钢琴图的宽度(比例)

fig,axes=plt.subplots(2,1)

sns.violinplot(x="color",y="age",data=data,ax=axes[0],width=0.5)  #上图

sns.violinplot(x="color",y="age",data=data,ax=axes[1],width=0.9)  #下图

这已经是Seaborn入门系列的第三篇文章了,相信大家已经大概了解Seaborn的作图过程,也可以体会到用Seaborn作图相比于matplotlib更加简单。以上内容是我结合官方文档和自己的一点理解写成的,有什么错误大家可以指出来并提提意见,共同交流、进步,也希望我写的这些能够给阅读完本文的你或或少的帮助!

关注我的公众号「Python读财」,后台回复「py」即可获取Python学习资源礼包,还有Python学习交流群哦!

本作品采用《CC 协议》,转载必须注明作者和本文链接

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/527305.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

kibana 更新 索引模式_升级 Kibana - Kibana 中文文档

IMPORTANT:在升级 Kibana 之前:请参考重要变更文档。在升级生产服务之前请先在测试环境测试升级。使用 Elasticsearch 的 snapshots 特性备份数据。除非存在备份数据,否则版本 不能向前回滚 。如果使用了自定义插件,检查其是否有兼容版本。从…

oracle裁员原因_Oracle大幅度裁员意味着什么?

近日,Oracle开始大幅度裁撤中国区研发中心(CDC),整个CDC一共1600人,被裁掉的将有900人,近六成的员工将面临失业。Oracle中国如此大动作裁员的原因究竟是什么呢?2018财年,甲骨文总营收为398.31亿美元&#x…

oracle计算1到一百偶数的和,Perl 打印在1..100内所有偶数和奇数

#!/usr/bin/perl -w#本程序用来打印#1-100的所有偶数#1-100的所有奇数#1-100里所有以1、2、7结尾的数for(my $i1;$i<100;$i){if (!($i % 2)){print "$i\t";}}print "\n";for(my $i1;$i<100;$i){if ($i % 2){print "$i\t";}}print "\n…

python微信集成_Python微信公众号后台开发005:集成智能聊天机器人​

​给公众号集成一个智能聊天机器人一、前述ChatterBot是一个基于机器学习的聊天机器人引擎&#xff0c;构建在python上&#xff0c;主要特点是可以自可以从已有的对话中进行学(jiyi)习(pipei)。二、具体1、安装是的&#xff0c;安装超级简单&#xff0c;用pip就可以啦pip insta…

django oracle 性能,4.利用Django在前端展示Oracle 状态趋势

利用Django在前端展示Oracle 状态趋势2017-12-15 Python 宅必备开发环境操作系统:CentOS 7.4Python版本 :3.6Django版本: 1.10.5操作系统用户:oms数据处理:pandas前端展示:highcharts通过上面我们已介绍了如何定时获取系统Oracle状态语句以及如何利用pandas处理成highcharts识别…

分段二次插值例题_分段三次插值

摘要用函数来表示变量间的数量关系广泛应用于各学科领域&#xff0c;但是在实际问题中&#xff0c;往往是通过实验、观测以及计算等方法&#xff0c;得到的是函数在一些点上的函数值。如何通过这些离散数据找到函数的一个满足精度要求且便于使用的近似表达式&#xff0c;是经常…

linux文件在哪个分区,linux下肿么查看目录所在的分区

1、用df 命令查看查看目录所在分区&#xff0c;例如查看/var目录所在分区&#xff1a;[rootlocalhost var]# df -h /varFilesystem Size Used Avail Use% Mounted on/dev/mapper/vg1-lvroot 51G 2.6G 46G 6% /mounted on 列下面就是所在的分区2、如果还想看磁盘分区情况&#x…

linux 格式化 目录,Linux 磁盘分区、格式化、目录挂载

实验环境: Citrix虚拟化, RHEL6.4系统环境本文目的: 熟悉Linux的基本磁盘分区、格式化、目录挂载。1.显示当前主机目录2.磁盘分区3.磁盘格式化4.挂载目录1. 显示当前主机目录命令df -h[rootlocalhost ~]# df -hFilesystem Size Used Avail Use% Mounted on/dev/map…

通州区机器人比赛活动总结_机器人大赛赛后总结

机器人大赛赛后总结机器人大赛结束了&#xff0c;每个科协人都缓和了一下自己忙碌的节奏。在比赛这段时间里&#xff0c;大家都辛苦地准备了很久&#xff0c;尽管在比赛中有着不尽如人意的地方&#xff0c;比赛也落下了完美的帷幕。赛后我们认真总结了此次活动中出现的问题。首…

linux用分词系统,Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词)

1、环境准备CentOS6.4、Tomcat6.0、Jdk1.7、Solr4.8.1、IK Analyzer 2012FF_hf12、配置步骤(1)下载IK Analyzer分词包&#xff0c;解压缩(2)将IKAnalyzer2012FF_u1.jar拷贝到solr服务的目录solr/WEB-INF/lib下cp /usr/download/IK Analyzer 2012FF_hf1/IKAnalyzer2012FF_u1.jar…

python我的世界服务器_Python取Minecraft服务器信息

最近猛玩Minecraft&#xff0c;无聊之下写了这个东西&#xff0c;可以取到版本&#xff0c;在线人数&#xff0c;最大人数。import socketimport codecsclass mcstatus:def __init__(self,hostname,port,timeout 0.6):self.hostname hostnameself.timeout timeoutself.port …

华为内部存储转sd卡_怎样把华为手机内存的东西传、转到SD卡中呢

2016-08-24华为mate8手机里没有SD卡有关系吗华为Mate8支持SD卡锁功能&#xff0c;下面小编就来讲讲SD卡锁如何使用。一、当前手机没有设置SD卡密码功能&#xff0c; 手机一旦丢失&#xff0c;SD卡中的内容也将泄露&#xff1b;Mate 8支持SD卡加密功能&#xff0c;通过对SD加密&…

linux隔一级目录找文件,linux查看文件和子目录

Q4&#xff1a;linux查找当前目录下所有子目录特定文件类型需要查找的文件内容1、find [选项] [目录] [条件] [动作]如果不指定任何目录&#xff0c;find将会查找当前目录。如果 不指定条件&#xff0c;则条件相当于“true”&#xff0c;这样会把全部文件都找出来。选项、条件和…

linux c程序加args,C/C++可变参数,“## __VA_ARGS__”宏的介绍和使用

在阅读代码的时候&#xff0c;在一个宏定义语句中&#xff0c;发现了个之前未曾见过的编译器预定义宏&#xff1a;“__VA_ARGS__”。当时&#xff0c;从代码语句中推测它代表宏参数&#xff1a;“…”(本文称之为省略号)&#xff0c;依稀记得printf函数声明中有使用这个省略号&…

python梦幻西游鼠标偏移_【按键盒子】梦幻西游解决鼠标漂移问题

Gosub GetFbl//Gosub 点击任务红名/////获取窗口分辨率///Sub GetFbl//左上角找图FindPic 0, 0, 1024, 768, "Attachment:\zsj.bmp", 0.9, intX1, intY1If intX1 < 0MessageBox "未找到窗口左上角"Else//定位窗口右下角Delay 10FindPic 0, 0, 1024, 768…

linux看java堆大小,linux 改java堆内存大小

linux 改java堆内存大小[2021-02-08 23:06:29] 简介:linux查内存大小的方法&#xff1a;首先打开应用程序&#xff1b;然后选择系统工具选项&#xff0c;并单击系统终端选项&#xff1b;接着在系统终端命令行输入【free -h】命令&#xff1b;最后在结果中找到total即可查看到系…

脉冲宽度调制pdm_PWM (脉冲宽度调制)原理与实现

原理与实现1、PWM原理2、调制器设计思想3、具体实现设计一、PWM(脉冲宽度调制Pulse Width Modulation)原理&#xff1a;脉冲宽度调制波通常由一列占空比不同的矩形脉冲构成&#xff0c;其占空比与信号的瞬时采样值成比例。图1所示为脉冲宽度调制系统的原理框图和波形图。该系统…

arch linux简体中文,User-mode Linux (简体中文)

本文或本节需要翻译。要贡献翻译&#xff0c;请访问简体中文翻译团队。什么是 user-mode-linux?User-mode-linux (UML) 是让一个linux作为一个独立进程运行在另一个linux上。 请在[1] 查找 uml 的详细安装使用指南。这篇 wiki 文章是 这帖[失效链接 2020-08-06 ⓘ] 概要。 如果…

cad常用字体包_CAD制图初学入门如何学好CAD?CAD大神总结5点诀窍,必须收藏

现在有很多的小伙伴们都加入到了CAD这个大家庭中&#xff0c;一开始都是都是一脸懵的状态&#xff0c;更不知要从何入手&#xff01;小编才开始也是&#xff0c;但是只要掌握好CAD的技巧和脊髓&#xff0c;一切都不是事。CAD大神总结5点诀窍&#xff0c;悄悄告诉你&#xff0c;…

栈windows linux,Linux+Windows: 程序崩溃时,在 C++ 代码中,如何获取函数调用栈信息...

一、前言程序在执行过程中 crash 是非常严重的问题&#xff0c;一般都应该在测试阶段排除掉这些问题&#xff0c;但是总会有漏网之鱼被带到 release 阶段。因此&#xff0c;程序的日志系统需要侦测这种情况&#xff0c;在代码崩溃的时候获取函数调用栈信息&#xff0c;为 debug…