MATLAB 命令 BOXPLOT

Matlab中有关boxplot(X)命令的解释:

boxplot(X) produces a box and whisker plot for each column of the matrix X. The box has lines at the lower quartile, median, and upper quartile values. Whiskers extend from each end of the box to the adjacent values in the data—by default, the most extreme values within 1.5 times the interquartile range from the ends of the box. Outliers are data with values beyond the ends of the whiskers. Outliers are displayed with a red + sign.

格式

boxplot(X) %产生矩阵X的每一列的盒图和“须”图,“须”是从盒的尾部延伸出来,并表示盒外数据长度的线,如果“须”的外面没有数据,则在“须”的底部有一个点。
boxplot(X,notch) %当notch=1时,产生一凹盒图,notch=0时产生一矩箱图。
boxplot(X,notch,‘sym’) %sym表示图形符号,默认值为“+”。
boxplot(X,notch,‘sym’,vert) %当vert=0时,生成水平盒图,vert=1时,生成竖直盒图(默认值vert=1)。
boxplot(X,notch,‘sym’,vert,whis) %whis定义“须”图的长度,默认值为1.5,若whis=0则boxplot函数通过绘制sym符号图来显示盒外的所有数据值。

Examples 1

The following commands create a box plot of car mileage grouped by country.

load carsmall

boxplot(MPG,Origin)

Examples 2

The following example produces notched box plots for two groups of sample data.

x1 = normrnd(5,1,100,1);

x2 = normrnd(6,1,100,1);

boxplot([x1,x2],‘notch’,‘on’)

Examples 3

x1 = normrnd(5,1,100,1);
x2 = normrnd(6,1,100,1);
boxplot([x1,x2])

The difference between the medians of the two groups is approximately 1.Since the notches in the boxplot do not overlap, you can conclude, with 95% confidence, that the true medians do differ.

Examples 4

The following figure shows the boxplot for same data with the length of the whiskers specified as 1.0 times the interquartile range. Points beyond the whiskers are displayed using +.

x1 = normrnd(5,1,100,1); x2 = normrnd(6,1,100,1); boxplot([x1,x2],‘notch’,‘on’,‘whisker’,1)

箱形图

最近有很多用户说到了年终需要回顾这一年的工作,根据这一年的数据看看有没有异常的情况,那么哪种图能够清晰直观地展现出这一信息呢?

答案只有一个,那就是…

箱形图

箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。

箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。

想要搞懂箱形图,那么一定要了解…

五大因“数”

我们一组序列数为例:12,15,17,19,20,23,25,28,30,33,34,35,36,37讲解这五大因“数”
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1、下四分位数Q1

(1)确定四分位数的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。

(2)根据位置,计算相应的四分位数。

例中:

Q1所在的位置=(14+1)/4=3.75,

Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5;

2、中位数(第二个四分位数)Q2

中位数,即一组数由小到大排列处于中间位置的数。若序列数为偶数个,该组的中位数为中间两个数的平均数。

例中:

Q2所在的位置=2(14+1)/4=7.5,

Q2=0.5×第七项+0.5×第八项=0.5×25+0.5×28=26.5

3、上四分位数Q3

计算方法同下四分位数。

例中:

Q3所在的位置=3(14+1)/4=11.25,

Q3=0.75×第十一项+0.25×第十二项=0.75×34+0.25×35=34.25。

4、上限

上限是非异常范围内的最大值。

首先要知道什么是四分位距如何计算的?

四分位距IQR=Q3-Q1,那么上限=Q3+1.5IQR

5、下限

下限是非异常范围内的最小值。

下限=Q1-1.5IQR

实例

讲了这么多的“数学知识”,那么箱形图到底如何通过BDP应用到实际的工作呢?我们还是用一个实例来帮助大家理解。

现在有“2017年各季度各地区分公司销售业绩”工作表,我们想要找出各季度哪些分公司业绩属于不正常范围内。

数据示例如下图:
在这里插入图片描述

BDP箱形图结果:
在这里插入图片描述

从上图可以清晰的找出异常点,例如第二季度北京分公司的销售额为22147元,该值比上限10759元还要大,所以定义为异常值。

具体操作在这里就不讲解了,可以参考“各位久等了,全新的炫酷图表终于上线啦!”

箱形图的价值

1.直观明了地识别数据批中的异常值

上文讲了很久的识别异常值,其实箱线图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不会影响箱形图的数据形状,箱线图识别异常值的结果比较客观。由此可见,箱线图在识别异常值方面有一定的优越性。

2.利用箱线图判断数据批的偏态和尾重

对于标准正态分布的样本,只有极少值为异常值。异常值越多说明尾部越重,自由度越小(即自由变动的量的个数);

而偏态表示偏离程度,异常值集中在较小值一侧,则分布呈左偏态;异常值集中在较大值一侧,则分布呈右偏态。

3.利用箱线图比较几批数据的形状

同一数轴上,几批数据的箱线图并行排列,几批数据的中位数、尾长、异常值、分布区间等形状信息便昭然若揭。如上图,可直观得看出第三季度各分公司的销售额大体都在下降。

局限性

但箱形图也有他的局限性,比如:不能精确地衡量数据分布的偏态和尾重程度;对于批量比较大的数据,反映的信息更加模糊以及用中位数代表总体评价水平有一定的局限性。

https://zhuanlan.zhihu.com/p/33473642

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/345392.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【渝粤题库】广东开放大学 工程经济 形成性考核

选择题 题目:下列是年金现值系数表示符号的是() 题目:某施工企业现在对外投资200万元,5年后一次性收回本金和利息,若年基准收益率为8%,则总计可以收回资金()万元已知&…

Java 11:将集合转换为数组

在Java 11中&#xff0c;新的默认方法toArray(IntFunction)已添加到java.util.Collection接口&#xff0c;该接口允许将集合的元素传输到所需运行时类型的新创建的数组。 例如&#xff1a; // Java 11 List<String> list Arrays.asList("foo","bar&quo…

【渝粤题库】广东开放大学 微信平台开发与应用 形成性考核

选择题 题目&#xff1a; 以下哪些功能是属于微信的&#xff1f; 题目&#xff1a; 认证过的订阅号的底部是否可以直接链接到外部链接&#xff1f; 题目&#xff1a; 下面哪些属于页面前端开发技术&#xff1f; 题目&#xff1a; 那种情况下的公众号可以申请微信支付&#xff1…

various,variable,varied,different, diverse的区别

various 和 varied various 和 varied的意思都是“各种各样的&#xff0c;形形色色的”&#xff0c;但强调点不同&#xff1a;various 侧重多样性&#xff0c;varied 侧重与众不同。 比较&#xff1a; He decided to leave school for various reasons. 出于种种原因&#xff…

【渝粤题库】广东开放大学 服务质量管理 形成性考核

选择题 题目&#xff1a; 在Word2010中&#xff0c;使用“自动更正”功能的步骤是单击“文件”→“选项”→“校对”选项卡&#xff0c;在“自动更正选项”区域单击“自动更正选项”按钮。 选择一项&#xff1a; 题目&#xff1a; 在Word2010中图片被裁剪后&#xff0c; 被裁…

cglib_cglib:缺少的手册

cglib字节码检测库cglib在许多众所周知的Java框架&#xff08;例如Hibernate &#xff08;现在不再 &#xff09;或Spring &#xff09;中很受欢迎&#xff0c;它们可以完成肮脏的工作。 字节码检测允许在Java应用程序的编译阶段之后操作或创建类。 由于Java类是在运行时动态链…

【渝粤题库】广东开放大学 现代服务学概论 形成性考核 (2)

选择题 题目&#xff1a;为什么需要课本&#xff1f; 题目&#xff1a;以下哪种考核方式可以多次尝试&#xff0c;多次取得成绩&#xff0c;直到取得理想的分数&#xff1f; 题目&#xff1a;你可以通过哪些方法联系到本课程的责任教师&#xff1f; 题目&#xff1a;可以通过哪…

latex-bib参考文献人名特殊字符

https://blog.csdn.net/weixin_43413198/article/details/105468843

【渝粤题库】广东开放大学 网络营销基础与实践 形成性考核 (2)

选择题 题目&#xff1a;下列关于网络营销的观点正确的是&#xff08; &#xff09; 题目&#xff1a;B2B2B模式是商业模式的一种。 题目&#xff1a;市场细分的方法有4种方法&#xff0c;分别为完全细分、按一个影响需求的因素细分、按两个以上影响需求的因素细分、按市场需求…

Java Lambda流和Groovy Clouse的比较

这篇博客文章将探讨List数据结构上的一些谚语操作&#xff0c;并对Java 8/9和Groovy语法进行一些比较。 因此&#xff0c;首先是数据结构。 这只是一个简单的橄榄球球员&#xff0c;有名字和等级。 Java class RugbyPlayer {private String name;private Integer rating;Rugb…

【渝粤题库】广东开放大学 跨境电商实务之搜索引擎 形成性考核

选择题 题目&#xff1a; I.匹配题:将下列缩略语与全称进行匹配。&#xff08;每题1分&#xff0c;共15分&#xff09; 2) WTO A. Value added tax B. Shipping order C. Cable transfer D. Free on Board E. Central Business District F. World Trade Organization …

Matlab RGB 颜色对照表(0-1之间取值)

https://blog.csdn.net/qq_38882446/article/details/100886087

【渝粤题库】陕西师范大学111119 统计学作业

《统计学》作业 一、单项选择题 1、“统计”一词的三种含义是&#xff08; &#xff09;。 A. 统计调查、统计整理、统计分析 B. 统计工作、统计资料、统计学 C. 统计信息、统计咨询、统计监督 D. 统计理论、统计方法、统计技能 2、社会统计的研究对象是&#xff08; &#xff…

MATLAB下数组随机打乱顺序的方法

一&#xff1a;问题 有两个规模相同的数组&#xff0c;两个数组相同位置的元素一一对应&#xff0c;现在要将两数组的元素同时打乱顺序&#xff0c;并且乱序后的两数组对应位置元素要保持乱序前的对应关系。 二&#xff1a;方法 采用randperm&#xff08;&#xff09;函数&a…

【渝粤题库】陕西师范大学152102 管理学原理作业(高起专)

《管理学原理》作业 一、选择题 概念技能对&#xff08; &#xff09;最为重要。 A. 高层管理者 B. 中层管理者 C. 基层管理者 D. 非管理雇员 2.管理者决定什么任务将被完成&#xff0c;谁来完成这些任务&#xff0c;这些任务将如何组合&#xff0c;以及将在哪里做出决策是&am…

空间点过程(Point Processes)和随机测度(Random Measure)

1 空间点过程与随机测度&#xff08;一&#xff09;&#xff1a;从数星星说起 1.1 数星星的数学 小时候&#xff0c;在晴朗的夜里&#xff0c;我喜欢仰望星空&#xff0c;去数天上的星星——那是无忧无虑的快乐童年。长大后&#xff0c;当我们再度仰望苍穹&#xff0c;也许会思…

【渝粤题库】陕西师范大学163204 旅游规划学

一、单选题 1.具有美学、历史、科学价值的山、河、湖、海、动植物等自然景物和园林建筑、文物、古迹、革命地等 人文景观所构成的空间环境属于旅游地域系统中的&#xff08;  &#xff09;。 A景区 B名胜区 C风景名胜区 D风景区 2.创意构想作为影响旅游项目设计的一个主因子&…

【渝粤题库】陕西师范大学164212 国际贸易实务 作业(专升本)

《国际贸易实务》作业 名词解释 1. 凭样品买卖 2. 净价 3. 法定检验 4. 询价 5. 良好平均品质 6. 船舶受载期 7. 背书 8. 发价 9. 溢短装条款 10. 滞期费 11. 领事发票 12. 接受 13. 指示性标志 14. 预借提单 15. 付款交单 16. 还价 17. 贸易术语 18. 救助费用 19. 通知银行 20…

【渝粤题库】陕西师范大学180109 小学教师专业发展 作业

《小学教师专业发展》作业 一、单项选择题 1.职业是人获取社会资源与&#xff08; &#xff09;的媒介。 A. 自我发展 B. 自我成长 C. 自我成熟 D.自我实现 2.具备一定专业知识是教师胜任教师工作的基本条件&#xff0c;而非&#xff08; &#xff09;&#xff1b;一定的专业知…

add a legend to a boxplot in MATLAB

1. 给同组数据分类加legend figure; colors [1 0 0; 1 0 0; 0 0 1; 0 0.5 0; 0 0.5 0; 0 0.5 0]; x boxplot(rand(100,6),Colors,colors); legend(Group A,Group B,Group C)2.给不同组数据加legend box_vars findall(gca,Tag,Box); hLegend legend(box_vars([8,6]), {N…