Matlab中求数据概率分布的方法

一、问题描述

对已有的一些列数据进行分析,想得到该数据的分布和统计特性,如概率密度函数,概率分布,累计概率密度等等。

例如,已有一段时间的声音测量数据,求该数据的分布特性,并给出噪声的95%置信区间统计参数以表征该声音监测数据的总体水平。

二、Matlab 统计分析工具箱

Matlab自带了22个内置的概率分布例如概率密度类pdf,累积分布函数类cdf,概率图等,当然前提是安装Statistics and Machine Learning Toolbox™,matlab提供了应用程序可以直接调用,也可以用代码自己写。离散分布主要分为以下即大类,具体可以查看matlab官网资料

  • 二项分布
    对数据进行二项分布参数拟合,计算该分布或其逆分布,生成伪随机样本
  • 几何分布
    计算几何分布或其逆分布,生成伪随机样本
  • 超几何分布
    计算超几何分布或其逆分布,生成伪随机样本
  • 多项分布
    计算多项分布或其逆分布,生成伪随机样本
  • 负二项分布
    对数据进行负二项分布参数拟合,计算负二项分布或其逆分布,生成伪随机样本
  • 泊松分布
    对数据进行泊松分布参数拟合,计算泊松分布或其逆分布,生成伪随机样本
  • 均匀分布(离散)
    计算离散均匀分布或其逆分布,生成伪随机样本

三、具体方法

3.1 加载声音原始数据

声音数据是一维度列数据,直接用area绘制面积图:

% 原始曲线
figure
area(noiseday);
axis([0 599 0 80])
xlabel('datapoint');
ylabel('noise dB')
title('day noise');

3.2 数据分布拟合

第一种方法,这里用ksdensity函数实现,ksdensity函数时核心平滑密度函数,可以直接返回各个点的概率。

[f,xi]=ksdensity(data);
plot(xi,f);

可以看到,该声音的分布近似正态分布。

第二种方法,采用matlab的工具箱实现->APP->Distribution Fitter

导入数据:

数据显示类别可以选择当前数据的显示类型:density(PDF),cumulative probability(CDF),Quantile probability, probability plot等。这里我们选择density。

添加一个概率拟合 New  Fit,选择正态分布拟合Normal.

显示类别选择概率图,数据越靠近直线,说明越符合正态分布。以下结果表明总体上还是很符合正态分布(存在干扰数据)。

3.3 计算95%置信区间

通过拟合可以发现数据是符合正态分布,因此可以采用normfit函数求置信区间。具体用法:

[mu,sigma,muci,sigmaci]= normfit(noiseday,a);mu: 均值
sigma: 标准差
muci:1-a 区间内的均值
sigmaci:1-a 区间内的标准差

因此,设置a=0.05可以求得95%置信区间内的数据分布

                                                           表1-1  95%置信区间的声音数据分布

分布均值

46.5124

分布标准差

2.7061

分布均值的95%置信区间

[46.2303,46.7944]

分布标准差的95%置信区间

[2.5218,2.9223]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/405497.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

matlab设置plot图像尺寸大小、坐标轴等

Matlab作为工程中的数据可视化工具是非常的方便的。但是在具体的生成过程中通常会遇见以下几个比较常见的问题,这里以我最近在写论文中用图遇到的问题作为例子。简要说明输出图像大小位置规范的重要性。 1:colorbar的位置大小范围不一致、不合理 2&#…

MMN实用架构过程概览

MMN(Macro-Micro-Nano,即宏观-微观-纳米)实用架构过程初步体现了我的架构观:即以实用主义态度把握架构原则与本质思想,从系统的各个层次剖析架构,提供一个具有指导意义和实施价值的架构过程,采取…

实践分享:开始用Cordova+Ionic+AngularJS开发App

http://www.cocoachina.com/webapp/20150707/12395.html 本文是一篇关于我本人在使用CordovaIonic以及AngularJS开发移动App的过程中的经验的总结,它不是一篇基础入门教程,而是和大家探讨一下关于如何更好的使用这些技术开发一个更好的App。 声明&#x…

git仓库的基本用法

一、简介 git是一个免费的、开源的分布式版本控制系统,可以快速高效地处理从小型到大型的项目。git很容易学习,而且它的占用资源很小,性能也非常好。它超越了subversion、cvs、perforce和clearcase等scm工具,具有廉价的本地分支、…

关于检测手机信号强度,wifi信号强度以及检测周围wifi热点的一个小例子

From: http://blog.csdn.net/wanglj0925/article/details/7743182 一.检测手机信号强度 检测手机信号强度需要用到TelephonyManager类 这个类主要提供了一系列用于访问与手机通讯相关的状态和信息的get方法。其中包括手机SIM的状态和信息、电信网络的状态及手机用户的信息。在…

转载:关于爱情、伴侣、承诺、人生、

关于爱情: 不要认为后面还有更好的,因为现在拥有的就是最好的。 不要认为还年轻可以晚些结婚,爱情是不等年龄的。 不要因为距离太远而放弃,爱情可以和你一起坐火车的。 不要因为对方不富裕而放弃,只要不是无能的人&am…

Net4.0的网站在IE10、IE11出现“__doPostBack未定义”的解决办法。

方法一、浏览器设置成兼容模式。 方法二、安装服务器版的.Net40的补丁。http://download.csdn.net/detail/5653325/6642051 方法三、点击VS的工具菜单--》库程序包管理器--》程序包管理器控制台(如果没有“库程序包管理器”的菜单,就先点那个“扩展管理器…

数理统计中的卡方分布,t分布和F分布

有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有显式表达式,它们被称为统计中的“三大抽样分布”。这…

Bringing up interface eth0: Device eth0 does not seem to be present, delaying initialization

克隆虚拟机后,网卡无法启动,并报如下错误: 解决办法1.修改虚拟机克隆机的HWADDR为ifconfig -a的MAC地址 形如:HWADDR"xx:xx:xx:xx:xx:xx" 2.然后再做以下操作 # rm -rf /etc/udev/rules.d/70-persistent-net.rules # re…

在计算机发展的早期 计算机主要用于,全国网络统考《计算机应用基础》选择题复习...

全国网络统考《计算机应用基础》选择题复习 全国网络统考《计算机应用基础》选择题复习第一章计算机基础知识【例题与解析】、一般认为,世界上第一台电子计算机诞生于()。年年年年【解析一般认为,世界上第一台数字计算机于年在美国宾夕法尼亚大学研制成功…

数理统计中95%置信区间的含义

95%置信区间,意味着如果你用同样的步骤,去选样本,计算置信区间,那么100次这样的独立过程,有95%的概率你计算出来的区间会包含真实参数值,即大概会有95个置信区间会包含真值。而对于某一次计算得到的某一个置…

Linux 程序后台运行与删除

一、查看进程:ps 或 ps -a 二、命令后台运行: sudo ./runmyled.o& 命令后边跟个&, 返回进程id号 三、查看当前的进程: 四、删除进程:sudo kill id1 id2 id3

jquery html 片段,十条jQuery代码片段助力Web开发效率提升

JQuery是继prototype之后又一个优秀的Javascript库。它是轻量级的js库 ,它兼容CSS3,还兼容各种浏览器(IE 6.0, FF 1.5, Safari 2.0, Opera 9.0),jQuery2.0及后续版本将不再支持IE6/7/8浏览器。jQuery使用户能更方便地处理HTML(标准通用标记语…

React开发(255):react项目理解 ant design 注意报错提示

if (res.data.records.length 0 && pageUserIndex > 1) {