python假设税前工资和税率如下_Python来做假设检验

对于任何一个频率派的数据科学家而言,日常做数据分析难免还是会用到一些假设检验方法做一个数据探索和相关性、差异性分析,并且这也是做后续统计模型(机器学习类预测模型可以略过)预测的第一步。

这篇博文目的就是整理基本的假设检验方法、适用条件和调用Python(主要是scipy模块)的哪些方法。

正态性检验

这个是很多统计建模的第一步,例如,普通线性回归就对残差有正态性要求。

K-S检验

特点是比较严格,基于的原理是CDF,理论上可以检验任何分布。

scipy.stats.kstest(a_vector_like_data, 'norm')

Shapiro检验

专门用来检验正态分布。

scipy.stats.shapiro(a_vector_like_data)

Normal检验

原理是基于数据的skewness和kurtosis,如不明白这两个意思,自行百度。

scipy.stats.normaltest(a_vector_like_data)

Anderson检验

是ks检验的正态检验加强版。

scipy.stats.anderson(a_vector_like_data, dist='norm')

检验方差是否齐

Bartlett检验

对数据有正态性要求

scipy.stats.bartlett(a, b)

Levene检验

在数据非正态的情况下,精度比Bartlett检验好,可调中间值的度量

scipy.stats.levene(a, b, center = 'trimmed')

Fligner-Killeen检验

非参检验,不依赖于分布

scipy.stats.fligner(a, b, center='mean')

两组数之间的比较

参数方法

# 独立两样本t检验

scipy.stats.ttest_ind(a, b, equal_var=True, nan_policy='omit')

# 成对两样本t检验

scipy.stats.ttest_rel(a, b, equal_var=True, nan_policy='omit')

# 通过基本统计量来做独立两样本检验

scipy.stats.ttest_ind_from_stats(20.06, 2.902, 50, 13.26, 1.977, 50, equal_var=False)

非参数方法

# wilcox秩序和检验,n < 20时独立样本效果比较好

scipy.stats.ranksums(a, b)

# Mann-Whitney U检验, n > 20时独立样本,比wilcox秩序和检验更稳健

scipy.stats.mannwhitneyu(a, b)

# Wilcox检验,成对数据

scipy.stats.wilcoxn(a, b, zero_method='wilcox', correction=False)

多组数之间的比较

参数方法(1-way anova)

scipy.stats.f_oneway(a, b, c, ...)

非参数方法(Kruskal-Wallis H方法)

scipy.stats.kruskal(a, b, c,..., nan_policy='omit')

(附送)相关性

相关性可以做简单的特征工程(特征筛选)来做监督学习以及作为相似度(1 - 距离)来做非监督学习。

参数(Pearson相关系数)

scipy.stats.pearsonr(a, b)

非参数(Spearman相关系数)

scipy.stats.spearmanr(a, b)

二元值和连续值之间的关系(Point-biserial相关系数)

scipy.stats.pointbiserialr(a, b)

分参数的Kendall's Tau

理论上是检验两个变量是否具有单调关系

scipy,stats.kendalltau(a, b, initial_lexsort=None, nan_policy='omit')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/528852.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux fall delay 10,Cell的Rise delay和Fall delay、Rise transition和fall transition

Cell的Rise delay和Fall delay、Rise transition和Fall transition介绍&#xff1a;如下图所示为一个Cell的lib中关于cell_rise/cell_fall、rise_transition/fall_transition的描述&#xff1a;在NLDM模型的.lib中&#xff0c;cell_rise/cell_fall它描述的是Cell从输入到输出的…

linux定时器无法重启pm2,pm2无法自动重启

Hawk 3&period; 网页采集器1.基本入门 1. 原理(建议阅读) 网页采集器的功能是获取网页中的数据(废话).通常来说,目标可能是列表(如购物车列表),或是一个页面中的固定字段(如JD某商品的价格和介绍,在页面中只有一个).因此 ...man asciiLinux 2.6 - man page for ascii (linu…

linux ps 详解 博客,Linux PS 命令 详解(转)

Linux操作系统PS命令详细解析(转)要对系统中进程进行监测控制&#xff0c;用 ps 命令满足你。/bin/psps 是显示瞬间行程的状态&#xff0c;并不动态连续&#xff1b;如果想对进程运行时间监控&#xff0c;应该用 top 工具。kill 用于杀死进程。ps 的参数说明l 长格式输出&#…

三维空间坐标的旋转算法详解_视觉slam | 三维空间刚体运动的五种表达:旋转矩阵 变化矩阵 欧拉角 旋转向量 四元数及互相转换...

原po&#xff1a;高翔slam十四讲-刚体运动1.旋转矩阵考虑一次旋转Before: 坐标系(e1,e2,e3), 向量(a1,a2,a3)After: 坐标系(e1,e2,e3), 向量(a1,a2,a3)即得到a Ra R 称为旋转矩阵(R是一个正交矩阵, 行列式为1) 考虑旋转平移欧拉定理&#xff08;Euler’s rotation theorem&…

c语言 字符串相似度,某课程设计---文件相似度判断

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼//返回两个文件操作是否都成功return ( result1 && result2 );}//功能:将数据存储到文件内//输入:const char * FileName----想写入数据的文件名// :const char * Data----想写入的数据//输出:无//返回值:布尔型---真表…

python2版本异常_Python to.exe引发异常:此项目的版本控制需要sdisttarb

我试图从Python文件构建一个可执行文件。我能纠正大多数错误&#xff0c;但现在我被这一个卡住了&#xff0c;我不知道如何改正它。我的程序与jiraapi交互。在我使用Cx_Freeze来构建具有以下设置的.exe。py文件&#xff1a;import sysimport setuptoolsfrom cx_Freeze import s…

layer 同步调用_关于Layer组件的同步以及减少GPU带宽的问题

本文主要为大家分享一篇P关于Layer组件的同步以及减少GPU带宽的问题&#xff0c;具有很好的参考价值&#xff0c;希望对大家有所帮助。一起跟随小编过来看看吧。问题&#xff1a;1) Layer 之间能否进行单独更新&#xff0c;比如其中video 层上面弹出的状态栏场景如何优化&#…

keil流水灯c语言程序两个一起亮,我用keil c51编了一个流水灯程序,编译无误却只有第一和第二个灯亮了,最后停在第一个灯处不动...

满意答案zJ张俭2014.02.09采纳率&#xff1a;43% 等级&#xff1a;12已帮助&#xff1a;10469人你有几个错误:1 你的定时器没有重装,导致第一次中断和后面的中断时间不一样,第一次时间短,后面的时间一直是以65536个周期中断的.2 你在中断函数里用了 for 循环,for循环是一下子…

pyquery获取不到网页完整源代码_python动态网页爬取:爬取pexel上的图片

前言同样的&#xff0c;我们在写一个爬虫前要明确自己想要爬取的东西是什么&#xff0c;明确下载目标数据在浏览器的操作如何对于动态网页的爬取&#xff0c;在网页地址不变的情况下&#xff0c;我们首先要明确如何获取AJAX请求首先我们看看这个网站pexel打开页面后再Chrome浏览…

c语言或命题,求一个“输入一条命题公式(与或非条件,最好有双条件的)求真值表的程序”...

回复 2楼 hahayezhe我晕&#xff0c;现在就是让你帮忙&#xff0c;把一个表都输出来的系统啊。让你做一个系统啊大哥。参考以下程序&#xff1a;#include #include #define MAXNUM 100 //栈最大元素个数#define MAXEXP 30 //允许用户输入的表达式…

python进阶与数据操控_零基础机器学习Python进阶:Python操作MySql

阅读文本大概需要 6 分钟前言基础写了十篇&#xff0c;以后会继续更&#xff0c;这是第二篇进阶&#xff0c;文末会放上链接&#xff0c;进阶分成另一个系列&#xff0c;柠檬有时间会整理好菜单栏让大家更方便的阅读基础和进阶&#xff0c;柠檬会把自己在当时做的项目写到进阶里…

c语言每条代码的含义,为我解释一下,代码的意思。谢谢了。

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼#include #include #define LEN sizeof(struct student)struct student{long num;intscore;struct student *next;};struct student lista,listb;int n,sum0;int main(){struct student *creat(void);struct student *insert(struc…

ios时间相差多少天_iOS 计算某个时间到现在是多少月/天/时

直接上代码&#xff0c;传入一个NSString类型的日期格式如newsDate "2013-08-09 17:01";或者newsDate "2013/08/09 17:01";返回如果有一个月&#xff0c;就不返回天&#xff0c;依次类推。-(NSString *)getUTCFormateDate:(NSString *)newsDate{// newsD…

calender获取日期前几月_java获取当前时间和前一天日期(实现代码)

String basePath request.getScheme()"://"request.getServerName()":"request.getServerPort()path"/";Date dNow new Date(); //当前时间Date dBefore new Date();Calendar calendar Calendar.getInstance(); //得到日历calendar.setTim…

二级c语言题型分数,计算机二级C语言题型和评分标准

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼全国计算机二级考试大题把题目给定程序删除了&#xff0c;正确运行&#xff0c;这样会不会给分&#xff1f;50、请编写函数fun, 函数的功能是: 将M行N列的二维数组中的数据, 按列的顺序依次放到一维数组中。函数fun中给出的语句仅供…

python矩阵乘法菜鸟_Python中的几种矩阵乘法(转)

一. np.dot()1.同线性代数中矩阵乘法的定义。np.dot(A, B)表示&#xff1a;对二维矩阵&#xff0c;计算真正意义上的矩阵乘积。对于一维矩阵&#xff0c;计算两者的内积。2.代码【code】import numpy as np# 2-D array: 2 x 3two_dim_matrix_one np.array([[1, 2, 3], [4, 5,…

W ndows找不到explorer,windows找不到explorer.exe的处理教程

很多网友入手windows过程里找不到explorer.exe&#xff0c;很是烦恼&#xff0c;为了帮助大家排忧解难&#xff0c;这里小编就分享了windows找不到explorer.exe的处理教程&#xff0c;希望可以帮助到大家。windows找不到explorer.exe的处理教程1、按winr打开运行窗口&#xff0…

vue2实践揭秘pdf_《Vue2实践揭秘》源码

todos 组件源码&#xff1a;{{title}}keyup.13"addItem"placeholder"快写下您要我记住的事吧"autofocus"true"/>{{index1}}.{{todo.value}}{{todo.created|date}}import ./assets/todos.lessimport moment from momentimport moment/locale/z…

c语言设计四路彩灯显示系统,四路彩灯控制器设计方案.doc

四路彩灯控制器设计方案1 前言1.1序言随着经济的发展&#xff0c;城市之间的灯光系统花样越来越多&#xff0c;用中规模集成电路设计并制作一个四路彩灯显示系统&#xff0c;可用于节日庆典&#xff0c;医院病房等多处地方&#xff0c;同用单片机控制相比&#xff0c;它具有准确…

python django restful框架_Django RESTful API 实例带你快速上手开发

1. Django 是什么Django 是基于 Python 的一个 Web 开发框架&#xff0c;一般和 Flask Tornado 被称为 Python Web 三大框架&#xff0c;Django 是其中最成熟、稳定、完善的。非常适合企业级应用。Django 是一个基于 MVC 架构的框架&#xff0c;但在 Django 中是模型(Model)、模…