统计(1 - 2)

  1. 统计学基础定义

    Statistics的前部分为“state”,政府,原由是统计是300年前被首次应用在政府部门统计人口出生和死亡信息的;如今的统计学早已被应用在各个专业领域;

    统计学是用以收集数据、分析数据和数据推论的一组概念、原则和方法;是将数据转化为比数据本身更为复杂的知识,为其他学科提供一套研究对象的方法;(是不是应该叫统计哲学);

    统计学的主要思想包括随机性和规律性概率变量常量

    1) 随机性和规律性

      投一枚硬币,我们不知道下次是正面朝上还是反面朝上,此为随机性;而如果投各多次,我们发现正面和反面差不多,此为规律性;

      随机性中的规律性:把随机的事件放在一起,寻找其中的规律,这是统计思想的基础,如多次投硬币;

      规律性中的随机性:每次观察一组重复的实验结果都波动不一样,比如投100次硬币得到的正面数;这样,波动的差异就是数据本身随机性带来的,但如何判断波动是随机带来的还是事物本身带来的,波动是否超出随机性所能解释的程度,这后续会有数据偏差问题的研究;

    2)概率是取值在0-1的数,告诉我们一个特定事件以多大的机会会发生;从数据中得到结论的基础,比如我们可能不知道下次随机性的波动范围是多大,但是我们可以确定落在范围内的概率;

    3)变量是可以取多个值的特征、特质或属性;变量的值是对其的度量;对与那些生活中可观察的变量成为经验变量(性别、年龄);对于用数学方法推导出来的变量称之为理论变量(z,t,x2

    4)常量是一个固定的值,重复试验,其值不变,如已训练好模型的参数;

  2. 数据的收集

    一位统计学家说过:世上有两种数据,好数据和坏数据;精辟;好数据是根据合理、正确的统计原理收集到的数据;反之,坏数据是其他方法收集的;好数据的收集方法包括:

    1)定义变量:仔细的考虑给变量一个无歧义、清晰的、详尽的定义;比如统计家庭小孩个数中小孩的定义:多大年龄?继父母算不算?寄养怎么办?父母离婚了小孩没人管怎么办?。。。

    2)观测数据:总体(population)包含所有研究的个体;普查(census)基于收集整个总体数据的过程;样本(sample)总体中被选中的个体;

      怎么选择样本呢?想想我们做饭的时候怎么判断咸淡吧,挖一小勺尝一尝,要想这一小勺代表整个锅的味道,就要来回搅一搅,使得这一勺是随机的;因此样本应该选择随机样本,总体的每一个个体都有已知的机会包含在样本中;

      还记得前面提到的规律性的随机行,即便是随机的,那每次随机抽样也不一样,这里把每次抽样的diff波动定义为抽样误差(sampling error),它告诉我们样本距离总体实际值有多远;如何计算抽样误差,是根据极限定理推导的,后面会详细介绍,这里可简单记为如果样本大小为n,则抽样误差可近似为1/sqrt(n);

    3)实验数据:通过实验组(ecperimental group)和对照组(control group)确认某些变量是否起作用;多个变量同时研究的“拉丁方设计”,由Fisher发明,没错,就是Fisher分类器的R.A.Fisher;

     

    (R.A.Fisher英国著名统计学习、生物学家和遗传学家,现代数理统计学和推断统计学奠基人,数理遗传学创始人,提出最大似然用于假设检验,引领统计学从“描述统计学”发展到“推断统计学”,这一段发展过渡阶段被成为Fisher时代。http://jpkc.njmu.edu.cn/course/tongjixue/file/jxzy/tjmj02.htm)

    拉丁方设计:http://image.sciencenet.cn/olddata/kexue.com.cn/upload/blog/file/2009/9/2009912152943720.pdf

 

转载于:https://www.cnblogs.com/sunjerdege/p/3391360.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/408381.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2020年计算机视觉学习指南

点击上方“算法猿的成长“,关注公众号,选择加“星标“或“置顶”总第 134 篇文章,本文大约 3000 字,阅读大约需要 10 分钟原文:https://towardsdatascience.com/guide-to-learn-computer-vision-in-2020-36f19d92c934作…

是选择Keras还是PyTorch开始你的深度学习之旅呢?

点击上方“算法猿的成长“,关注公众号,选择加“星标“或“置顶”总第 135 篇文章,本文大约 7000 字,阅读大约需要 20 分钟原文:https://medium.com/karan_jakhar/keras-vs-pytorch-dilemma-dc434e5b5ae0作者&#xff1…

关于myeclipse打开jsp巨慢解决方案

作为企业级开发最流行的工具,用Myeclipse开发java web程序无疑是最合适的,java web前端采用jsp来显示,myeclipse默认打开jsp的视图有卡顿的现象,那么如何更改jsp默认的打开方式,让我们可以进行更快速的jsp开发呢? 简单…

event

听取了网友:kenwang的意见,我的Blog在记流水账啊,现在才发现我发表的都是代码,一个感想也没有,以后要慢慢改正。明天要培训公司的框架,后天要搬家,这个周未没有得休息。

60分钟快速入门PyTorch

点击上方“算法猿的成长“,关注公众号,选择加“星标“或“置顶”总第 136 篇文章,本文大约 26000 字,阅读大约需要 60 分钟PyTorch 是由 Facebook 开发,基于 Torch 开发,从并不常用的 Lua 语言转为 Python …

react学习(38)----react是什么

什么是组件? 官方定义:将一些简短、独立的代码片段组合成复杂的 UI 界面,这些代码片段被称作“组件”。 解读:我们可以理解为能够组成一个UI界面的每一个独立的代码片段,例如表单的代码集合,轮播图的代码集…

大端与小端

/*************************************大端与小端:与大端存储格式相反,在小端存储格式中,低地址中存放的是字数据的低字节,高地址存放的是字数据的高字节**************************************//*联合体union的存放顺序是所有…

react学习(39)----react中的Hello World

ReactDOM.render(<h1>Hello, world!</h1>,document.getElementById(root) ); 它将在页面上展示一个 “Hello, world!” 的标题。

[libGDX游戏开发教程]使用libGDX进行游戏开发(12)-Action动画

前文章节列表&#xff1a;使用libGDX进行游戏开发(11)-高级编程技巧 使用libGDX进行游戏开发(10)-音乐音效不求人&#xff0c;程序员也可以DIY 使用libGDX进行游戏开发(9)-场景过渡使用libGDX进行游戏开发(8)-没有美工的程序员&#xff0c;能够依赖的还有粒子系统 使用libGDX进…

一年了

到温州出差一年了,一个项目做了一年啊,郁闷啊很想回家,回武汉

react学习(40)----react中的jsx简介

const name Josh Perez;const element <h1>Hello, {name}</h1>; ReactDOM.render(element,document.getElementById(root) ); jsx语法是个表达式 可以直接声明变量

将DataSet中的操作更新到Access数据库

代码如下&#xff1a;<%import Namespace Namespacesystem.data%><%import Namespace Namespacesystem.data.oledb%><script languagevb runatserver>Sub page_load()sub page_load() dim strConnection as string dim strSQL as string dim ob…

react学习(41)----react中的jsx简介

JSX 特定属性你可以通过使用引号&#xff0c;来将属性值指定为字符串字面量&#xff1a;const element <div tabIndex"0"></div>;也可以使用大括号&#xff0c;来在属性值中插入一个 JavaScript 表达式&#xff1a;const element <img src{user.ava…

@synthesize obj=_obj的意义详解 @property和@synthesize

本文转载至&#xff1a;http://blog.csdn.net/showhilllee/article/details/8971159我们在进行iOS开发时&#xff0c;经常会在类的声明部分看见类似于synthesize window_window; 的语句&#xff0c;那么&#xff0c;这个window是什么&#xff0c;_ window又是什么&#xff0c;两…

我喜欢的一首歌--《幸福的瞬间》

看了《薰衣草》就开始喜欢这首歌了&#xff0c;看的时候还会为了电视里男女主角痴情的爱情故事落泪&#xff0c;可见我还不成熟。今天正当我和下班人群一起在572上被挤得快变形的时候&#xff0c;车厢里放起了这首歌&#xff0c;我差点以为是我的手机响了。&#xff08;呵呵&am…

react学习(42)----react中的jsx表达对象

JSX 表示对象 Babel 会把 JSX 转译成一个名为 React.createElement() 函数调用。 以下两种示例代码完全等效&#xff1a; const element (<h1 className"greeting">Hello, world!</h1> ); const element React.createElement(h1,{className: greet…

react学习(43)----react中将一个元素渲染为 DOM

假设你的 HTML 文件某处有一个 <div>&#xff1a; <div id"root"></div> 我们将其称为“根” DOM 节点&#xff0c;因为该节点内的所有内容都将由 React DOM 管理。 仅使用 React 构建的应用通常只有单一的根 DOM 节点。如果你在将 React 集成进…

win7 IIS7.5配置伪静态

第一部: 从如下地址中下载URLRewriter组件组件&#xff1a;官方下载地址&#xff1a;http://download.microsoft.com/download/0/4/6/0463611e-a3f9-490d-a08c-877a83b797cf/MSDNURLRewriting.msi第二部&#xff1a;在网站项目中添加URLRewriter程序集的引用。第三部&#xff1…

Github项目推荐|可视化 GAN 的训练过程

点击上方“算法猿的成长“&#xff0c;关注公众号&#xff0c;选择加“星标“或“置顶”总第 137 篇文章&#xff0c;本文大约 1000 字&#xff0c;阅读大约需要 5 分钟今天介绍的一个开源的 github 项目&#xff0c;主要是实现了对 GAN 训练过程的可视化代码&#xff0c;项目链…