从0开始学统计-战斗机保护和代表性抽样

1.什么是抽样研究?为什么要做抽样研究?

抽样研究是一种研究方法,它涉及从整体人群或群体中选取一部分样本来代表整体,以进行研究和推断。在抽样研究中,研究者从总体中选择一个相对较小的样本,通过对这个样本进行观察、实验或调查来推断总体的特征、趋势或关系。

抽样研究的目的在于:

(1)节省时间和成本: 通过研究样本而不是整个总体,可以节省大量的时间和资源。这样的方法通常更经济高效。

(2)可行性: 对整个总体进行研究可能是不切实际的,特别是当总体很大时。抽样研究使得研究变得更加可行。

(3)推广性: 合适的抽样方法可以使得从样本中得出的结论推广到总体。如果样本是代表性的,并且抽样方法是随机的,那么从样本中得出的结论可以推广到整个总体。

总之,抽样研究是一种常用的研究方法,它使得研究者能够在更短的时间内更有效地获取对总体特征的理解,并且能够更可靠地推断总体的特征和关系。

2.为什么个例、特例无法证明科学性?

个例和特例通常无法证明科学性,因为科学是建立在大量数据和重复实验的基础上的。个例和特例可能只是偶然事件或异常情况,并不能代表整体趋势或普遍规律。在科学研究中,需要通过大规模的研究和多次验证来确认一个假设或理论的可靠性。

就吸烟与肺癌的关系而言,你告诉你长期吸烟的长辈,吸烟有害健康,他总是和你说楼下的老大爷90多岁了,抽了一辈子烟,身体还是硬硬朗朗的云云,这时你就可以告诉他,个例和特例无法证明科学性。吸烟有害健康是在经过严谨的科学研究和统计分析后,确定的。

3.什么是样本含量?

样本含量是指在统计学和研究方法学中,用来代表整个总体的一部分数据或观察对象的数量。在进行研究或调查时,由于往往无法对整个总体进行观察或测试,因此会从总体中选择一部分样本来进行研究。样本含量的大小可以影响到研究结果的可靠性和推广性。

通常情况下,样本含量的大小应该足够大,以能够代表整个总体的特征和变异程度。样本含量过小可能会导致研究结果的偏差或不够代表性,而样本含量过大则可能会增加研究成本和工作量,但也可以提高研究结果的稳定性和可信度。

确定样本含量的大小通常需要考虑到研究的目的、总体的大小和特征、预期效应的大小以及统计分析的方法等因素。

4.什么是小数现象?

小数现象是指在小样本情况下,由于偶然因素的影响,导致研究结果与真实情况之间存在较大偏差或差异的现象。在小样本中,个别观察值或数据点的影响可能会对整体结果产生较大的影响,使得研究结论不够稳定或不够可靠。

关于“样本量足够大,一切皆法自然;样本量足够小,一切皆有可能”的说法,主要是因为样本量的大小与研究结果的可信度和稳定性密切相关。

当样本量足够大时,研究结果更有可能代表整个总体的真实情况,因为大样本可以减小随机误差的影响,提高研究的可靠性和泛化能力。在这种情况下,研究结论往往更接近真实情况,有较高的可信度。

而当样本量足够小时,由于偶然因素的影响可能更为显著,个别观察值或数据点的变化可能会对整体结果产生较大的影响,使得研究结果不够稳定或不够可靠。因此,在小样本情况下,研究结论可能更不确定,一切可能性都存在,需要更多的数据支持才能得出可靠的结论。

5.什么叫代表性抽样?

代表性抽样是一种抽样方法,其目的是从整体总体中选择一部分样本,以使这些样本能够准确地代表整体总体的特征和属性。在代表性抽样中,每个个体或元素都有相等的机会被选中,以确保样本的代表性和可靠性。

二战战斗机保护的故事,可以用来解释代表性抽样的概念。在二战期间,美国军方对于如何保护战斗机免受敌方火力攻击的问题进行了研究。沃德(Abraham Wald)是一位犹太裔匈牙利数学家和统计学家,他被邀请加入了这项研究。

研究团队收集了大量的战斗机数据,其中包括了被击中的部位。他们发现,被击中的部位主要集中在机身、机翼和发动机等容易受到攻击的区域。基于这些数据,一些人提出了加强这些部位的防护装甲的建议,以提高战斗机的生存率。

然而,沃德持不同的看法。他认为,他们手头的数据并不完整。这些数据只包括了幸存下来的战斗机,而没有包括那些被击落的战斗机。由于被击中的战斗机都是幸存下来的,因此这些数据所显示的被击中的部位并不代表导致战斗机被摧毁的致命弱点。

沃德的思考是:被击中的部位中没有涵盖到的部位,很可能是致命的弱点,因为这些部位的受伤导致了战斗机的坠毁,无法返航,而这些战斗机的数据并没有出现在研究中,比如座舱和机尾。因此,他提出了一个截然不同的建议:不要加强已经被击中的部位,而是加强那些未被击中的部位。这样做的目的是为了提高战斗机的整体生存率,因为这些未被击中的部位可能是敌方火力攻击的主要目标。

图片

沃德的这一建议后来被采纳,并被称为“沃德的原则”。沃德的故事反映了代表性抽样的核心思想,即从样本中选择那些能够最好地代表整体总体特征的部分,以便更好地理解和处理整体总体的情况。

6.如何抽样才能代表总体?

要确保抽样能够代表总体,可以使用不同的抽样方法,包括随机抽样、系统抽样、整体抽样和分层抽样。

(1)随机抽样:在随机抽样中,每个个体或元素被选入样本的概率是相等的,没有偏向性。这样可以确保样本是代表性的,因为每个个体都有机会被选中,从而减少了选择偏差的可能性。例如,可以使用简单随机抽样方法,通过随机抽取来自总体的样本。

(2) 系统抽样:在系统抽样中,研究者从总体中按照某种规律选择样本。例如,可以按照总体中个体的顺序或排列顺序,每隔一定间隔选择一个样本。系统抽样可以简化抽样过程,并且在总体的排列顺序具有一定规律时,也可以提供代表性的样本。

(3) 整体抽样:整体随机抽样是先将总体各个单位按一定的标准分成许多群,然后按随机原则从这些群中抽取若干群作为样本。例如,学校一共有30个班级,想统计学校的早读迟到率,把一整个班当作一个群体,然后随机抽取10个班级作为样本进行统计。

(4)分层抽样:在分层抽样中,总体被分为不同的层次或组,然后从每个层次或组中分别抽取样本。这样可以确保每个层次或组都有代表性的样本,从而更好地反映总体的特征。例如,在对一个城市的人口进行抽样调查时,可以按照年龄、性别、职业等因素进行分层抽样。

综合使用这些抽样方法可以更好地确保样本代表总体,从而提高研究的可靠性和泛化能力。

7.什么是对照组,为什么要设置对照组,设置对照组应该注意什么?

对照组是科学研究中的一个重要概念,它是在实验或研究中设置的一个用来对照的组别或条件。对照组与实验组相对应,实验组接受了某种处理、干预或条件,而对照组则没有接受这种处理或干预,用来作为对照比较的基准。

设计对照组的目的在于比较实验组和对照组之间的差异,从而确定实验组接受的处理、干预或条件对研究结果的影响。通过对照组的设置,可以排除其他可能影响结果的因素,更准确地评估实验结果的效果。

在设计对照组时,需要注意以下几点:

(1)合适的选择:对照组的选择应当与实验组相匹配,即对照组的特征、背景和条件应与实验组尽可能相似,比如年龄分布、性别、体重等,以确保比较的准确性。

(2) 随机分配:在实验设计中,应采用随机分配的方法将研究对象分配到实验组和对照组中,以减少选择偏差和确保组别之间的比较具有可靠性。

(3) 控制其他因素:在设计对照组时,需要尽可能控制其他可能影响结果的因素,以确保实验结果的准确性和可信度。

总之,设计对照组是科学研究中的重要步骤,它能够帮助研究者更准确地评估实验结果的效果和影响,从而得出可靠的结论和推断。

在美国20世纪对冷冻治疗胃溃疡的研究中,研究者想要确定冷冻治疗是否比传统的治疗方法更有效。为了进行比较,他们需要一个接受传统治疗的对照组,以便评估冷冻治疗的效果。

如果没有对照组,研究者无法确定任何观察到的效果是否真正归因于冷冻治疗。因为在没有对照组的情况下,观察到的改善可能是由于其他因素,如自然病程、患者的生活方式改变或偶然发生的。而通过与接受传统治疗的对照组进行比较,研究者可以更准确地评估冷冻治疗的效果,排除其他因素的影响。

对照组的设置还可以帮助研究者确定是否存在安慰剂效应。如果冷冻治疗组的病人觉得他们的症状有所改善,但对照组也有类似的改善,那么这种改善可能是由于患者的期望或信念,而不是真正的治疗效果。通过对照组的设置,研究者可以更好地识别和控制安慰剂效应。

因此,通过设置对照组,研究者可以更准确地评估冷冻治疗对胃溃疡的效果,提高研究结果的可信度和适用性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/841083.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024-05学习笔记

最近的学习大多都是和mysql的索引相关的 1.mvcc mvcc是不需要手动配置,是mysql的一个机制 在事务开启时,对涉及到的数据加一个隐藏列,隐藏列对应的值,就是事务id 如果当前是修改操作,就copy一份原来的数据到新的一行…

Topk问题以及二叉树的三种层序遍历和基本操作

一、Topk问题 1、问题描述 TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。 比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。 2、思路 对于Top-K问题,能想到的最简单直接的…

【npm如何使用以及常用的包npm包的用法】

npm(Node Package Manager)是Node.js的包管理工具,用于安装、卸载、更新和管理Node.js应用程序的依赖项。以下是npm的基本使用方法和一些常用npm包的用法: 一、npm的基本使用方法 安装npm:npm通常与Node.js一起安装。…

618快到了,送大家一款自动化脚本工具,一起薅羊毛

前言 一年一次的618活动来了,大家做好准备了,奇谈君为大家准备好用的618神器,解放双手,简单操作就可以把红包拿到手。 京淘自动助手 首次使用前需要进行设置 将手机的无障碍权限和悬浮窗权限打开 设置完成后,可以把…

什么是健康信息卡

健康档案信息卡是交由居民本人保管的个人健康信息卡片。 其内容包括:居民个人主要基本信息、健康档案编码、患有的重要疾病、过敏史以及紧急情况下的联系人及联系方式,还有所属基层医疗机构的责任医生、护士及联系电话等。它主要用于居民在复诊、转诊或接…

Android 14.0 系统多个播放器app时,设置默认播放器

1.概述 在14.0的系统产品开发中,对于在系统中有多个播放器的时候,这时候如果调用代码打开播放器,会出现多个播放器列表让用户选择启动哪个播放器,所以产品开发需求需要设置默认播放器,当打开播放器的时候,就直接打开播放器就可以了,所以就需要了解查询播放器列表流程,然…

JAVA面试题大全(十二)

1、RabbitMQ 的使用场景有哪些? 跨系统的异步通信,所有需要异步交互的地方都可以使消息队列多个应用之间的耦合应用内的同步变异步消息驱动的架构跨局域网,甚至跨城市的通讯 2、RabbitMQ有哪些重要的角色? RabbitMQ的重要角色…

UTC与GPS时间转换-[week, sow]

UTC与GPS时间转换-[week, sow] utc2gpsgps2utc测试参考 Ref: Global Positioning System utc2gps matlab源码 function res utc2gps(utc_t, weekStart)%% parameterssec_day 86400;sec_week 604800;leapsec 18; % 默认周一为一周的开始if nargin < 2weekStart d…

算法打卡 Day10(栈与队列)-用栈实现队列 + 用队列实现栈

今天开始进入栈与队列啦&#xff01; 文章目录 栈与队列理论基础栈 Leetcode 232-用栈实现队列题目描述解题思路 Leetcode 225-用队列实现栈题目描述解题思路 首先我们来学习一下栈与队列的基础知识~ 栈与队列理论基础 栈与队列的区别是&#xff1a;栈是先进后出&#xff0c…

Python | Leetcode Python题解之第111题二叉树的最小深度

题目&#xff1a; 题解&#xff1a; class Solution:def minDepth(self, root: TreeNode) -> int:if not root:return 0que collections.deque([(root, 1)])while que:node, depth que.popleft()if not node.left and not node.right:return depthif node.left:que.appen…

1.4 视频标准组织 - ITU

1.4 视频标准组织 - ITU 关于 ITU 国际电信联盟&#xff08;International Telecommunication Union&#xff0c;简称 ITU&#xff09;是一个国际组织&#xff0c;主要负责确立国际无线电和电信的管理制度和标准。 关于 ITU-R 国际电信联盟无线电通信部门&#xff08;ITU R…

cnVcXsrv 21.1.13.1—VcXsrv 21.1.13中文版本简单说明~~

对于VcXsrv的使用目的和用途相信大家都很了解。前不久VcXsrv做了更新&#xff0c;并且将项目托管到github上了。链接如下&#xff1a; VcXsrv: Windows X-server based on the xorg git sourceshttps://github.com/marchaesen/vcxsrv也可以简单查看如下链接&#xff1a; VcXs…

9数据通信名词解释2

奈氏准则 在理想低通&#xff08;无噪声&#xff0c;带宽受限&#xff09;条件下&#xff0c;为了避免码间串扰&#xff0c;极限码元传输速率为2WBaud&#xff0c;W是信道带宽&#xff0c;单位是赫兹 结论&#xff1a; ①在任何信道中&#xff0c;码元的传输速率是有上限的&…

.Net Core WebAPI参数的传递方式

Controller继承自ControllerBase&#xff0c;只不过增加了视图相关的方法&#xff0c;一般mvc项目选用Controller而Web API项目选择ControllerBase即可。 给服务器传递参数的时候&#xff0c;有URL、QueryString、请求报文体3种方式 请求路径/Student/GetAll/school/MIT/class…

在matlab里面计算一组给定参数的方程的解

如&#xff1a; k (1:1024); f (x)(1-x-k.*x.^2); 在这段代码给出了一组函数&#xff0c;若需要计算f0&#xff0c;可以通过自带的函数实现&#xff1a; x0 zeros(length(k),1); options optimoptions(fsolve,Display,none,TolX,tol,TolFun,tol); tic for ik 1:length…

全网讲的最详细的Docker镜像分层存储原理

先说结论&#xff0c;容器镜像分层存储图示 欢迎关注 实验环境准备 当前实验docker版本24.0.7如下&#xff0c;当前docker版本使用overlay2机制存储镜像 Client: Docker Engine - CommunityVersion: 24.0.7API version: 1.43Go version: go1.20.10…

Three.js 研究:2、如何让动画线性运动

1、默认的动画含有加速度并非线性的 制作好的动画很明显是非线性的&#xff0c;这是一个运动环&#xff0c;为了让环运行线性进行如下设置。 2、设置动画成为线性动画

【vue3】嵌套的 effect 与 effect 栈

在 Vue 3 的响应式系统中&#xff0c;effect 是一个非常重要的概念。effect 是一个函数&#xff0c;它接受一个执行副作用&#xff08;side effect&#xff09;的函数作为参数&#xff0c;并返回一个可以停止这个副作用的函数。当响应式数据发生变化时&#xff0c;Vue 3 会自动…

Vue从入门到实战Day07

一、vuex概述 目标&#xff1a;明确vuex是什么&#xff0c;应用场景&#xff0c;优势 1. 是什么&#xff1a; vuex是一个vue的状态管理工具&#xff0c;状态就是数据。 大白话&#xff1a;vuex是一个插件&#xff0c;可以帮助我们管理vue通用的数据&#xff08;多组件共享的…

解锁数据关联之道:SQL 表连接详解

文章目录 概述表关系横向连接内连接 inner join左连接 left join右连接 right join全连接 full join交叉连接 cross join 纵向合并UNION ALLUNION 概述 在数据处理、数据分析中常会用到表连接。表连接的作用是将多个表中的数据关联起来&#xff0c;以便在查询过程中获取更全面…