判断随机抽取代码_问卷调查:定量研究中的抽样问题(2)- 非随机抽样介绍

b337cafe4a92c34e6e264f5ca8d367b2.png

所谓抽样,就是从我们需要研究的所有目标群体中,按照某种原则,挑选出一定量的样本,用他们的研究结果,代表目标群体整体结果。既然,抽样的目的是通过对一部分被选择的样本来推断总体,就要求我们抽取的样本具有能够代表总体质量特征的性质,也就是抽样的代表性。举个例子,如果我们要研究一个城市男性的平均身高,我们在抽样的时候,可以去抽取这个城市所有男性篮球队员来代表吗?显然是不可以的,因为篮球队员的身高普遍较高,不具有随机代表性。

0292c4ca784aea50f59d622753b07cde.png

为此,我们就要采用合适、合理的,能够使样本更具有代表性特征的抽样方法来抽取样本。

抽样方法从理论上看,有以下这样的分类方式:

5f8a7d8eb25c08a05c0fab0be39b8bd4.png

随机抽样: 在随机抽样中,总体中的每个个体都有相等的被选中的机会,给了我们最好的机会去创造一个真正代表总体的样本。

非随机抽样:在非随机抽样中,所有元素被选中的机会都不相等。因此,有一个显著的风险,即最终得到一个不具代表性的样本,它不会产生可推广的结果。

在之前的文章《定量研究中的抽样问题(1)- 随机抽样介绍》中,我们已经给大家介绍过了随机抽样的几种常见方式。该篇文章里,我们重点来说非随机抽样的几种方式:

1、任意抽样:也可以叫做便利抽样、方便抽样或者偶遇抽样。顾名思义,这个抽样方法是以便利为原则的,所以带有很大的偶然性和随意性。任意抽样是所有抽样技术中花费最小的(包括经费和时间),常见的街头随访或拦截式访问、邮寄式调查、杂志内问卷调查等都属于便利抽样的方式。这种方法能及时获得信息数据,省时省力,能为非正式的探索性研究提供很好的数据源。但是,任意抽样容易产生显著的偏见,因为抽样可能不能代表诸如宗教或人口的性别等具体特征。同时,许多可能的选择偏差都会存在,如被调查者的自我选择、抽样的主观性偏差等。这种抽样不能直接代表总体和推断总体。

比如下图,假设编号为4、7、12、15和20的个体想要成为样本的一部分,因此,我们将把它们包含在样本中。

79886733795e584b1068b19cf5805cd5.png

2、配额抽样:配额抽样是非随机抽样中最为普遍运用的一种方式。在这种抽样中,我们根据预先确定的总体特征来选择样本。跟随机抽样里的分层抽样类似,它也需要先将总体按照一定的特性分成不同类别,然后在每个类别里选取样本。例如根据人口的性别、年龄构成来给调查员规定不同性别、年龄的调查人数(即配额)。配额保证了在这些特征上样本的组成与总体的组成是一致的。一旦配额分配好了,选择样本元素的自由度就很大了,唯一的要求就是所选的元素要适合所控制的特性。

这种抽样方法的目的是使样本对总体具有更好的代表性,但仍不一定能保证样本就是有代表性的。如果与问题相关联的某个特征未被考虑进配额,配额样本可能就不具有代表性,但在实施中包括太多的控制特征是十分困难的。

比如,考虑到我们必须为我们的样本选择一个倍数为4的个体,因此,编号为4、8、12、16和20的个人已经为我们的样本保留。

109abfd3dc8bebc3ee2b22adea8a53ba.png

3、判断抽样:判断抽样是指基于调查人员的主观意愿、经验知识,依据对总体相关特征的了解,从目标总体中抽取有代表性的典型样本的做法,也称为选择性抽样。比如,从全体企业中选择若干先进的、居中的、落后的企业作为样本,来考察全体企业经营状况。如果判断准确,这个方法可能取得代表性较好的样本,但这种方法受到主观因素的影响较大。适用于总体规模不大,样本量小,以及样本不易分门别类挑选的情况,较多用于探索性研究。

假设,我们的专家认为,应该将编号为1、7、10、15和19的人作为我们的样本,因为它们可以帮助我们更好地推断人口。你可以想象,配额抽样同样也容易受到专家的偏见,不一定具有代表性。

0faae8ebf6ff8395e240a710db9e42e2.png

4、滚雪球抽样:这种方式,指的是以“滚雪球”似的方法,通过接触少量样本,再逐步通过这些少量样本获取大量样本。它要求总体的样本之间有一定的关联性,才会产生这样滚雪球的可能。比如要做宝妈样本,调查人员先找到自己认识的几个宝妈,然后通过这些宝妈,继续寻找他们认识的宝妈。当抽样框架难以识别时,这种采样方法是有效的。

比如,我们随机选择了1个人作为样本,然后他推荐了6个人,6个人推荐了11个人,依此类推:

a01ffe7a7516bd6bf91fd2c392191d7e.png

滚雪球抽样也有比较大的选择偏见风险,因为被引用的个体将与推荐他们的个体具有比较共同的特征。

到这里为止,所有和抽样有关的常见方法,就介绍完毕了。我们会在其它文章中,进一步介绍有关样本量设计的话题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/490480.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

欧洲估值最高的5家人工智能创业公司

来源:资本实验室今年初,据伦敦风险投资公司MMC的调查,四成自称为人工智能公司的欧洲创业公司实际上并未在核心业务中涉及到人工智能,人工智能仅为吸引投资的漂亮外衣。这一数据发布后,激起了轩然大波,不仅引…

keras安装_代码详解:构建一个简单的Keras+深度学习REST API

在本教程中,我们将介绍一个简单的方法来获取Keras模型并将其部署为REST API。本文所介绍的示例将作为你构建自己的深度学习API的模板/起点——你可以扩展代码,根据API端点的可伸缩性和稳定性对其进行定制。具体而言,我们将了解: 如…

马云对话马斯克(全文):要警惕AI?该移民火星?如何更长寿?马化腾反对产业割裂和技术脱钩...

来源:未来论坛今天(8月29日),2019年世界人工智能大会在上海召开,500余位国内外顶尖高校、行业领军企业、国际组织的重要嘉宾,全球AI知名企业领袖齐聚于此。本次大会以“智联世界,无限可能”为主…

给plt.axvline设置图例(label)

plt.axvline的其中一个参数是label,用于给这条垂直线设置标签。但加上后就是不显示这个这个图例,代码如下: sns.kdeplot(data) plt.axvline(-2, colorr, linestyle--, label0.9) plt.show() 原因会因为没有加这一句: plt.legend…

python excel 转json_Python办公自动化| word 表格转excel

之前写过一篇 Python办公自动化 | 批量word报告生成工具 ,有小伙伴提出了逆向需求,即:从批量word中获取内容并写入excel,需求背景是汇总一些材料,举例:实习鉴定表、个人简历、档案等。实际需求是这样的&…

python在图中画一条垂直线(matplotlib)

matplotlib.pyplot.axvline https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.axvline.html?highlightaxvline#matplotlib.pyplot.axvline 用法: plt.axvline(x, colorr, linestyle--, labelxxx) plt.legend()

坦途与波折:我们需要什么样的人工智能?

来源:资本实验室历史车轮滚滚向前,如今我们正在进入人工智能时代。其中的坦途足以让我们乐观和振奋,其中的波折也可能会让我们不安或担忧。面对未来,我们需要坚持三个基本要点:效率、环保与福祉。1.人工智能与传统产业…

python画一条水平直线(matplotlib)

matplotlib.pyplot.axhline https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.axhline.html 用法: plt.axhline(0.06, colorr, linestyle--, labelxxx) plt.legend(locupper left)

sql数字转换为字符_Python|图片转换为字符画^_^

我们很清楚什么是图片,无外乎png、jpg等格式的文件,例如这个?但什么是字符画呢?先看一下官方介绍:字符画,一种由字母、标点、汉字或其他字符组成的图画。简单的字符画是利用字符的形状代替图画的线条来构成简单的人物…

全球机器人产业趋势及特征

来源:创新研究当前,全球机器人市场规模持续扩大,工业机器人市场增速回落,服务、特种机器人增速稳定。技术创新围绕仿生结构、人工智能和人机协作不断深入,产品在教育陪护、医疗康复、危险环境等领域的应用持续拓展&…

python支持向量机_支持向量机(SVM)Python实现

什么是支持向量机? “支持向量机”(SVM)是一种监督机器学习算法,可用于分类或回归挑战。然而,它主要用于分类问题。在这个算法中,我们将每一个数据项作为一个点在n维空间中(其中n是你拥有的特征数)作为一个点,每一个特征值都是一…

AR智能提升工业效率的4大场景与应用实践!

来源:北京物联网智能技术应用协会导 读 ( 文/ e-works整理 )德国学者提出“工业4.0”的概念,即以智能制造为主导的第四次工业革命,或革命性的生产方法。主要围绕两大主题,一是“智能工厂”,二是“智能生产”&#xff0…

手机进销存系统/供应链管理系统

花了将近两个月的时间学习了一个企业级进销存项目,已经结束了两周多,现在终于有时间来对这个项目的学习做个总结了! 一、首先介绍下这个项目 (注:本人目前大三,专业为信息管理,与编程沾边不多。而我对编程很…

如何评价马云和马斯克在世界人工智能大会的对话?

来源:刘锋的未来课堂马云和马斯克在世界人工智能大会的对话,虽然风轻云淡,天马行空,但两个人其实是针锋相对的,马云的观点是认为人工智能还是人类的工具,为人类的未来提供服务,马斯克继续保持他…

linux 检测mysql链接_MySQL笔记

#忘记原始密码1、修改 /etc/my.cnf,在 [mysqld] 小节下添加一行:skip-grant-tables12、重启mysql:service restart stop3、刷新权限:flush privileges;4、修改密码:alter user rootlocalhost identified by Kgj2019;若…

matplotlib设置多个图例横向水平放置

一般多个图例都是竖向放置 如果想要多个图例横向放置,设置plt.legend的ncol参数,ncol参数表示将图例分为多少列,以两个图例横向放置为例: plt.legend(ncol2)

内存对齐分配策略(含位域模式)

1:内存对齐定义: 现在使用的计算机中内存空间都是按照字节划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但是实际上计算机系统对于基本数据类型在内存 中的存放位置都有限制,要求这…

科技部发布新一批国家新一代人工智能开放创新平台

来源:科技部8月29日上午,在上海举办的2019世界人工智能大会开幕式上,科技部李萌副部长发布了新启动建设的十家国家新一代人工智能开放创新平台。分别是:依托上海依图网络科技有限公司建设视觉计算国家新一代人工智能开放创新平台&…

开发里程碑计划_里程碑——让你轻松控制项目进度

对于项目结果的最好控制就是控制项目开发的过程,也就是控制项目开发过程中的几个关键节点——项目的里程碑事件。通过对里程碑事件的控制用于评估项目各阶段工作进展的有效性,以及及时的明确开发过程中存在的风险过程。我们在做项目开发计划的时候&#…

SQL Server数据库大型应用解决方案总结【转】

【IT168 技术】随着互联网应用的广泛普及,海量数据的存储和访问成为了系统设计的瓶颈问题。对于一个大型的互联网应用,每天百万级甚至上亿的PV无疑对数据库造成了相当高的负载。对于系统的稳定性和扩展性造成了极大的问题。 一、负载均衡技术 负载均衡集…