判断随机抽取代码_问卷调查:定量研究中的抽样问题(2)- 非随机抽样介绍

b337cafe4a92c34e6e264f5ca8d367b2.png

所谓抽样,就是从我们需要研究的所有目标群体中,按照某种原则,挑选出一定量的样本,用他们的研究结果,代表目标群体整体结果。既然,抽样的目的是通过对一部分被选择的样本来推断总体,就要求我们抽取的样本具有能够代表总体质量特征的性质,也就是抽样的代表性。举个例子,如果我们要研究一个城市男性的平均身高,我们在抽样的时候,可以去抽取这个城市所有男性篮球队员来代表吗?显然是不可以的,因为篮球队员的身高普遍较高,不具有随机代表性。

0292c4ca784aea50f59d622753b07cde.png

为此,我们就要采用合适、合理的,能够使样本更具有代表性特征的抽样方法来抽取样本。

抽样方法从理论上看,有以下这样的分类方式:

5f8a7d8eb25c08a05c0fab0be39b8bd4.png

随机抽样: 在随机抽样中,总体中的每个个体都有相等的被选中的机会,给了我们最好的机会去创造一个真正代表总体的样本。

非随机抽样:在非随机抽样中,所有元素被选中的机会都不相等。因此,有一个显著的风险,即最终得到一个不具代表性的样本,它不会产生可推广的结果。

在之前的文章《定量研究中的抽样问题(1)- 随机抽样介绍》中,我们已经给大家介绍过了随机抽样的几种常见方式。该篇文章里,我们重点来说非随机抽样的几种方式:

1、任意抽样:也可以叫做便利抽样、方便抽样或者偶遇抽样。顾名思义,这个抽样方法是以便利为原则的,所以带有很大的偶然性和随意性。任意抽样是所有抽样技术中花费最小的(包括经费和时间),常见的街头随访或拦截式访问、邮寄式调查、杂志内问卷调查等都属于便利抽样的方式。这种方法能及时获得信息数据,省时省力,能为非正式的探索性研究提供很好的数据源。但是,任意抽样容易产生显著的偏见,因为抽样可能不能代表诸如宗教或人口的性别等具体特征。同时,许多可能的选择偏差都会存在,如被调查者的自我选择、抽样的主观性偏差等。这种抽样不能直接代表总体和推断总体。

比如下图,假设编号为4、7、12、15和20的个体想要成为样本的一部分,因此,我们将把它们包含在样本中。

79886733795e584b1068b19cf5805cd5.png

2、配额抽样:配额抽样是非随机抽样中最为普遍运用的一种方式。在这种抽样中,我们根据预先确定的总体特征来选择样本。跟随机抽样里的分层抽样类似,它也需要先将总体按照一定的特性分成不同类别,然后在每个类别里选取样本。例如根据人口的性别、年龄构成来给调查员规定不同性别、年龄的调查人数(即配额)。配额保证了在这些特征上样本的组成与总体的组成是一致的。一旦配额分配好了,选择样本元素的自由度就很大了,唯一的要求就是所选的元素要适合所控制的特性。

这种抽样方法的目的是使样本对总体具有更好的代表性,但仍不一定能保证样本就是有代表性的。如果与问题相关联的某个特征未被考虑进配额,配额样本可能就不具有代表性,但在实施中包括太多的控制特征是十分困难的。

比如,考虑到我们必须为我们的样本选择一个倍数为4的个体,因此,编号为4、8、12、16和20的个人已经为我们的样本保留。

109abfd3dc8bebc3ee2b22adea8a53ba.png

3、判断抽样:判断抽样是指基于调查人员的主观意愿、经验知识,依据对总体相关特征的了解,从目标总体中抽取有代表性的典型样本的做法,也称为选择性抽样。比如,从全体企业中选择若干先进的、居中的、落后的企业作为样本,来考察全体企业经营状况。如果判断准确,这个方法可能取得代表性较好的样本,但这种方法受到主观因素的影响较大。适用于总体规模不大,样本量小,以及样本不易分门别类挑选的情况,较多用于探索性研究。

假设,我们的专家认为,应该将编号为1、7、10、15和19的人作为我们的样本,因为它们可以帮助我们更好地推断人口。你可以想象,配额抽样同样也容易受到专家的偏见,不一定具有代表性。

0faae8ebf6ff8395e240a710db9e42e2.png

4、滚雪球抽样:这种方式,指的是以“滚雪球”似的方法,通过接触少量样本,再逐步通过这些少量样本获取大量样本。它要求总体的样本之间有一定的关联性,才会产生这样滚雪球的可能。比如要做宝妈样本,调查人员先找到自己认识的几个宝妈,然后通过这些宝妈,继续寻找他们认识的宝妈。当抽样框架难以识别时,这种采样方法是有效的。

比如,我们随机选择了1个人作为样本,然后他推荐了6个人,6个人推荐了11个人,依此类推:

a01ffe7a7516bd6bf91fd2c392191d7e.png

滚雪球抽样也有比较大的选择偏见风险,因为被引用的个体将与推荐他们的个体具有比较共同的特征。

到这里为止,所有和抽样有关的常见方法,就介绍完毕了。我们会在其它文章中,进一步介绍有关样本量设计的话题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/490480.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决保存快照失败后redis无法写入的问题( Redis is configured to save RDB snapshots)

MISCONF Redis is configured to save RDB snapshots, but is currently not able to persist on disk. Commands that may modify the data set are disabled. Please check Redis logs for details about the error.解决方案:Just too brief about answer. open t…

欧洲估值最高的5家人工智能创业公司

来源:资本实验室今年初,据伦敦风险投资公司MMC的调查,四成自称为人工智能公司的欧洲创业公司实际上并未在核心业务中涉及到人工智能,人工智能仅为吸引投资的漂亮外衣。这一数据发布后,激起了轩然大波,不仅引…

seaborn画图设置横纵坐标标签

用seaborn库来画图,也同样可以通过matplotlib.pyplot.xlabel设置x轴标签,而matplotlib.pyplot.ylabel设置当前轴的y轴标签 举个例子: import seaborn as sns import matplotlib.pyplot as pltsns.kdeplot(data) plt.xlabel("xxxxxx&qu…

keras安装_代码详解:构建一个简单的Keras+深度学习REST API

在本教程中,我们将介绍一个简单的方法来获取Keras模型并将其部署为REST API。本文所介绍的示例将作为你构建自己的深度学习API的模板/起点——你可以扩展代码,根据API端点的可伸缩性和稳定性对其进行定制。具体而言,我们将了解: 如…

移植memtester到android平台

硬件搭建起来能进入系统,首要就是测试内存的稳定性,需要一款内存测试工具。 一般都是选择memtester这款linux软件,下载地址如下:http://pyropus.ca/software/memtester/ 把memtester解压到android/external/下(此文默认…

马云对话马斯克(全文):要警惕AI?该移民火星?如何更长寿?马化腾反对产业割裂和技术脱钩...

来源:未来论坛今天(8月29日),2019年世界人工智能大会在上海召开,500余位国内外顶尖高校、行业领军企业、国际组织的重要嘉宾,全球AI知名企业领袖齐聚于此。本次大会以“智联世界,无限可能”为主…

给plt.axvline设置图例(label)

plt.axvline的其中一个参数是label,用于给这条垂直线设置标签。但加上后就是不显示这个这个图例,代码如下: sns.kdeplot(data) plt.axvline(-2, colorr, linestyle--, label0.9) plt.show() 原因会因为没有加这一句: plt.legend…

C#中break,continue,return,,goto,throw的区别(转)

break 语句用于终止最近的封闭循环或它所在的switch 语句。 控制传递给终止语句后面的语句&#xff08;如果有的话&#xff09;。 /// <summary>/// break 示例/// 在此例中&#xff0c;条件语句包含一个应该从 1 计数到 100 的计数器/// 但 break 语句在计数达到 4…

python excel 转json_Python办公自动化| word 表格转excel

之前写过一篇 Python办公自动化 | 批量word报告生成工具 &#xff0c;有小伙伴提出了逆向需求&#xff0c;即&#xff1a;从批量word中获取内容并写入excel&#xff0c;需求背景是汇总一些材料&#xff0c;举例&#xff1a;实习鉴定表、个人简历、档案等。实际需求是这样的&…

python在图中画一条垂直线(matplotlib)

matplotlib.pyplot.axvline https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.axvline.html?highlightaxvline#matplotlib.pyplot.axvline 用法&#xff1a; plt.axvline(x, colorr, linestyle--, labelxxx) plt.legend()

坦途与波折:我们需要什么样的人工智能?

来源&#xff1a;资本实验室历史车轮滚滚向前&#xff0c;如今我们正在进入人工智能时代。其中的坦途足以让我们乐观和振奋&#xff0c;其中的波折也可能会让我们不安或担忧。面对未来&#xff0c;我们需要坚持三个基本要点&#xff1a;效率、环保与福祉。1.人工智能与传统产业…

python画一条水平直线(matplotlib)

matplotlib.pyplot.axhline https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.axhline.html 用法&#xff1a; plt.axhline(0.06, colorr, linestyle--, labelxxx) plt.legend(locupper left)

我该如何维护一个烂项目?

最近接手了一个很烂的项目&#xff0c;前后3批人开发。A开发一段时间&#xff0c;不知什么原因离职了&#xff0c;交接给了B&#xff1b;B也是开发一段时间&#xff0c;又是未知原因离职了&#xff0c;交接给C&#xff1b;C也是同样的手法交给了我。我一接手&#xff0c;发现了…

sql数字转换为字符_Python|图片转换为字符画^_^

我们很清楚什么是图片&#xff0c;无外乎png、jpg等格式的文件&#xff0c;例如这个?但什么是字符画呢&#xff1f;先看一下官方介绍&#xff1a;字符画&#xff0c;一种由字母、标点、汉字或其他字符组成的图画。简单的字符画是利用字符的形状代替图画的线条来构成简单的人物…

全球机器人产业趋势及特征

来源&#xff1a;创新研究当前&#xff0c;全球机器人市场规模持续扩大&#xff0c;工业机器人市场增速回落&#xff0c;服务、特种机器人增速稳定。技术创新围绕仿生结构、人工智能和人机协作不断深入&#xff0c;产品在教育陪护、医疗康复、危险环境等领域的应用持续拓展&…

matplotlib调整图例的位置

plt.legend(locxx) 其中loc的可选项有以下几种 upper right upper left lower left lower right right center left center right lower center upper center

使用spring-data-mongodb操作mongodb

mongodb.xml <?xml version"1.0" encoding"UTF-8"?> <beans xmlns"http://www.springframework.org/schema/beans"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xmlns:mongo"http://www.springframework.org…

python支持向量机_支持向量机(SVM)Python实现

什么是支持向量机? “支持向量机”(SVM)是一种监督机器学习算法&#xff0c;可用于分类或回归挑战。然而&#xff0c;它主要用于分类问题。在这个算法中&#xff0c;我们将每一个数据项作为一个点在n维空间中(其中n是你拥有的特征数)作为一个点&#xff0c;每一个特征值都是一…

AR智能提升工业效率的4大场景与应用实践!

来源&#xff1a;北京物联网智能技术应用协会导 读 ( 文/ e-works整理 )德国学者提出“工业4.0”的概念&#xff0c;即以智能制造为主导的第四次工业革命&#xff0c;或革命性的生产方法。主要围绕两大主题&#xff0c;一是“智能工厂”&#xff0c;二是“智能生产”&#xff0…

matplotlib画图设置线条透明度

plt.plot(x, y, alpha0.5) alpha这个参数用于设置透明度&#xff0c;0~1之间 alpha越小&#xff0c;线条越透明