什么是抽样调查

抽样调查是政府统计工作和市场调查中普遍采用的方法,我国《统计法》中明确规定:搜集、整理统计资料,应当以周期性普查为基础,以经常性抽样调查为主体,综合运用全面调查、重点调查等方法,并充分利用行政记录等资料。

一、基本概念

抽样调查是从由全部调查对象构成的抽样总体中,随机抽取一部分调查对象作为个体样本进行调查,由个体样本的调查观测结果,对总体所关心的指标或特征做出统计推断。抽样调查包含以下几个要素 :

(一)抽样总体。

是指包含全部抽样研究目标个体对象的集合,这个集合通常与目标总体是一致的。个体对象的一个或多个构成划分抽样总体的个体单位,也就是抽样单元; 包含所有抽样单元的“名单”或“清册”就叫做抽样框。抽样研究的目标,既可以是单一指标,如人口数、住户可支配收入、住户消费支出、某品种农作物的播种面积、某个产品的产量等;也可以是多个指标,如同时考虑住户的可支配收入与消费支出、多个主要品种农作物的播种面积等;还可以是复合指标,如人口数和与之相关的性别、年龄、就业类别等交叉分组的指标。

(二)个体样本。

是指总体中包含研究目标个体信息的抽中调查对象。就调查对象而言,通常分为两类,一个是关于“人”的对象,如个人、企业、住户等;另一个是关于“物” 的对象,如土地、圈舍、厂房、船只等。

(三)抽样方法。

可以分为概率抽样和非概率抽样两类。概率抽样是指按照特定的随机抽样方法的具体规则,完全随机地抽选样本,在抽样框中的每个个体都有相等或者不相等的抽中概率。常用的概率抽样方法有简单随机抽样(SRS)、系统抽样(等距抽样)、与规模成比例的概率抽样(PPS)等。为了便于抽样的组织实施和提高抽样效率, 还经常采用分层抽样、多阶段抽样、二相抽样等抽样方法。非概率抽样指调查者根据自己的主观判断或意愿抽取样本的方法,通常没有抽样框,抽样概率也没有分布到全部调查对象,有的个体有可能被抽到,有的个体则没有被抽到的可能。在政府统计工作和社会经济统计调查中,概率抽样是经常使用的方法。

(四)统计推断。

是以样本中得到的有关抽样总体的个体信息为依据,对总体的总量、均值或比率等做出估计。对于来自概率抽样的样本,由于样本抽选过程具有随机性,按照概率抽样的原理,可以计算得到样本被抽中的入样概率,由此对总体的总量或均值指标做出统计推断,并且能够得到对应的统计估计量的方差,用以衡量估计结果的精度。对于非概率抽样的样本,由于不遵循随机原则,因而样本不能直接用于统计推断。虽然根据样本调查结果在一定程度上也能说明总体的统计特征, 但由于无法确定抽样误差,因此难以衡量对总体总量或均值的估计精度。

(五)总误差。

包括抽样误差和非抽样误差两部分。抽样误差来自于抽样方法的运用,是由样本估计总体而产生的误差。在抽样方案既定的前提下,样本量与估计量的抽样误差相关。通常在给定抽样方法和置信度情况下,抽样设计所允许的估计量的绝对误差限或变异系数(C.V)越小,则所需抽选的样本量越大。非抽样误差是抽样以外的因素造成的误差,包括由抽样框的不准确或不完整引起的抽样框误差, 以及调查过程中的无回答误差、测量误差和调查误差(回答或记录差错等)。

二、主要作用

抽样调查方法起源于十九世纪的欧洲,在二十世纪中期逐步形成了较完整的理论体系。抽样调查在社会经济生活和科学研究中都有着广泛应用,也是各国政府统计部门经常采用的一种调查方式。其作用主要有以下三方面:

一是研究社会经济现象和统计科研的有力工具。对于不易或不能进行全面调查的总体或事物,从总体中抽取部分样本,依据概率对总体总量或均值做出可靠估计;对于一些具有一定破坏程度的试验或产品检验,抽样调查是得到总体参数必须采用的方法。

例如,我国市场监管部门对于食品安全的检查就是典型的抽样调查,也可以叫做抽样检验。监管部门对某乳品企业生产的一批盒装鲜奶产品,采用简单随机抽样方法抽取一部分鲜奶产品样本(样本的数量必须满足预设的抽样估计精度)。抽选出样本后,用特定仪器和方法对鲜奶产品样本中的脂肪、蛋白质、总固体、菌落总数、大肠菌群等进行检验,从样本中得到的各指标的平均水平就代表了该批次整体水平的估计值。如果估计结果符合国家相关标准,就说明整个该批次的鲜奶产品检验合格,可以进入市场销售。

二是取得调查对象第一手资料,及时、准确地反映社会经济变化的有效方法。国内外通常采用由政府主导的周期性普查方式,取得一定时点或时期社会经济发展的基础信息和结构性基准数据,同时用来构建满足抽样设计的抽样框。在普查的间隔年份,常规统计工作主要采用抽样调查的方法,通过对调查对象第一手信息的收集,在有质量保证的前提下,对总体的情况做出精确推断。

三是进行普查、常规统计调查数据质量评估的必要手段。通常在普查的数据采集结束后要进行事后质量抽查,据此对普查数据质量(漏报、多报情况等)做出评价。在常规统计调查活动中,也可以采用事后质量抽样调查的方法,再次抽取一定数量的样本对统计调查的数据质量进行评价。

三、示例

我国政府统计工作中,广泛采用了抽样调查的技术方法,国家统计局在人口变动、劳动力、城乡居民收支、农产量、畜禽监测、居民消费价格等调查,以及规模以下的工业、限额以下批发和零售业、规模以下服务业等调查中都采用了抽样调查方法。此外,人口普查、经济普查和农业普查中也都采用事后质量抽样调查的方式进行数据质量评估。统计调查实际工作中,通常要先对抽样调查的总体单元进行分析,掌握总体单元中目标变量的分布情况,将目标变量特别大的那部分作为“规模以上”单独拿出来进行普查,然后再对余下的总体单元构建抽样框, 进行有效的抽样设计。

以国家统计局现行农产量抽样调查为例,整个抽样调查的工作流程如下。

(一)构建地域抽样框。通常抽样框的构建以行政村为样本单元,依据第三次全国农业普查农作物遥感测量取得的农作物种植区的地块面积及主要品种农作物种植面积等辅助信息得到村一级数据,用于初级抽样单元(行政村)抽样框的构建。

(二)抽选调查样本。农产量调查常采用分层两阶段抽样方法抽选农作物播种面积调查样本及单产调查样本。农作物播种面积调查样本,通常按照农作物种植的区域特点或种植强度对抽样框中的行政村按地域(如各县)进行分层,第一阶段采用与耕地面积的规模成比例的概率抽样方法抽选样本村,第二阶段在抽选出的样本村中采用简单随机抽样方法抽取耕地单位区(按一定面积组合的耕地地块)。主要农作物品种的单产调查,则是在播种面积调查样本中再通过二相抽样方法,在已确定有种植某种作物的耕地单位区中抽取部分的耕地单位区及自然地块,布放若干实割实测的小样本,用于单产的实割实测调查。既满足了抽样设计的要求又适当减少了调查样本量。

(三)实地调查取得样本调查数据。农作物播种面积实地调查在已抽选出的样本耕地单位区内进行分品种播种面积的数据采集;主要品种的单产调查则是在抽选出的单产调查样本中开展实割实测调查,取得样本地块的单产数据及测定含水率和杂质率,并测算割、拉、打过程的损失量。

(四)播种面积和单产推算。在取得对抽中耕地单位区分品种农作物面积的基础上,原则上按照每个样本对应的总权数(两阶段入样概率倒数的乘积)进行加权求和,对总体分品种的农作物播种面积做出估计。在实际统计调查过程中,往往会遇到无法取得调查数据,即调查对象无回答的情况,这就需要对无回答情况做出权数调整,然后再用于推算总体的农作物播种面积。另外,在有可靠外部信息的情况下,如具有抽样总体的农业普查数据,这时可以用外部辅助信息进一步校准权数,进而采用校准权数对农作物播种面积做出估计。对主要品种农作物单产的计算,由于实割实测用的样本通常采用自加权的抽样设计,因而单产采用对所有实测样本进行简单平均的方式进行计算。

(五)给出估计量的方差估计。对于统计推断的估计结果,还需要给出估计量即农作物播种面积和单产的方差估计用于衡量估计结果的精度。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/11506.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

黑盒测试中的边界值分析

黑盒测试是一种基于需求和规格的测试方法,它主要关注软件系统输出的正确性和完整性,而不考虑内部代码的实现方式。在黑盒测试中,边界值分析是一种重要的测试技术,它可以帮助测试人员有效地发现输入和输出的问题。本文将从什么是边…

探索未知:风靡硅谷开发者的 Unstructured Data Meetup 即将登陆中国

“最硅谷”的 Unstructured Data Meetup 即将来袭! 众所周知,AI 三要素包括:算力、算法和数据。数据的价值愈发凸显,而其中非结构化数据更是备受关注。IDC 预测,到 2025 年,全球数据总量中将有超过 80% 的数…

【面经】Linux

一、高频 1、Linux常见的指令 路径/目录类 cd, mkdir, rmdir, pwd ,ls等重要指令;rmdir 仅能删除空目录,要删除非空目录需使用“ rm -r ”指令;文件类 创建:mkdir文件夹,touch文件移动mv复制cp修改名字mv…

基于SSM的宠物领养系统的设计与实现

摘要 在当前社会,随着人们生活水平的提高,越来越多的家庭和个人开始养宠物。然而,由于各种原因,一些宠物被遗弃或需要救助,同时也有许多潜在的宠物领养者希望通过正规途径领养宠物。本次设计为宠物救助组织、寻找新家…

蓝桥杯2024【第十五届省赛】Python B (78分题解)

第三年蓝球杯,感觉题目比往年简单多了。题量合适够我这种菜鸟解答... ... 大概可能有45分,希望进省一大三最后i一次机会了55555 进省一了耶耶耶 试题 A: 穿越时空之门(满分) 本题总分:5 分 【问题描述】 随着 202…

【经验】mysql冷热数据分离

使用mysql存储时,为了提升数据的查询效率,降低磁盘存储压力等,我们常常使用"冷热数据分离"分离的方案。即,将数据从所谓的“热表”(即经常有写入和查询操作的活跃表)迁移到“冷表”(用…

Django——中间件

Django——中间件 中间件可以介入 Django 的请求和响应的处理过程,修改 Django 的响应数据。中间件的设计为程序开发者提供了一种无侵入式的开发方式,增强 Django 框架的健壮性。 中间件可以在 Django 处理视图的不同阶段的干预。 Django 框架中原先内…

Python深度学习基于Tensorflow(7)视觉处理基础

文章目录 视觉基础图像基础卷积层:图像的中全连接层的优化卷积核tf.keras中的卷积函数池化层 现代经典网络DenseNet 数据增强 图像的本质是一个矩阵, 矩阵中的一个点就是一个像素,如果像素大小为 1000 1000 1000 \times 1000 10001000&…

代码随想录算法训练营第五十二天|LeetCode300.最大递增子序列、LeetCode674.最长连续递增子序列、LeetCode718.最长重复子数组

LeetCode 300 最大递增子序列 题目链接:300. 最长递增子序列 - 力扣(LeetCode) 【解题思路】 1.确定dp数组含义 dp[i]表示的是i之前以nums[i]为结尾的最长递增子序列的长度 2.确定递推公式 如果nums[i]>nums[j] max(dp[j]1,dp[i]) 3.初…

Scala、Spark SQL 常用方法

目录 数组常用方法 列表操作常用方法 Scala中常用的查看列表元素的方法有head、init、last、tail和take()。 合并两个列表还可以使用concat()方法。 集合操作常用方法 map()方法 foreach()方法 filter()方法 flatten()方法 groupBy()方法 ​编辑 从内存中读取数据创建…

二叉树之左叶子的和

题目: 给定二叉树的根节点 root ,返回所有左叶子之和。 示例 1: 输入: root [3,9,20,null,null,15,7] 输出: 24 解释: 在这个二叉树中,有两个左叶子,分别是 9 和 15,所以返回 24示例 2: 输入: root […

时间瑾眼中的IT行业现状与未来趋势

文章目录 技术革新与行业应用IT行业的人才培养与教育人工智能与机器学习的演进数据安全与隐私保护可持续发展与绿色技术社会责任与道德规范 随着技术的不断进步,IT行业已成为推动全球经济和社会发展的关键力量。从云计算、大数据、人工智能到物联网、5G通信和区块链…

朋友在阿里测试岗当HR,给我整理的面试题文档

以下是软件测试相关的面试题及答案,欢迎大家参考! 1、你的测试职业发展是什么? 测试经验越多,测试能力越高。所以我的职业发展是需要时间积累的,一步步向着高级测试工程师奔去。而且我也有初步的职业规划,前3年积累测试经验&…

动手学深度学习18 预测房价竞赛总结

动手学深度学习18 预测房价竞赛总结 李沐老师代码AutoGluonh2o集成学习automlQA 视频: https://www.bilibili.com/video/BV15Q4y1o7vc/?vd_sourceeb04c9a33e87ceba9c9a2e5f09752ef8 代码: https://www.bilibili.com/video/BV1rh411m7Hb/?vd_sourceeb04…

笔灵ai答辩ppt、轻竹PPT、AIPPT、iSlide:这四款AI PPT工具有何独特优势?

提起PPT,大家的第一反应就是痛苦。经常接触PPT的学生党和打工人,光看到这3个字母,就已经开始头痛了: 1、PPT内容框架与文案挑战重重,任务艰巨,耗费大量精力。 2、PPT的排版技能要求高,并非易事…

springboot整合s3,用ImageIO进行图片格式转换

上次用laravel进行了一些s3得整合&#xff0c;可以看出来其实蛮简单得。 先导包 <dependency><groupId>software.amazon.awssdk</groupId><artifactId>s3</artifactId></dependency> 然后在配置类中写bean private static final String …

【软考】设计模式之观察者模式

目录 1. 说明2. 应用场景3. 结构图4. 构成5. 优缺点5.1 优点5.2 缺点 6. java示例 1. 说明 1.定义对象间的一种一对多的依赖关系&#xff0c;当一个对象的状态发生改变时&#xff0c;所有依赖于它的对象都得到通知并被自动更新。2.也称为模型-视图模式、源-收听者模式或从属者…

关于Double接收到字符串 插入失败 Overflow Exception trying to bind NaN

前端计算 传值给后端NaN 后端接收到之后直接执行插入操作 报错 Error updating database. Cause: java.sql.SQLException: Internal Error: Overflow Exception trying to bind NaN 如果前端传值 NaN 或者 Infinity java是不报错的 只有插入报错 double result1 10.0 / 0; /…

神经网络复习--数学相关基础知识

文章目录 矩阵范数卷积激活函数信息熵 矩阵 标量&#xff1a;一个标量就是一个单独的数向量&#xff1a;一个向量是一列数。这些数是有序排列的。通过次序中的索引&#xff0c;我们可以确定每个单独的数矩阵&#xff1a;矩阵是一个二维数组&#xff0c;其中的每个元素被两个索…

华为机试打卡 HJ5 进制转换

要机试了&#xff0c;华孝子求捞&#xff0c;功德 描述 写出一个程序&#xff0c;接受一个十六进制的数&#xff0c;输出该数值的十进制表示。 数据范围&#xff1a;保证结果在 1≤&#x1d45b;≤2^31−1 输入描述&#xff1a; 输入一个十六进制的数值字符串。 输出描述…