excel随机抽取_简单随机抽样及其进阶分层随机抽样方法展示

c1a4b9ed1ad97a5dc0c2e9316a6d7fac.png

一、分享简单随机抽样的几种方法

1、抽样分析工具抽样

2、INDIRECT+RANDBETWEEN函数抽样

3、RAND+排序抽样

4、SAS抽样

二、分层抽样方法

1、Python分层抽样

2、SAS分层抽样

3、EXCEL函数及功能分层抽样

简单随机抽样的几种方法

403e967360c6e6fadf5f32813b9dd1b3.png

方法一

抽样分析工具抽样

如果你的EXCEL尚未安装数据分析,采用以下方法调出“数据分析”工具:

EXCEL2013版:

“文件”——“选项”——“加载项”——“分析工具库”,然后确定,即可添加在EXCEL工具栏。

EXCEL2007版:

“选项”——“加载项”——“分析工具库”进行加载即可。

033561ed42339320189dabee8097949e.png

(以2013版为例:)

举例:某企业有客户10万,现需要通过电话回访的方式进行客户满意度调查,了解客户对企业产品和服务的评价。如果直接对10万客户进行回访,时间成本、人员成本都难以估算,经过专家论证、客户认可,现决定从10万名客户中抽取1000名作为调查样本进行回访,为了保证结果的客观性,采取随机抽样的方式进行抽查。

1、打开需要抽样的EXCEL表格

2、选“数据”——“数据分析”——“抽样”

55642a7d9de0d8575edf95419c0154ee.png

3、根据要求选:

  • “输入区域”的数据

  • 抽样方法选“随机”

  • 输出选项选“输出区域”(以此为例)

0b51508038573eb666d0b64a1f19ae0a.png

4、结果如图:(从10万名客户里随机抽取1000名客户进行调研,抽取结果如下)

8e61a6cab827492577e8a9bfa82e29d8.png

然后通过计算可得出抽样的情况,从而可以推断出总体情况。

备注:

1、抽样样本越多,所得的结果,越接近真实结果;

2、用抽样分析工具抽样,只能对数值型数据进行抽样,对于其他类型的抽样无法完成。

403e967360c6e6fadf5f32813b9dd1b3.png

方法二

INDIRECT+RANDBETWEEN函数抽样

举例:某企业有客户2万,现需要通过电话回访的方式进行客户满意度调查,了解客户对企业产品和服务的评价。如果直接对2万客户进行回访,时间成本、人员成本都难以估算,经过专家论证、客户认可,现决定从2万名客户中抽取100名作为调查样本进行回访,为了保证结果的客观性,采取随机抽样的方式进行抽查。

1、 打开需要抽样的EXCEL表格

2、在EXCEL的空白区域写入,暂以E列为例,在E2写入

=INDIRECT("a"&RANDBETWEEN(2,20001)),下拉100个单元格,结果如下:

ad9137e99c454269a5c40db82688d0ae.png

3、然后通过计算可得出抽样的情况,从而可以推断出总体情况。

403e967360c6e6fadf5f32813b9dd1b3.png

方法三

用RAND函数加排序功能

举例:某企业有客户10万,现需要通过电话回访的方式进行客户满意度调查,了解客户对企业产品和服务的评价。如果直接对10万客户进行回访,时间成本、人员成本都难以估算,经过专家论证、客户认可,现决定从10万名客户中抽取1000名作为调查样本进行回访,为了保证结果的客观性,采取随机抽样的方式进行抽查。

1、在B1中输入“=RAND()”,向下填充至C1000000

874bdc26d1a114a2d06cf11947b33f52.png

2、选择C列,点击工具栏中的数据→升序,在弹出的窗口中选择“扩展选定区域”,再点击“排序”按钮

3、此时A列中的序号已经打乱了,直接看A2至A10001中的值就可以达成“随机抽查10个客户”的要求了,然后通过计算可得出抽样的情况,从而可以推断出总体情况。

403e967360c6e6fadf5f32813b9dd1b3.png

方法四

利用SAS软件进行随机抽样

PROC SURVEYSELECT一般形式:

Proc surveyselect data=

      Method=/*抽样方法选择*/

      out=

n=(or samprate=抽样比例)

seed=n;

       strata ;

        id ;

run;

1.从数据集text.bclass中不重复随机抽取20条记录,保留所有变量

proc surveyselect data=text.bclass out=srsa1 method = srs

                sampsize =20;

     run;

2. 从数据集text.bclass中重复随机抽取20条记录,保留所有变量

proc surveyselect data=text.bclass out=srsa1 method= urs

                sampsize =20;

     run;

3. 随机抽取总体的10%作为样本,保留所有变量

proc surveyselect data=sashelp.prdsale out=srs415 method = srs

                samprate = 0.1;

     run;

简单随机抽样进阶——分层抽样方法

403e967360c6e6fadf5f32813b9dd1b3.png

方法一

利用Python进行分层抽样

import pandas as pd

df = pd.read_excel(r"地址及名称.xlsx")

data = pd.DataFrame(df)

gbr = data.groupby("分层变量")

tdict={"变量1":1500,"变量2":1500,"变量3":1500,"变量4":1500,"变量5":1500,"变量6":1500,"变量7":1500}/*分层变量,及每个变量需要抽取的数量 */

def sampling(group,tdict):

    name = group.name

    n = tdict[name]

    return group.sample(n=n)

resut = data.groupby("分层变量",group_keys=False).apply(sampl

ing,tdict)

resut.to_excel(r"输入地址及名称.xlsx")

403e967360c6e6fadf5f32813b9dd1b3.png

方法二

利用SAS软件进行随机抽样

1、手工设置抽样比例或者抽样数

proc sort data=test1;

by 分层变量;

run;/*先用分层变量对总体样本进行排序*/

proc surveyselect  data=test1 out=results3 method=srs

 samprate=(0.1,0.3,0.5,0.2);/*根据分层情况设置每一层要抽取的比例*/

strata 分层变量;

run;/*根据分层变量不等比例从总体中抽取样本*/

proc surveyselect  data=test1 out=results3 method=srs

sampsize=(30,20,50,40);/*根据分层情况设置每一层要抽取的样本数*/

strata 分层变量;

run;            

2、根据抽样表进行不等比例抽样

proc sort data=test1;

by 分层变量;

run;/*先用分层变量对总体样本进行排序*/

proc surveyselect  data=test1 out=results3 method=SRS

samprate=samp_table;/*通过抽样比例数据集进行抽样,samp_table数据集中要包括分层变量,以及每一分层对应的抽样比例或者数量,如果按比例抽样变量必须用_rate_来命名抽样比例,如果是按数量抽样必须用_nsize_来命名抽样数量*/

strata 分层变量;

run; 

403e967360c6e6fadf5f32813b9dd1b3.png

方法三 

利用excel函数及相关功能进行分层随机抽样

1、利用rand()函数,添加辅助列随机

859899db23389584f9af97306d4ba50f.png

2、去除rand()函数公式,升序、降序排列都可以

65b50473da04fb406869cf3f10106ce7.png

3、利用countif(A$2$:A2,A2)添加辅助列,并去除公式

4、将每个类型需要抽取的数量放到任意区域

5、利用Excel中数据-高级功能进行随机抽取

b6c3784ecdbc42212549a41ccecaf474.png

作者:渠道研究部冯乙

Python方法:胡扬指导

SAS方法:杨家辉指导

点击在看,了解更多精彩内容29c6581efa34a056d03d72e5661f3b4c.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/337393.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么存在动态内存分配,动态内存函数(malloc函数,free函数,calloc函数,realloc函数)...

点击蓝字关注我们1.当前我们知道的内存的使用方法2.为什么存在动态内存分配如上我们已学的开辟空间的方式有两个特点:空间开辟的大小是固定的必须指定数组的长度所以就产生了空间开大了浪费开小了不够用的问题,所以使用动态内存分配3.动态内存函数&#…

C++ vector类的模拟实现

点击蓝字关注我们1.前言vector和string虽然底层都是通过顺序表来实现的,但是他们利用顺序表的方式不同,string是指定好了类型,通过使用顺序表来存储并对数据进行操作,而vector是利用了C中的泛型模板,可以存储任何类型的…

visual studio源文件的编译顺序是依据什么?

问题:visual studio源文件的编译顺序是依据什么? 结论:依据 .vcxproj 文件里 指定了ClCompile的ItemGroup ,如下图所示,就是这么简单粗暴。

功能齐全的屏幕截图C++实现详解

点击蓝字关注我们1、概述要使用屏幕截图,其实很容易,装一款聊天软件或者办公软件就可以了,比如QQ、企业微信、钉钉、飞书等。但要开发出类似这些软件的屏幕截图模块,则没那么容易。其实实现屏幕截图的技术并不复杂,主要…

如何判断exe文件是debug还是release编译生成的

如何判断exe文件是debug还是release编译生成的结论: 用IDA工具打开exe,然后看Imports里面的依赖库是否有带d或D结尾的,如果有就说明是Debug的 实验:(实验环境 vs2017, IDA工具) (0&…

大屏可视化分配率是什么意思_什么是分配率?

大屏可视化分配率是什么意思诸如“不可持续的分配率”和“您需要保持较低的分配率”之类的短语似乎仅属于Java Champions的词汇表。 复杂,恐怖并被魔术光环包围。 经常发生的情况是,当您更仔细地查看概念时,魔术会随着抽烟消失。 这篇文章试…

C/C++语言动态开辟的杨辉三角

点击蓝字关注我们问题引入杨辉三角相必大家并不陌生,第1行有1列、第二行有2列…第n行有n列,且每行行首和行尾的值都为1,其余的值为上一行两数相加我们在C语言阶段,第一次碰到的杨辉三角应该都是用常规的二维数组存储,可…

git gui 历史版本_这些Git命令都不会,还是不要去面试了

前言以下,项目中经常使用的Git命令,汇总到这里以便与你能快速的学习和掌握Git命令,在文章最后有惊喜哟,一定要看到最后啊!使用的 Git版本:git version 2.24.0命令git log# 输出概要日志,这条命令等同于# gi…

java restful_Java EE中的RESTful计时器

java restful在这篇文章中...。 EJB计时器旋风之旅 通过带有示例实现的简单REST接口即时使用EJB计时器 更新(2015年7月14日) 该应用程序的前端现在可以在OpenShift上使用 。 由于我是前端新手,因此我在其他来源的帮助下组装了此HTML5 Ang…

c# 联合halcon 基于相关性 模板匹配_机器视觉之halcon入门(5)-字符识别exe生成...

2.3.2 第二个halcon程序转EXE程序:字符识别老规矩,每一段halcon代码得用C#二次开发下。根据上一节所教的,我们配置下C#的环境,顺便添加好控件,如下图(2-3-2-1)。图 2-3-2-1控件基本跟上一节一样,只是少了一…

C语言数据的存储和取出(超详细讲解)

点击蓝字关注我们整形的储存我们知道一个整形的存储是以补码的形式储存取出是原码的形式。比如:int a 5;的二进制是101那它的原码应该是:00000000 00000000 00000000 00000101正数的原反补相同那它存进去和取出来都是:00000000 00000000 000…

打印pdf就一页_PDF 文件转换工具

是将 PDF 文件转换为完全可编辑的 Windows 文档最好的转换软件。无论您需要您的内容是 Microsoft Word、Excel、PowerPoint、HTML 还是仅需要文本, 总会给您一个简单的方法,快捷地获取您要的内容。可转换整个文档或选择内容。亦可创建 PDF 文件。PDF 转换…

C++类的this指针,静态成员,友元函数友元类

点击蓝字关注我们1. this指针在上篇讲C中类,对象,封装,继承(派生),多态的时候,this指针出现在成员函数中,并使用->成员提取符操作成员变量。在 C 中,每一个对象都能通…

批量提取文件创建时间_批量采集新浪微博用户内容

有时我们需要把某些用户的微博数据全部采集下来用作分析,每条信息复制的工作量是非常低效的,必须要借助工具。今天给大家介绍一款采集软件:微风采集器。打开软件,选择模板,下拉框选:批量提取指定用户微博内…

C++异常的规则

点击蓝字关注我们异常是指存在于程序运行时的异常行为,这些行为超出了函数正常功能的范围,当程序的某部分检测到一个无法处理的问题时,就需要用到异常处理。1. C语言中传统的处理错误方式终止程序:如assert,当发生错误…

异质性查询需要为连线设定_振奋人心!华东理工大学开发新型的荧光染料,为细胞成像奠定基础...

结合并激活荧光染料的适体荧光RNA(FR)已用于对丰富的细胞RNA种类进行成像。然而,诸如低亮度和具有不同光谱特性的染料/适体组合的有限可用性的局限性,限制了这些工具在活的哺乳动物细胞和体内的使用。最近,华东理工大学朱麟勇及杨弋共同通讯在…

C++ STL详解(1)

点击蓝字关注我们概述STL 是“Standard Template Library”的缩写,中文译为“标准模板库”。STL 是 C 标准库的一部分,不用单独安装。C 对模板(Template)支持得很好,STL 就是借助模板把常用的数据结构及其算法都实现了…

各种说明方法的答题格式_高中化学:选择题答题方法与知识点总结,让你轻松秒杀各种难题...

选择题是化学考试中被广泛采用的一种题型。它具有知识容量大,覆盖面广,构思新颖、灵活巧妙,考试的客观性强,答题简单,评分容易、客观准确等优点。 选择题按考查形式可分为三种类型,即:常规型选择…

C++ STL详解(2)

点击蓝字关注我们来源自网络&#xff0c;侵删刷题时常用的STLstring之前写过一篇 string 的简介但是不是特别全面&#xff0c;这里再补充说明一下。size()返回字符串中字符的数量#include<iostream> #include<string>using namespace std;int main() {string str …

斐波那契数列的四种实现方式(C语言)

点击蓝字关注我们来源自网络&#xff0c;侵删斐波那契数列是一组第一位和第二位为1&#xff0c;从第三位开始&#xff0c;后一位是前两位和的一组递增数列&#xff0c;像这样的&#xff1a;0、1、1、2、3、5、8、13、21、34、55......今天&#xff0c;我们用四种方式来进行实现…