抽样算法——【数据科学与工程算法基础】

一、前言

        这是课程的第二章节——抽样算法,主要分为三类。


详情可参考: 数据科学的算法基础——学习记录跳转中心


二、正篇 

        1.系统抽样 

        课本只介绍了最简单的——等距抽样。 

         直线等距抽样(N=n*k):即总体个数可以被抽样个数整除时,每隔k个取一个样本,第一个可能给出,可能随机。        

        圆形等距抽样(N!=n*k):依旧,只不过成了圆,超出范围了接着从头取

        2.分层抽样 

        高中知识,按比例分层,之后按照简单随机或系统抽样在每一层抽取相应个数。 

        3. 水库抽样

         总体容量未知,数据流无限,以例子讲解如何做,不再证明,感兴趣自行搜索。

 简述给定一个数据流,如何均匀地从中随机抽取1000条记录?

三、例题 

         1.直线等距

        用系统抽样法从160个灯泡中抽取一个容量为20的样本。将这160个灯泡编号为1~160,若第16个被抽中的个体编号为126,则起始编号为(    6    )

         2.圆形等距

        设总体有14个个体,按照1~14进行编号。欲以系统抽样法抽取容量为n=4的样本,且第一个抽中的样本编号为4,则最后一个样本编号为(    2    )

四、总结 

         三种方法共同点:抽样时每个个体被抽取到的可能性相等,但各有特点。

     ————跳转下一章节:抽样算法 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/738492.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

力扣爆刷第92天之hot100五连刷46-50

力扣爆刷第92天之hot100五连刷46-50 文章目录 力扣爆刷第92天之hot100五连刷46-50一、114. 二叉树展开为链表二、105. 从前序与中序遍历序列构造二叉树三、437. 路径总和 III四、236. 二叉树的最近公共祖先五、124. 二叉树中的最大路径和 一、114. 二叉树展开为链表 题目链接&…

JAVA实战开源项目:学生日常行为评分管理系统(Vue+SpringBoot)

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、系统设计2.1 功能模块设计2.2.1 登录注册模块2.2.2 用户管理模块2.2.3 评分项目模块2.2.4 评分数据模块2.2.5 数据字典模块 2.3 可行性设计2.4 用例设计2.5 数据库设计2.5.1 整体 E-R 图2.5.2 用户2.5.3 评分项目2.5.4 评分数据2.5.…

弹性盒子布局 Flexbox Layout

可以嵌套下去 1.display 属性 默认行排列 <style>.flex-item{ height: 20px;width: 10px;background-color: #f1f1f1;margin: 10px;}</style> </head> <body> <div class"flex-container"><div class"flex-item">1&l…

功能测试转自动化测试好不好转型?

手工测试做了好多年&#xff0c;点点点成了每天必须做的事情。但是随着自动化测试趋势的日渐明显&#xff0c;以及受到薪资、技能的双重考验&#xff0c;掌握自动化测试成为了必备技能。 手工转自动化测试&#xff0c;不是一蹴而就的。“预先善其事&#xff0c;必先利其器”&a…

DAMA考试知识点笔记

数据管理的定义: 数据管理是为了交付、控制、保护并提升数据和信息资产的价值&#xff0c;在其整个生命周期中制定计划、制度、规程和实践活动&#xff0c;并执行和监督的过程。 数据管理专业人员的定义: 是指从事数据管理各方面的工作(从数据全生命周期的技术管理工作&#x…

Android Jetpack:概述、优劣分析及其应用场景探索

一、引言 随着移动应用程序市场的不断发展&#xff0c;开发者面临着日益增长的竞争压力。为了提高开发效率和应用程序质量&#xff0c;谷歌推出了Android Jetpack&#xff0c;一套组件库、工具和指南&#xff0c;旨在帮助开发者更轻松地构建出色的Android应用程序。本文将对And…

C++:2024/3/11

作业1&#xff1a;编程 要求&#xff1a;提示并输入一个字符串&#xff0c;统计该字符中大写、小写字母个数、数字个数、空格个数以及其他字符个数 代码&#xff1a; #include <iostream>using namespace std;int main() {string str;cout << "请输入一个字…

二叉树习题详解

LCR 046. 二叉树的右视图 - 力扣&#xff08;LeetCode&#xff09; 用t来记录每层节点个数&#xff0c;每次队列第一个数都是最右边的数。 class Solution { public:vector<int> rightSideView(TreeNode* root) {if(rootNULL) return {};queue<TreeNode*>q;vecto…

linux查看文件内容cat,less,vi,vim

学习记录 目录 catlessvi vim cat 输出 FILE 文件的全部内容 $ cat [OPTION] FILE示例 输出 file.txt 的全部内容 $ cat file.txt查看 file1.txt 与 file2.txt 连接后的内容 $ cat file1.txt file2.txt为什么名字叫 cat&#xff1f; 当然和猫咪没有关系。 cat 这里是 co…

一款功率电子开关TP6062

一、基本概述 The TP606X is a low voltage,single P-MOSFET high-side power switch, optimized for self-powered and bus-powered Universal Serial Bus (USB) applications. This switch operates with inputs ranging from 2.4V to 5.5V, making it ideal for both 3V a…

封装方法3-2

八大数据类型一次只能代表一个&#xff0c;所以不能作为返回值&#xff0c; 数组可以做为返回值&#xff0c;把excel的内容2行11列当作数组&#xff0c;存在二维数据里 处理ecxel-22个单元值的返回结果写什么&#xff1f; 1、认识二维数组是什么&#xff1f; 数 组&#xff…

Ping工作原理

文章目录 目的ping网络协议 OSIICMP什么是ICMP作用功能报文类型查询报文类型差错报文类型ICMP 在 IPv4 和 IPv6 的封装ICMP 在 IPv4 协议中的封装ICMP 在 IPv6 协议中的封装ICMP 头部日常ping 排除步骤ping 查询报文使用code扩展目的 本文主要是梳理ping的工作原理- 揭开 ICMP…

开淘宝店保证金怎么交

对于想要在淘宝上开店的人来说&#xff0c;交纳保证金是必要的一步。保证金是淘宝平台为了保障买家权益而要求卖家缴纳的一笔款项&#xff0c;用于确保卖家在经营过程中遵守淘宝规则&#xff0c;并对买家负责。那么&#xff0c;开淘宝店保证金怎么交呢&#xff1f;下面就为大家…

Java 解析常见文本文件数据

文章目录 前言简介第一步&#xff1a;引入依赖第二步&#xff1a;编写文件解析处理类第三步&#xff1a;Word解析类第四步&#xff1a;PDF解析类第五步&#xff1a;Txt解析类总结 前言 请各大网友尊重本人原创知识分享&#xff0c;谨记本人博客&#xff1a;南国以南i、 提示&a…

python开发100问?

Python是什么&#xff1f;它有什么特点&#xff1f;Python的历史是什么样的&#xff1f;Python有哪些应用领域&#xff1f;Python的基本数据类型有哪些&#xff1f;Python中的变量命名规则是什么&#xff1f;如何在Python中进行注释&#xff1f;Python中的缩进是什么意思&#…

C++初学

1>思维导图 2>试编程 提示并输入一个字符串&#xff0c;统计该字符中大写、小写字母个数、数字个数、空格个数以及其他字符个数要求使用C风格字符串完成 #include <iostream> #include<string.h> using namespace std;int main() {string str;cout <<…

Hive-源码分析一条hql的执行过程

一、源码下载 下面是hive官方源码下载地址&#xff0c;我下载的是hive-3.1.3&#xff0c;那就一起来看下吧 https://dlcdn.apache.org/hive/hive-3.1.3/apache-hive-3.1.3-src.tar.gz 二、上下文 <Hive-源码带你看hive命令背后都做了什么>博客中已经讲到了hive命令执行…

消息队列中间件

1.什么是消息队列? 消息队列&#xff0c;我们一般称为MQ&#xff08;Message Queue&#xff09;。 很多初学者认为MQ通过消息的发送和接受来实现程序的异步和解耦&#xff0c;但是实际上MQ的主要目的是通讯。 MQ定义了发送者为生产者&#xff0c;接收消息的那一方为消费者。…

网络工程师笔记11

OSPF协议 priority越大越优先&#xff0c;缺省值是1&#xff0c;范围是0-255 routerID越大越优先&#xff0c;先比较优先值&#xff0c;后比较RouterID 非骨干区域必须要跟骨干区域相连&#xff0c;非骨干区域不能直接通信&#xff0c;必须经过骨干区域 OSPF配置 配置routerID划…

20240308-使用VS2022编译VLD-v2.5.4内存泄漏工具

20240308-使用VS2022编译VLD-v2.5.4内存泄漏工具 一、软件环境 Win10 x64 22h2 JuneVS2022 v17.9.0GIT v2.29.2标签&#xff1a;win10 22h2 vs2022分栏&#xff1a;C 二、硬件环境 Win10 x64的PC台式机 三、获取源码 方法一 git clone https://gitee.com/gdnh22/vld254.…