CDA-LevelⅡ【考题整理-带答案】

  1. 关于相关分析中应注意的问题,下面说法错误的是:B 如果两变量间的相关系数为0,则说明二者独立 。解释:只能说明两者不存在线性相关关系
  2. 现通过参数估计得到一个一元线性回归模型为y=3x+4,在回归系数检验中下列说法错误的是: B 原假设B1= 3 。 解释:应该是0
  3. 关于一元线性回归的求解过程说法正确的是: A 一元线性回归只需要求解出两个系数即可
    1. 回归模型知识根据已有数据总结出了其中包含的线性关系,然后对于新样本进行预测,但是预测值与真实值之间是可能存在差异的
    2. 一元线性回归模型的基本形式一般是包含常数项的
    3. 回归模型中的估计系数是对应真实系数的无偏差估计 
  4. 根据最小二乘法拟合直线回归方程是使:B 离差平方和最小的参数 。解释:离差就是真实值与预测值的偏差
  5. 在给定的显著性水平下,某一特性的X水平上,总体Y分布的离散度越大,则: A 预测区间越宽,精度越低
  6. 关于单因素方差分析,下列说法不正确的是 : A 组间平方和只包含随机误差 。解释:组件误差包括间差异和随机误差。
  7. 为了比较两个总体方差,我们通常可以检验两个总体的: B 方差比 。解释:通常采用检验两个总体方差比的F检验;
  8. 方差分析中:组内误差平方和+组件误差平方和= 总误差平方和;组内自由度+组间自由度= 总自由度;f值= 组间均方误/组内均方误
  9. 方差分析是统计学中常用知识,下列关于方差分析的说法不正确的是: A 方差分析是一种检验若干个正太分布的均值和方差是否相等的一种统计方法 ;解释:方差分析是一种检验若干个独立正态总体均值是否相等的一种统计方法,不能用于检测方差是否相等。
  10. 在假设检验问题中,原假设为H0,给定显著水平为a,则正确的是 C: p(拒绝H0|H0正确) = a 。解释:显著水平就是标识原假设为真时,拒绝原假设的概率
  11. 在样本量给定的条件下,假设检验 中当第一类错误减小时,第二类错误怎么变化? A 必然增大 。
  12. 在列联表分析中,下列不能用卡方检验的是: C 多个均值的比较 。解释:卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,在分类资料推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比较的卡方检验。两个及两个以上样本均值的比较是用方差分析。
  13. 在假设检验问题中,原假设为H0,给定显著水平为a,则关于假设检验的原理说法正确的是 B 小概率事件 。解释:假设检验的基本思想:假设样本是从原总体中抽取的,在此假设下构造一个小概率事件。若假设成立,则小概率事件一般是不会发生的,但在一次抽样中,如果小概率事件发生了,则拒绝接收这个假设。
  14. 置信区间是统计学中常用的概念,一个95%的置信区间的含义是: D 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。
  15. 一个手机电池制造商声称,其生产的电池一次充电后正常条件下使用时长为20小时,对一个由15个电池组成的随机样本做了实验,测得平均值使用时长服从正太分布,则检验该电池与厂商声称的标准是否相符,我们应该选择: A 双侧t检验 。解释:这是一个假设检验的问题。电池使用时长服从正态分布,待检验的原因假设H0;m=20,说明是双向检测问题;又由于总体方差s是未知的,故采用t检测。
  16. 抽样是统计分析中常用的技术手段,现有一抽样的描述:“将总体的所有单位(抽样单位)按照一定顺序排列,在规定的范围i内随机抽取一个单位,这种抽样的方法称为”:D 系统抽样。
  17. X为服从正太分布的随机变量N(2,9),如果P(X>c) = P(X<c),则c的值为 B 2.解释:正态分布密度曲线关于均值m对称,m是正态分布的中心,也就是说:均值两侧发生的概率相等。
  18. 若x1、x2、x3取自某总体的样本,当期望a已知,方差c未知时,则以下不是统计量的是: D (x1+x2+x3)/c 解释:统计量是不含任何未知参数的
  19. ABtest是运维人员、产品经历等经常使用的工具,下面关于AB实验中最小样本量的描述正确的是:A 在其他条件一定时,预期提升比例越大,最小样本量越小 。解释:AB实验室为了检验某方案是否有效,即检验方案实施后的总体B是否相对实施前的总体A有显著提升。预期提升比例越大越说明B比A有显著差异,则只需越少的样本就能得出显著的结论。
  20. 用户画像室互联网企业常用的技术手段,通过对用户进行画像实现精准营销等商业活动,下面关于用户画像的说法错误的是:C 用户标签必须描述客观的事实。 解释:用户画像本质上是将用户的数据标签化。用户画像是具有动态性和时效性的,同一个用户不同的阶段、不同的时间标签是不一样的。比如是否购买过某商品的标签会因为用户消费行为产生变化。有些用户标签是基于业务经验打上的,有很强的主观性,不一定是客观事实。
  21. RFM是很传统的数据分析模型,下面关于RFM模型的描述错误的是:C 数据中只需含有用户ID、消费金额、消费日期三个字段即可使用RFM模型进行用户分层,无需考虑用户ID是否统一。
  22. 数据标签化是企业数据分析的基础工作,关于企业对数据进行标签化的目的错误的是:D 减少数据占用的存储空间。解释:企业数据标签化主要是为了后期业务系统能快速的应用数据,例如在精细化运营、用户画像分析(用户分析)、精准营销等方面,而不是为了减少数据占用的存储空间。
  23. 数据分析师在工作中常常会遇到两个概念:标签、指标,下列关于标签与指标的描述正确的是:A 指标通常可以量化,但是标签一般是不可量化的。解释:指标与标签概念不同,指标是用来定义、评价和描述特定事务的一种标准或方法;比如,新增用户数、累计用户数、用户活跃率等是衡量用户发展情况的指标。
  24. 标签系统又许多分类,从实现规则上可以为三类:基于统计类的、基于规则类的、基于挖掘技术类的,下面对于标签的分类错误的是:A APP的使用时长属于基于规则的标签。g
    1. 基于统计类的标签:这类标签是可以从用户注册、用户访问、消费类数据中统计得出,是最为基础的标签类型。例如:性别、城市、App使用时长、周均启用次数、月均消费金额等
    2. 基于规则类的标签:该类标签基于用户行为及确定的规则产生,在实际开发标签过程中,该类标签的规则由运营人员和数据人员共同协商确定;
    3. 基于挖掘类的标签:该类标签为概率模型,概率介于0-1之间的数值,需要通过算法挖掘产生。
  25. 企业数据仓库里面的数据一般是由业务数据经过ETL技术处理后来的,以下关于ETL的说法错误的是:A ETL过程中主要环节是数据抽取、数据转换和加工、数据流转
  26. 下面关于第三范式关系必然符合的条件,说法错误的是:C 其他关系的属性需要依赖于主键
  27. 企业数据分为:元数据、主数据、参考数据等分类,下面属于参考数据的是: A 客户等级分为A,B,C 。解释:A、B、C是数据取值的范围,属于参考数据
  28. 业务系统往往因为系统故障、设备故障、人为失误等原因导致数据中存在异常数据,下列哪一项方法对于发现异常值有帮助 A 计算均值加减三倍标准差的范围 
  29. 业务数据中因为某些原因可能存在异常值,先要通过可视化的方式查找某些字段数据中的异常值,优先使用: A 箱型图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/737194.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

遥感与ChatGPT:科研中的强强联合

随着科技的飞速发展&#xff0c;人工智能&#xff08;AI&#xff09;已逐渐渗透到各个领域&#xff0c;为传统行业带来了前所未有的变革。其中&#xff0c;遥感技术作为观测和解析地球的重要手段&#xff0c;正逐渐与AI技术相结合&#xff0c;为地球科学研究与应用提供了全新的…

软件设计模式:模板方法模式

1. 简介 模板方法模式是一种行为型设计模式&#xff0c;它定义了一个算法的骨架&#xff0c;将一些步骤延迟到子类中实现。这样&#xff0c;可以在不改变算法结构的情况下&#xff0c;重新定义算法中的某些步骤。 2. 使用条件 模板方法模式适用于以下情况&#xff1a; 算法…

【elasticsearch】ES的JAVA工具类完整版(待完成...)

springboot 的 elasticsearch 版本: 7.15.2 前情提要: 1.首先要理解 elasticsearch 对于【数据类型】很严格,如果字段类型不规范,在 检索/排序/聚合 时候类型不正确就会出现报错或者查不到数据的问题。所以在一般String类型插入结构如下: 这样的结构,不仅可以支持分词查…

【力扣晒题练习】232. 用栈实现队列

题目描述&#xff1a; 请你仅使用两个栈实现先入先出队列。队列应当支持一般队列支持的所有操作&#xff08;push、pop、peek、empty&#xff09;&#xff1a; 实现 MyQueue 类&#xff1a; void push(int x) 将元素 x 推到队列的末尾 int pop() 从队列的开头移除并返回元素…

基于SpringBoot的招聘网站

基于jspmysqlSpring的SpringBoot招聘网站项目&#xff08;完整源码sql&#xff09; 博主介绍&#xff1a;多年java开发经验&#xff0c;专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 央顺技术团队 Java毕设项目精品实战案例《1000套》…

Elastic Stack--03--索引操作、文档操作、_cat

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 1._cat/_cat/indices?v 查看所有的索引信息 2.索引操作索引就相当于我们讲的关系型数据库MySQL中的 database 2.1 创建索引PUT /索引名 2.2 查看索引信息GET /索引…

Java 容器启动执行指定任务

1、实现CommandLineRunner接口 实现CommandLineRunner接口&#xff0c;注意做初始化任务的类需要放在扫描路径下&#xff0c;使用Component注入到spring容器中。 import com.zw.service.StudentService; import org.springframework.beans.factory.annotation.Autowired; impo…

系统学习c++类和对象——深度理解默认成员函数

前言&#xff1a;类和对象是面向对象语言的重要概念。 c身为一门既面向过程&#xff0c;又面向对象的语言。 想要学习c&#xff0c; 首先同样要先了解类和对象。 本节就类和对象的几种构造函数相关内容进行深入的讲解。 目录 类和对象的基本概念 封装 类域和类体 访问限定符…

【Java设计模式】九、桥接模式

文章目录 0、背景1、模式2、案例3、使用场景 0、背景 现要创建不同的图形&#xff0c;图形的形状有圆、长方形、正方形&#xff0c;且它们有不同的颜色 两个维度在变&#xff0c;使用类的继承可以实现&#xff0c;也符合开闭原则&#xff0c;但会类爆炸。 1、模式 将抽象与…

BUG:Enigma Virtual Box打包.net独立程序不正常

专栏介绍与文章目录-CSDN博客 尝试了使用Enigma Virtual Box打包.net8的winform程序&#xff0c;程序发布为不依赖框架的单一文件&#xff08;设置了压缩&#xff09;&#xff0c;再和另外几个文件打包成一个exe&#xff08;另外的文件不影响.net程序打开&#xff09;。 但是打…

Vue中的组件:构建现代Web应用的基石

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…

动态规划:Leetcode 91.解码方法

题目 一条包含字母 A-Z 的消息通过以下映射进行了 编码 &#xff1a; A -> "1" B -> "2" ... Z -> "26" 要 解码 已编码的消息&#xff0c;所有数字必须基于上述映射的方法&#xff0c;反向映射回字母&#xff08;可能有多种方法&am…

GNN-Transformer新突破!全局与局部的完美融合

图神经网络&#xff08;GNN&#xff09;和Transformer的结合是近年来的研究热点。这类结合不仅能够让两者发挥各自的优势&#xff0c;还能推动模型的创新&#xff0c;提高处理图数据的效率和性能。 具体点讲&#xff0c;通过利用Transformer&#xff0c;我们可以扩展GNN的感受…

Python办公自动化之PDF(二)

Python操作PDF二 1、PyMuPDF简介2、 1、PyMuPDF简介 PyMuPDF&#xff08;也称Fitz&#xff09;开源&#xff0c;提供了一整套用于处理PDF文件的综合工具。使用PyMuPDF&#xff0c;用户可以高效地执行打开PDF、提取文本、图像和表格、操作旋转和裁剪等页面属性、创建新PDF文档以…

Koltin 语言与Java语言有哪些差异?

目录 1. 变量声明方式不同 2. 方法(函数)定义略有不同 3. 逻辑控制关键字 if 的使用区别 4. 继承的区别 5. 接口和实现的区别 6. Koltin 的数据类有什么用&#xff1f; 1. 变量声明方式不同 Koltin声明变量的方式与Java类似&#xff0c;但是顺序不太一样。 举例如下 J…

Mapbox添加model图层

贴个群号 WebGIS学习交流群461555818&#xff0c;欢迎大家 效果图 源码 经常关注mapbox的朋友会发现&#xff0c;3.0版本之后&#xff0c;mapbox的api里更新了一个model图层 但是呢&#xff0c;却没有提供model有关的api&#xff0c;让我们摸不着头脑&#xff0c;到底该如…

20个常用的Python脚本

以下是20个常用的Python脚本示例&#xff1a; 计算阶乘 def factorial(n):if n 0:return 1else:return n * factorial(n-1)print(factorial(5))斐波那契数列 def fibonacci(n):if n < 1:return nelse:return fibonacci(n-1) fibonacci(n-2)print(fibonacci(10))判断素数…

最新基于R语言lavaan结构方程模型(SEM)技术

原文链接&#xff1a;最新基于R语言lavaan结构方程模型&#xff08;SEM&#xff09;技术https://mp.weixin.qq.com/s?__bizMzUzNTczMDMxMg&mid2247596681&idx4&sn08753dd4d3e7bc492d750c0f06bba1b2&chksmfa823b6ecdf5b278ca0b94213391b5a222d1776743609cd3d14…

【C++庖丁解牛】模拟实现STL的string容器(最后附源码)

&#x1f4d9; 作者简介 &#xff1a;RO-BERRY &#x1f4d7; 学习方向&#xff1a;致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 &#x1f4d2; 日后方向 : 偏向于CPP开发以及大数据方向&#xff0c;欢迎各位关注&#xff0c;谢谢各位的支持 目录 1.vs和g下string结构…

librtmp交叉编译

目录 软件包下载 libopenssl编译 libz编译 librtmp编译 软件包下载 librtmp依赖openssl库和zlib库&#xff0c;注意openssl库版本需要为1.0&#xff0c;三个库下载地址如下&#xff1a; openssl:https://www.openssl.org/source/old/1.0.0/openssl-1.0.0s.tar.gz zlib:h…