CDA二级(Level II)数据分析师——考试内容梳理二

逻辑回归:Ln(P/(1-P)=-3+0.06X+0.05X2-0.02X3X1

岭回归扰动性越大,模型越不容易受到共线性的影响

LOSSO只是缓解了由于共线性导致的估计误差的问题,而不是解决共线性

AUC值接近0.5时,我们认为这个模型是无效的

T检验不可以用来检验待分析的原有若干变量是否适合做因子分析

因子旋转最大方差旋转是一种正交旋转

因子分析得到的因子是有较强的解释性

因子分析通常通过调整主成分在原始变量的权重来发现主成分所代表的含义;

主成分分析中,若使用特征值分解法,其在代数上将原随机向量的协方差阵换成对接方阵;

单因素分析中,组内误差和反映的是随机因素的影响;

置信区间用以评价估计的可靠性

单个正太总体方差检验选择的统计量是卡方检验

事中验证交叉验证

标签是一种用来描述业务实体特征的·数据形式·;

数据仓库面向主题、的,而不是属性

数据完整性约束的规则是:实体完整性、参照完整性、用户定义完整性

五问法的发问角度包括:制造、检验、体系

根因分析问题原因头脑风暴包括:是一种非矩阵、名义群组技术、配对比较

残差图中模型方差齐性假设满足:残差不应随因变量拟合值的增大而变化

趋势分解法中,时间序列的成分与观测值的关系:加法、乘法模型没有减法模型

按照远近程度聚类需明确两个距离:欧式距离、兰氏距离

线性回归的估计方法是最小二乘法

逻辑回归的估计方法是最大似然估计

神经网络比逻辑回归更容易过拟合;

条形图不能检测异常值;

属于数据标准化的方法有:Z-score标准化、区间缩放、向量单位化

时间序列数据:某一个个体随时间变化产生的数据;

截面数据:许多个个体在同一个时间下由于个体不同而产生的数据;

面板数据:许多个个体,由于个体不同以及时间棉花而缠身的数据;

移动平均模型MA(q):自相关(ACF)q阶截尾,偏自相关(PACF)拖尾; 平稳
自回归模型AR§’:自相关拖尾,偏自相关截尾; 平稳

自回归移动平均模型ARMA(p,q):自相关系数拖尾,偏自相关系数拖尾; 平稳
ARIMA(p,d,q):自相关截尾,偏自相关拖尾; 非平稳

案例: 40% 30% 30%
0.2 0.6 0.2 线下店长预测未来一个月销量:24000.2+16000.6+10000.2=1640 最可能销量加权值:15000.4+18000.3+16000.3=1620
综合三人判断,预测年度销量:1640+18000.3+16400.3=1648*12=19776
信度为预测3中场景销量,这组数据的标准差的倒数(n-1)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/29263.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ARM32开发--FreeRTOS-事件组

系列文章目录 知不足而奋进 望远山而前行 目录 系列文章目录 文章目录 前言 目标 内容 概念 事件标志位 开发流程 功能介绍 创建事件组 触发事件 等待事件触发 同步 清理事件 案例 总结 前言 在嵌入式系统开发中,任务之间的同步和通信是至关重要的…

智慧矿山项目建设整体解决方案(938页 )

智慧矿山,究竟是什么? 在深入探讨之前,让我们先来提出一个深刻的问题:我们能否借助科技的力量,让矿山作业不仅安全、高效,还能做到环保可持续?答案是肯定的。智慧矿山,正是这一理念…

支撑每秒 600 万订单无压力,SpringBoot + Disruptor 太猛了!

一、背景 工作中遇到项目使用Disruptor做消息队列,对你没看错,不是Kafka,也不是rabbitmq;Disruptor有个最大的优点就是快,还有一点它是开源的哦,下面做个简单的记录. 二、Disruptor介绍 Disruptor 是英国外汇交易公司LMAX开发的一个高性能队列,研发的初衷是解决内存…

【postgresql初级使用】条件表达式触发器,兼顾DML执行性能,又能执行复杂逻辑,只在结帐时计算总帐

条件触发器 ​专栏内容: postgresql使用入门基础手写数据库toadb并发编程 个人主页:我的主页 管理社区:开源数据库 座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物. 文章目录 条件触发器概…

【docker入门】

在软件开发过程中,环境配置是一个至关重要的步骤,它不仅影响开发效率,也直接关联到软件的最终质量。正确的环境配置可以极大地减少开发中的潜在问题,提升软件发布的流畅度和稳定性。以下是几个关键方面,以及如何优化环…

【机器学习】第6章 支持向量机(SVM)

一、概念 1.支持向量机(support vector machine,SVM): (1)基于统计学理论的监督学习方法,但不属于生成式模型,而是判别式模型。 (2)支持向量机在各个领域内的…

如何在不丢失数据的情况下解锁安卓手机密码

手机是我们生活中必不可少的工具,可以帮助我们与朋友和家人保持联系,了解最新消息,甚至经营我们的业务。然而,当我们在 Android 手机或 iPhone 上设置密码时,我们经常会忘记密码,或者根本没有设置密码。当这…

IntelliJ IDEA 使用 Maven 时不加载本地私服的最新版本快照(snapshot)JAR 包

IntelliJ IDEA 使用 Maven 时不加载本地私服的最新版本快照(snapshot)JAR 包 目录 IntelliJ IDEA 使用 Maven 时不加载本地私服的最新版本快照(snapshot)JAR 包1. 检查 settings.xml2. IDEA Maven 配置3. 强制更新 Snapshot4. 使用…

学习笔记——路由网络基础——路由度量值

3、路由度量值 (1)基本概念 路由度量值表示到达这条路由所指目的地址的代价。度量值数值越小越优先,度量值最小路由将会被添加到路由表中。度量值很多时候被称为开销(Cost)。 路由度量(路由开销 cost)对于同一个路由协议,当到达某目标网段有多条路由供…

SQL Server入门-安装和测试(2008R2版)

环境:win10,SQL Server 2008 R2 因为工作需要用到SQL Server(而且要用2008R2版),完全不熟,所以来学习学习。 SQL Server是微软开发的关系型数据库,支持SQL。同时还有微软还开发了自己的T-SQL&am…

Fontconfig head is null, check your fonts or fonts configuration问题解决

报错信息: Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception [R equest processing failed: com.alibaba.excel.exception.ExcelGenerateException: java.lang.InternalError: java.lang.reflect.InvocationTargetExcep…

11 类型泛化

11 类型泛化 1、函数模版1.1 前言1.2 函数模版1.3 隐式推断类型实参1.4 函数模板重载1.5 函数模板类型形参的默认类型(C11标准) 2、类模版2.1 类模板的成员函数延迟实例化2.2 类模板的静态成员2.3 类模板的递归实例化2.4 类模板类型形参缺省值 3、类模板…

小鹏汽车2025冲刺类L4智驾,挑战与机遇并存

随着科技的飞速发展,智能驾驶已成为汽车行业的前沿领域。近日,小鹏汽车在AI DAY上宣布国内首个量产上车的端到端大模型,这一创新举措无疑为智能驾驶的发展注入了新的活力。然而,在迈向2025年实现类L4级智能驾驶的道路上&#xff0…

大前端 业务架构 插件库 设计模式 属性 线程

大前端 业务架构 插件库 适配模式之(多态)协议1对多 抽象工厂模式 观察者模式 外观模式 装饰模式之参考catagory 策略模式 属性

橡胶油封的用途是什么?

橡胶油封的用途是什么? 在机械工程和设备维护领域,橡胶油封发挥着至关重要的作用,确保各部件的耐用性和效率。那么,橡胶油封的具体用途是什么呢?本文将从多角度探讨橡胶油封的应用和优势,突出其在各个工业和汽车领域中的重要性…

QT 中文乱码 以及 tr 的使用

一、关于显示中文 1、网上常规的做法 - 第一步:代码文件选择用utf8编码带bom。QT Creator 文本编辑 行为配置里可以配置 - 第二步:在有中文汉字的代码文件顶部加一行(一般是cpp文件) #pragma execution_character_set("utf-…

服务器新硬盘分区、格式化和挂载

文章目录 参考文献查看了一下起点现状分区(base) ~ sudo parted /dev/sdcmklabel gpt(设置分区类型)增加分区 格式化需要先退出quit(可以)(base) / sudo mkfs.xfs /dev/sdc/sdc1(失败)sudo mkfs.xfs /dev/s…

通过nginx转发后应用偶发502bad gateway

序言 学习了一些东西,如何才是真正自己能用的呢?好像就是看自己的潜意识的反应,例如解决了一个问题,那么下次再碰到类似的问题,能直接下意识的去找到对应的信息,从而解决,而不是和第一次碰到一样…

softmax的数值溢出问题

softmax是deep learning常用的一个操作,虽然有很多现成的包可以调,但在某些场景下需要自己实现。本文简单探讨一下softmax可能会出现的数值稳定性问题 解决上溢出问题 Softmax ( x i ) exp ⁡ ( x i ) ∑ j 1 N exp ⁡ ( x j ) exp ⁡ ( x i ) / exp…

CRC循环冗余校验

CRC循环冗余校验 循环冗余校验码是一种用在数字网络和存储设备上的差错校验码,可以校验原始数据的偶然差 错。 CRC 计算单元使用固定多项式计算 32 位 CRC 校验码。 1. 硬件CRC 在单片机中,芯片具有专用的CRC计算单元,它是按照32位数据长…