数据分析概述

目录

  • 1.数据分析的基本类型:
  • 2.数据分析的实现方式:
  • 3.机器学习和统计学的区别:
    • 3.1统计学
    • 3.2机器学习
  • 小结:

1.数据分析的基本类型:

这就不得不提到Gartner分析学价值扶梯模型了,这个模型从复杂度和价值两个维度,将数据分析分为描述性分析(Descriptive Analytics)、诊断性分析(Diagnostic Analytics)、预测性分析(Predictive Analytics)和规范性分析(Prescriptive Analytics)
在这里插入图片描述
描述性分析:主要关注的是过去,回答“已发生了什么?”,用来揭示客观现象。
诊断性分析:主要关注的是过去,回答“为什么发生?”,用来揭示数据之间的因果关系。
预测性分析:主要关注的是未来,回答“将要发生什么”,属于预测性分析。
规范性分析:主要关注的是模拟与优化,回答“我们如何使它发生”,用来给出最优行动建议,产生产业价值。

2.数据分析的实现方式:

主要有3种:机器学习统计学数据可视化

3.机器学习和统计学的区别:

3.1统计学

统计学包括两种:
在这里插入图片描述
也就是说统计学需要事先对处理对象的概率分布做出假定(比如正态分布),而机器学习不需要做事先假定。
统计学通过各种统计指标(比如R方、置信区间)来评估统计模型(比如线性回归模型)的拟合优度,而机器学习通过交叉验证或划分训练集和测试集的方法来评估算法的准确度。

统计学中的描述统计常用的指标有:
在这里插入图片描述
统计学中的推断统计(利用样本数据来推断总体特征)常用的理论有:
参数估计(点估计、区间估计)
假设检验(置信度)

3.2机器学习

基于机器学习的数据分析主要分为两个阶段:

  1. 建模阶段:基于已知数据集(x, y)算法,学习出一个具体的分析模型
  2. 模型应用阶段:将新样本的特征(x new) 作为分析模型的输入,通过模型计算出对应的目标值(y predicted)

机器学习算法分为:

  1. 有监督学习:所有示例均有标签数据(包括最近邻、朴素贝叶斯、决策树、随机森林、线性回归、支持向量机、神经网络)
  2. 无监督学习:所有示例均无标签数据(k-means聚类、主成分分析、关联规则分析)
  3. 半监督学习:部分示例带有标签信息;部分示例不带标签信息(半监督分类方法、半监督回归方法、半监督聚类方法、半监督降维方法)

小结:

关注我给大家分享更多有趣的知识,以下是个人公众号,提供 ||代码兼职|| ||代码问题求解||
由于本号流量还不足以发表推广,搜我的公众号即可:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/603950.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

端口开放问题

端口开放问题 所遇问题 在宿主主机上可以ping通虚拟机ip192.168.27.129,但无法在宿主主机上访问http://192.168.27.129:8080navavcat 16连接mysql时,2002 - Can’t connect to server on ‘192.168.27.129’(100601) 原因 以上两个问题&a…

树莓派4B使用ncnn部署yolov5-Lite,推理耗时 247ms 包含前后处理

一. 引言 最近在玩树莓派,想在树莓派上不是一个目标检测算法,大致看了一下,目前开源的大家都在使用yolov5-Lite,使用ncnn去推理加速,于是自己也尝试部署,在此记录一下,个人踩的坑。 二. 版本选…

Matlab三维绘图

绘制三维图plot3 t0:pi/50:10*pi; xsin(t); ycos(t); zt; plot3(x,y,z); 产生栅格数据点meshgrid 这个接口在绘制三维图像里面相当重要,很多时候要将向量变成矩阵才能绘制三维图。 x0:0.5:5; y0:1:10; [X,Y]meshgrid(x,y); plot(X,Y,o); x和y是向量,…

极值和平均值-第11届蓝桥杯选拔赛Python真题精选

[导读]:超平老师的Scratch蓝桥杯真题解读系列在推出之后,受到了广大老师和家长的好评,非常感谢各位的认可和厚爱。作为回馈,超平老师计划推出《Python蓝桥杯真题解析100讲》,这是解读系列的第22讲。 极值和平均值&…

GO语言笔记1-安装与hello world

SDK开发工具包下载 Go语言官网地址:golang.org,无法访问Golang中文社区:首页 - Go语言中文网 - Golang中文社区下载地址:Go下载 - Go语言中文网 - Golang中文社区 尽量去下载稳定版本,根据使用系统下载压缩包格式的安装…

【算法】 dp题单练习(寒假正在更新中)

题单链接: https://vjudge.net/contest/574209#overview 目录 1. 洛谷 P1020 导弹拦截 (dp二分Dilworth 定理) 2. 洛谷 P1439 最长公共子序列(二分求最长公共子序列) 3. 洛谷 P1854 花店橱窗布置 (线…

Illegal hex characters in escape (%) pattern

java.lang.NullPointerException 原因是关键字:5%葡萄糖注射液 其中的百分号通过HttpServletRequest的getParameter传到后端提示空指针异常,然后使用url格式,百分号的十六进制是%25(百分号加25) 在js代码中加入一段正…

Mybatis实现增删改查的两种方式-配置文件/注解

环境准备 1.数据库表tb_brand -- 删除tb_brand表 drop table if exists tb_brand; -- 创建tb_brand表 create table tb_brand(-- id 主键id int primary key auto_increment,-- 品牌名称brand_name varchar(20),-- 企业名称company_name varchar(20),-- 排序字段ordered int…

【SpringCloud Alibaba笔记】(2)Sentinel实现熔断与限流

Sentinel 概述 官网:https://github.com/alibaba/Sentinel 中文文档:https://sentinelguard.io/zh-cn/docs/introduction.html 类似Hystrix,以流量为切入点,从流量路由、流量控制、流量整形、熔断降级、系统自适应过载保护、热…

spdlog源码学习

前言 spdlog是一个跨平台c 的开源日志库 ,可以head only 使用,包含部分modern c 语法, 更是兼容了c20 format,支持异步和格式化输出,通俗易懂,适合阅读。 源码下载 here 用法 直接贴上了 example.cpp …

四种方式实现[选择性注入SpringBoot接口的多实现类]

最近在项目中遇到两种情况,准备写个博客记录一下。 情况说明:Service层一个接口是否可以存在多个具体实现,此时应该如何调用Service(的具体实现)? 其实之前的项目中也遇到过这种情况,只不过我采…

嵌入式培训机构四个月实训课程笔记(完整版)-Linux系统编程第二天-Linux开发板外设开发(物联技术666)

更多配套资料CSDN地址:点赞+关注,功德无量。更多配套资料,欢迎私信。 物联技术666_嵌入式C语言开发,嵌入式硬件,嵌入式培训笔记-CSDN博客物联技术666擅长嵌入式C语言开发,嵌入式硬件,嵌入式培训笔记,等方面的知识,物联技术666关注机器学习,arm开发,物联网,嵌入式硬件,单片机…

操作系统课程设计——文件管理系统(C语言版)

操作系统系列文章 http://t.csdnimg.cn/7XAnU 文章目录 实验一、进程的创建与撤销:http://t.csdnimg.cn/po4V0 实验二、银行家算法:http://t.csdnimg.cn/O5zoF 目录 操作系统系列文章 文章目录 文件管理 一、目的 二、设计内容 三、 设计要求 …

Excel·VBA按指定顺序排序函数

与之前写过的《ExcelVBA数组冒泡排序函数》不同,不是按照数值大小的升序/降序对数组进行排序,而是按照指定数组的顺序,对另一个数组进行排序 以下代码调用了《ExcelVBA数组冒泡排序函数》bubble_sort_arr函数(如需使用代码需复制…

如何在群晖7.2中运行WPS Office镜像容器并使用固定地址公网访问

文章目录 1. 拉取WPS Office镜像2. 运行WPS Office镜像容器3. 本地访问WPS Office4. 群晖安装Cpolar5. 配置WPS Office远程地址6. 远程访问WPS Office小结 7. 固定公网地址 wps-office是一个在Linux服务器上部署WPS Office的镜像。它基于WPS Office的Linux版本,通过…

LaTeX矩阵

在 LaTeX 中输入矩阵以及矩阵中增加公式。 LATEX 中 array 环境可以定义二维数组,具体需要定义列数,并用 \\ 换行,数组可作为一个公式块,在外套用 \left、\right 等定界符。 \mathbf{X} \left(\begin{array}{cccc}x_{11} &…

【AI】什么是大模型的偏见

目录 一、什么是大模型的偏见 二、偏见的危害 三、普通人可以做的一些偏见测试用例 1. 性别偏见测试: 2. 种族和民族偏见测试: 3. 职业偏见测试: 4. 年龄偏见测试: 5. 社会经济地位偏见测试: 6. 身体能力偏见…

Leetcode 3002. Maximum Size of a Set After Removals

Leetcode 3002. Maximum Size of a Set After Removals 1. 解题思路2. 代码实现3. 算法优化 题目链接:10037. Maximum Size of a Set After Removals 1. 解题思路 这一题的话我的思路就是分别以两个数组作为主数组,然后从中选择 n / 2 n/2 n/2个元素&…

接口限流方案

1.1 为什么要进行限流? 1.瞬时流量过高,服务被压垮? 2.恶意用户高频光顾,导致服务器宕机? 3.消息消费过快,导致数据库压力过大,性能下降甚至崩溃? 1.2 什么是限流 限流是对某一…

Zuul相关问题及到案(2024)

1、什么是Zuul?它在微服务架构中有什么作用? Zuul是Netflix开源的一种提供API网关服务的应用程序,它在微服务架构中扮演着流量的前门角色。主要功能包括以下几点: 路由转发:Zuul网关将外部请求转发到具体的微服务实例…