数据分析概述2(详细介绍机器学习

目录

  • 1.名词解释:
      • 1.1算法和模型
      • 1.2参数和超参数
  • 2.基础算法:
  • 3.高级算法:
  • 4.数据准备
  • 5.常用python包
  • 小结:

1.名词解释:

1.1算法和模型

算法:用于训练模型的方法,分为有监督学习、无监督学习、半监督学习。
模型:模型是使用机器学习算法利用数据集训练出的结果,是算法的输出;数据集的不同,训练出来的模型也不同,这些模型的区别就在于参数取值不同。

1.2参数和超参数

参数可以分为算法参数(超参数)和模型参数(参数)
超参数:控制机器学习过程并确定最终学习得到的模型参数值的参数;超参数需要自己手动指定;例如:训练集和测试集的分割比例、优化算法中的学习率、聚类算法中的聚类数、多数算法中损失函数的选择、神经网络学习中激活函数的选择、神经网络中隐藏层数及迭代次数(epoch)等。
参数:训练出的结果;通常,同一个算法所训练出的模型的参数个数和类型是一致的,区别在于参数取值。

2.基础算法:

根据属性值是否为连续属性,将机器学习算法分为以下四类:

有监督学习无监督学习
连续型聚类(k-means/GMM/LVQ/DBSCAN/AGNES)降维(SVD/PCA)回归(线性回归/多项式回归/决策树与随机森林)
分类型关联规则分析(Apriori/FP-Growth)分类(KNN/逻辑回归/朴素贝叶斯/SVM/决策树与随机森林

3.高级算法:

在这里插入图片描述

集成学习(Ensemble Learning,EL):由于上述基本算法在实际应用中容易导致过拟合或欠拟合,在数据分析中一般采用基于多个学习器来共同完成同一个数据分析任务。
深度学习(Deep Learing,DL):人工智能、机器学习和深度学习是数据分析中常用技术和方法,其区别和联系如上图所示。机器学习是人工智能的组成部分之一,而深度学习是机器学习的一种方法。
增强学习(Reinforcement Learning,RL):又称强化学习主要研究的是如何协助自治 Agent 的学习活动,进而达到选择最优动作的目的强化学习是通过反馈的结果信息不断调整之前的策略,从而算法能够学习到在什么样的状态下选择什么样的动作可以获得最好的结果。增强学习中讨论的Agent 需要具备与环境的交互能力和自治能力,当Agent 在其环境中做出每个动作时,施教者会提供奖赏或惩罚信息,以表示结果状态的正确与否。通常,强化学习任务用马尔可夫决策过程描述。常用的强化学习算法有蒙特卡洛强化学习和 Q-Learning 算法。

4.数据准备

数据准备包括数据整合数据清洗 (数据标准化、数据标注、缺失值和异常值的处理)、数据转换数据集划分等步骤。机器学习的数据集分为训练集测试集验证集 3 种。也就是说,基于机器学习的数据分析工作需要将数据随机地拆分为 3 个子集——训练集、测试集和验证集。3 个子集的占比没有规定的比例,但训练集的占比应最大经验分配比例为7:1.5:1.5或9.5:0.25:0.25。
训练集(Training Set):用于模型训练;训练出模型。
测试集(Testing Set):用于模型评估;生成混淆矩阵,并计算精度召回率。从而判断模型是否存在过拟合欠拟合
验证集(Validation Set):用于算法选择和超参调整。

5.常用python包

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

小结:

关注我给大家分享更多有趣的知识,以下是个人公众号,提供 ||代码兼职|| ||代码问题求解||
由于本号流量还不足以发表推广,搜我的公众号即可:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/618855.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Logstash:迁移数据到 Elasticsearch

在生产环境中,不使用 Apache Kafka 等流平台进行数据迁移并不是一个好的做法。 在这篇文章中,我们将详细探讨 Apache Kafka 和 Logstash 的关系。 但首先让我们简单了解一下 Apache Kafka 的含义。 Apache Kafka 是分布式流平台,擅长实时数据…

anaconda创建虚拟环境启动jupyter notebook

1.进入虚拟环境 (以环境名为py37_pytorch1.9为例) 创建虚拟环境: conda create -n py37_pytorch1.9 python3.7 查看已经创建的虚拟环境: ​​​​​​​conda env list 切换/进入环境: conda activate py37_pytorch1.9 删除环…

C语言宏定义小技巧

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、定义一年多少秒(除闰年)举例运行结果出现的问题原因 二、定义整型数据要避免的坑举例运行结果原因解决方法 三 、未完待续 前言 提…

Fiddler怎么抓请求做接口

第一步:安装fiddler 可以在官网下载最新版本 VIP小伙伴可以在课前准备下载,如果已经安装,请忽略 打开fiddler开始抓取测试对象的请求,以教管系统登录为例 打开fiddler,准备开始抓取,清空会话,开启抓取状态,因为fiddler默认抓取http协议,所以这里不需要设置什么。 打开系统登…

通过 CMake 制作库文件 静态库 和 动态库

hehedalinux:~/Linux/loveDBTeacher-v2$ tree . ├── CMakeLists.txt ├── include │ └── head.h ├── main.c └── src├── add.c├── div.c├── mult.c└── sub.c CMake Calc 项目 在这里有add.c,div.c,mult.c,sub.c,main.c,head.h 二、生成静态库 …

【数据结构】二叉树问题总结

目录 1.二叉树前序遍历,中序遍历和后序的实现 2.层序遍历 3.求二叉树中的节点个数 4.求二叉树中的叶子节点个数 5.求二叉树的高度 6.求二叉树第k层节点个数 7.二叉树查找值为x的节点 8.单值二叉树 9.二叉树最大深度 10.翻转二叉树 11. 检查两颗树是否相同…

NetDevOps:华三交换机通过Netmiko或者Nornir获取接口信息通过TextFSM解析报错问题

python代码:实现功能获取交换机接口信息并通过TextFSM进行解析。 from netmiko import Netmiko import textfsm show_intf_cmd_mapping {hp_comware: display interface, }def ssh_device_2_get_intfs(device_type, host, username, password, port):dev_info {d…

【2023年度回顾】让我们在新的一年继续努力前行

每当我们在努力的时候都会想:为什么我要努力?躺着不舒服吗? 大家好!我是命运之光,一名普普通通的计算机科学与技术专业的大三学生。 📕回顾一下整个2023年 因为我有每天发朋友圈的习惯,所以这一…

chromedriver 114以后版本下载地址

谷歌浏览器版本经常会升级,chromedriver 也得下载匹配的版本 chromedriver 114以前版本下载地址https://registry.npmmirror.com/binary.html?pathchromedriver/ 找到匹配浏览器版本 查看自己浏览器版本号v120.0 v120.0版本chromedriver下载地址https://google…

Ubuntu 22.04 安装prometheus

服务器监控和报警软件有很多,为什么我们会选择Prometheus而不是其他软件呢? 因为它有以下优点: 自带简易web监控页面,用户可以很方便地查看监控数据和使用仪表盘。能实时收集数据并根据自定义警报规则推送告警;具有丰…

Java SPI在数据库驱动、SpringBoot自动装配中的应用

文章目录 1. 初识SPI1.1 SPI的作用1.2 SPI的工作原理1.3 SPI的三个组件:Service、Service Provider、ServiceLoader1.4 SPI使用场景1.5 具体的SPI 源码分析(SPI的核心就是ServiceLoader.load()方法)1.6 SPI 的优缺点 2. API、SPI、JNDI释义3.…

uniapp滑动页面切换和下拉刷新,触底加载更多(swiper + scroll-view)

因为官方文档乱七八糟的,所以自己来总结下 需求: 常见的上方tag标签切换,下方是页面,上面点击切换,下面页面也切换,下方列表有下拉刷新,触底加载更多 因为这两个组件都是固定高度的,…

6.2 声音编辑工具GoldWave5简介(6)

3.选择【选项】|【控制器属性】命名或单击“控制器”面板上的“设置控制器属性”按钮,打开“控制器属性”对话框,将“音量”选项卡中的“麦克风”选项打上勾,使GoldWave只能录制来自麦克风的声音。如果要录制电脑内部的声音&#…

聊天机器人之接收实时信息实现(二)

准备工作 如果没有准备好环境的请看 前期环境准备 这里默认已经注入成功并且已经登录好了账号。 具体实现 实现原理 通过本地搭建一个web服务,来接收一个POST请求,这个请求中就会涵盖实时的数据,包括昵称、消息内容、消息类型之类的。 p…

Head First Design Patterns -工厂模式

什么是工厂模式 工厂方法模式定义了一个创建对象的接口,但由子类来决定要实例化那个类。工厂方法让类把实例化推迟到了子类。 为什么要有工厂模式 书中以pizza店制作pizza为例子,假设不用工厂模式,在制作pizza阶段我们需要这样去实例化类&am…

回声状态网络(Echo State Networks,ESN)详细原理讲解及Python代码实现

回声状态网络(Echo State Networks,ESN)详细讲解及Python代码实现 1 基本概念 回声状态网络是一种循环神经网络。ESN 训练方式与传统 RNN 不同。网络结构如下图: (1)储层(Reservoir)&#x…

vue中使用js-doc

安装依赖 安装vue-template-compiler npm install ​vue-template-compiler​npm install ​vue-template-compiler​ 安装minami npm install minami 安装js-doc npm install js-doc 根目录下创建 .jsdoc.conf.json 内容: {"tags": {"all…

在Linux中创建文件的多种方法

目录 前言1 使用重定向符号 ">"2 使用文本编辑器 vi/vim3 使用 nano4 使用 echo5 使用 touch6 使用 printf7 使用 head8 使用 cat9 使用 tail10 使用 truncate结语 前言 在Linux系统中,文件的创建是日常操作中不可避免的一部分。无论是创建空文件、编…

解决MPICH的GPU初始化失败:一次深入探索

今天来分享“MPICH:MPII_Init_thread(222): gpu_init failed”这个问题的解决方式 文章目录 前言问题原因解决方案 前言 如果在安装MPICH的时候没有注意要一些选项,那么当使用mpicxx mpi_send.cpp -o send && mpirun -n 2 ./send进行编译输出的…

图片特效/增强GUI程序

程序下载地址:mendianyu/pictureConvert: 图片特效/增强GUI程序,借助百度接口实现人像动漫化,模糊图片变清晰等等功能 (github.com) 图片特效/增强GUI程序 借助百度接口实现人像动漫化,模糊图片变清晰等等功能 程序介绍 运行Ima…