AI大模型学习笔记之五:监督学习--数据如何驱动决策

监督学习,又称为监督式机器学习,是机器学习和人工智能领域的一个重要分支。

其基本原理是利用带有标签的数据集来训练算法,以实现精确分类数据或预测结果的目标。

在监督学习中,通过将数据输入模型,并不断调整数据权重,直至模型与实际数据拟合良好,这也是交叉验证的一部分。

监督学习技术可应用于解决各种现实世界的问题,比如将垃圾邮件分类至收件箱的特定文件夹中。

监督学习
一、什么是监督学习?

监督学习之所以被称为“监督”,是因为在训练过程中,模型的学习是在一个“监督者”的指导下进行的,这个监督者就是提供标签(或答案)的数据源。

这个“标签”通常是由人工标记的。在监督学习中,训练数据集包含了输入数据和对应的输出标签(也称为“标记”或“答案”),这些标签是人们根据自己的知识或经验为每个输入样本提供的。训练过程中,模型通过学习输入与输出之间的关系,来尝试预测新的未见过的输入数据的输出标签。

监督体现在以下几个方面:

监督学习的体现

  1. 提供标签:在监督学习中,训练数据包含输入特征和对应的输出标签。这些标签是指导模型学习和判断对错的关键,因为模型的目标是学会根据输入的数据来预测正确的输出。

  2. 衡量性能:监督学习中通常会使用一个衡量标准(如损失函数)来评估模型的预测与真实标签之间的差异。通过这种衡量,可以及时发现模型的预测偏差,并对模型进行调整。

  3. 调整模型:监督学习中,监督者还可以根据模型的表现来调整模型的结构或超参数,以提高模型的性能,让模型逐渐逼近真实标签。

训练过程中,模型通过学习输入与输出之间的关系,来尝试预测新的未见过的输入数据的输出标签。

这种监督使得模型能够在学习过程中逐渐优化自身,以更准确地进行预测。

二、监督学习工作原理

监督学习利用训练集来训练模型,以产生预期的输出。

这个训练集包含了输入数据以及它们对应的正确输出,这些标签是由人工标注的。

模型通过学习输入和输出之间的关系,逐渐提高其预测准确性。

在训练过程中,模型使用损失函数来衡量其预测输出与真实输出之间的差异,并不断调整模型参数,以最小化这种差异。这个过程持续进行,直到模型的预测误差被充分地最小化。

监督学习分为两种主要类型:

  1. 分类(Classification):在分类问题中,算法的目标是预测输入数据属于哪个类别或标签。输出通常是离散的,代表不同的类别。例如,给定一张图片,预测该图片中包含的物体是猫还是狗。

分类分析应用

  1. 回归(Regression):在回归问题中,算法的目标是预测连续值的输出。输出通常是一个实数值或向量。例如,根据房屋的特征(如面积、位置、卧室数量等),预测该房屋的销售价格。

回归分析应用

三、常用的监督学习算法

在监督学习中,通常使用各种算法和计算方法来训练模型。常用的监督学习算法有以下一些,可以使用R或Python等编程语言进行计算:

  1. 神经网络:神经网络是一种基于人工神经元网络结构的深度学习模型。它由多个层次组成,包括输入层、隐藏层和输出层,每个神经元都与下一层的所有神经元相连。在训练过程中,神经网络通过反向传播算法来更新权重,以最小化损失函数。它在图像识别、语音识别、自然语言处理等领域取得了很大的成功。

神经网络

  1. 朴素贝叶斯:朴素贝叶斯是一种基于贝叶斯定理和特征独立性假设的分类算法。它假设每个特征都是独立的,然后通过计算每个类别的后验概率来进行分类。朴素贝叶斯算法简单、高效,特别适用于文本分类、垃圾邮件识别和推荐系统等应用。

朴素贝叶斯分类算法

  1. 线性回归:线性回归用于建立因变量与一个或多个自变量之间的线性关系。它通过拟合最佳拟合线来预测连续性因变量的值。在简单线性回归中,只有一个自变量和一个因变量,而在多元线性回归中,可以有多个自变量。线性回归通过最小化残差平方和来找到最佳拟合线。

线性回归

  1. 逻辑回归:逻辑回归用于解决二元分类问题,例如判断邮件是否为垃圾邮件。它通过将线性回归模型的输出映射到一个逻辑函数(如sigmoid函数),以产生0到1之间的概率值,从而进行分类。

逻辑回归

  1. 支持向量机 (SVM):支持向量机是一种用于分类和回归的监督学习模型。它的目标是找到一个最大间隔超平面,将不同类别的数据点分开。SVM通过核函数将数据映射到高维空间,以便在更复杂的数据结构中找到最佳的超平面。

支持向量机 (SVM)

  1. K近邻算法:K近邻算法是一种基于实例的学习方法,它假设相似的数据点具有相似的标签。在分类问题中,它根据输入样本的最近邻居来预测其标签。K近邻算法简单易用,但对于大型数据集的处理速度较慢。

K近邻算法

  1. 随机森林:随机森林是一种集成学习算法,由多个决策树组成。每个决策树都是通过随机抽样和随机特征选择训练而成的。随机森林通过投票或平均值来产生最终的分类结果或回归预测,具有较强的泛化能力和抗过拟合能力。

随机森林

这些算法在监督学习中起着重要作用,可以根据问题的特性和数据的特点选择合适的算法进行建模和预测。

四、监督学习的工作流程

监督学习的工作流程

监督学习的工作流程一般分为以下九个步骤:

  1. 收集数据集
    • 确定任务:首先确定需要解决的任务,例如分类、回归或其他问题。
    • 收集数据:根据任务收集数据,确保数据包含足够的样本和特征,以支持模型的训练和预测。
    • 数据探索:对收集的数据进行初步探索,了解数据的特点、分布和缺失值情况。

01-收集数据集

  1. 数据预处理
    • 清洗数据:处理异常值、重复值和错误数据,确保数据的准确性和一致性。
    • 处理缺失值:填充或删除缺失值,以确保数据的完整性。
    • 特征工程:选择合适的特征,对特征进行转换、组合或生成新特征,以提高模型的性能。
    • 数据标准化:对数据进行标准化或归一化,以确保不同特征具有相似的尺度和范围。

02-数据预处理

  1. 划分数据集
    • 划分比例:将数据集按照一定比例划分为训练集、验证集和测试集,通常按照70-80%的训练集、10-15%的验证集和10-15%的测试集进行划分。
    • 随机化:确保数据集的划分是随机的,避免数据的偏斜或过拟合。

03-划分数据集

  1. 选择模型
    • 确定模型类型:根据任务的性质和数据的特点,选择适当的监督学习模型,例如分类模型、回归模型或其他类型的模型。
    • 模型调优:根据任务的需求和性能指标,选择合适的模型超参数和配置。

04-选择模型

  1. 训练模型
    • 模型初始化:初始化模型参数,准备进行训练。
    • 损失计算:使用训练集数据计算损失函数,衡量模型预测值与真实值之间的差异。
    • 参数更新:使用优化算法(如梯度下降)更新模型参数,以最小化损失函数。
    • 迭代训练:重复以上步骤,直到达到停止训练的条件(如达到最大迭代次数或达到收敛)。

05-训练模型

  1. 验证模型
    • 模型评估:使用验证集评估模型的性能,通常使用指标如准确率、精确率、召回率、F1 值等来衡量模型的表现。
    • 超参数调优:根据验证集的评估结果调整模型的超参数,以提高模型的性能和泛化能力。

06-验证模型

  1. 模型评估
    • 测试集评估:使用测试集评估模型的泛化能力和预测性能,确保模型在未见数据上的表现。
    • 结果解释:分析模型的预测结果,理解模型对数据的学习和推理能力。

07-模型评估

  1. 模型部署
    • 模型集成:将训练好的模型集成到实际应用中,例如将模型部署到Web服务、移动应用或嵌入式系统中。
    • 性能监控:持续监控模型在实际应用中的性能,跟踪模型的预测准确度和响应时间。

08-模型部署

  1. 监控和更新
    • 模型更新:定期更新模型,以适应新的数据和情况。这可能涉及重新训练模型或调整模型参数。
    • 反馈循环:根据实际应用中收集到的反馈和数据,优化模型的性能和预测能力。

09-监控和更新

以上这些步骤构成了监督学习的完整工作流程,在实际应用中还需要综合考虑数据、模型和任务的特点,不断迭代和优化以获得最佳的结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/686831.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件工程师,为什么不喜欢关电脑

概述 你是否注意到,软件工程师们似乎从不关电脑,也不喜欢关电脑?别以为他们是电脑“上瘾”,或是沉迷于电脑,这一现象背后蕴含着多种实际原因。 1、代码保存与恢复。 在编写代码过程中,遇到问题时可能会暂时…

【JavaScript】面试手写题精讲之数组(下)

引入 这章主要讲的是数组的排序篇,我们知道面试的时候,数组的排序是经常出现的题目。所以这块还是有必要进行一下讲解的。笔者观察了下前端这块的常用算法排序题,大概可以分为如下 冒泡排–> 稳定排序插入排序–> 稳定排序选择排序–…

Swing程序设计(10)列表框,文本框,文本域,密码框

文章目录 前言一、列表框二、文本框(域) 1.文本框2.文本域三、密码框总结 前言 该篇文章简单介绍了Java中Swing组件里的列表框、文本框、密码框。 一、列表框 列表框(JList)相比下拉框,自身只是在窗体上占据固定的大小…

【探索Linux】—— 强大的命令行工具 P.22(POSIX信号量)

阅读导航 引言一、POSIX信号量的基本概念二、信号量的相关操作1 . 初始化信号量sem_init ( )(1)原型(2)参数(3)返回值(4)示例代码 2 . 等待信号量(1)sem_wait…

高程 | 类与对象(c++)

文章目录 📚面向对象程序设计的基本特点🐇抽象——概括问题,抽出公共性质并加以描述。🐇封装——将抽象所得数据和行为相结合,形成一个有机的整体,形成“类”。🐇继承——在原有类特性的基础上&…

Python爬虫学习

1.1搭建爬虫程序开发环境 爬取未来七天天气预报 from bs4 import BeautifulSoup from bs4 import UnicodeDammit import urllib.request url"http://www.weather.com.cn/weather/101120901.shtml" try:headers{"User-Agent":"Mozilla/5.0 (Windows …

51_蓝桥杯_蜂鸣器与继电器

一 电路 二 蜂鸣器与继电器工作原理 2.1蜂鸣器与继电器 2.2 十六进制与二进制 二进制 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 十六进制 0 1 2 3 4 5 6 7 8 9 A B C D E F 2.3非门 二 代码 …

Java Lambda表达式:简化编程,提高效率

Java Lambda表达式:简化编程,提高效率 1. 使用Lambda表达式进行集合遍历1.1 未使用Lambda表达式:1.2 使用Lambda表达式: 2. 使用Lambda表达式进行排序2.1 未使用Lambda表达式:2.2 使用Lambda表达式: 3. 使用…

精通C语言:打造高效便捷的通讯录管理系统

✨✨ 欢迎大家来到贝蒂大讲堂✨✨ 🎈🎈养成好习惯,先赞后看哦~🎈🎈 所属专栏:C语言项目 贝蒂的主页:Betty‘s blog 引言 在我们大致学习完C语言之后,我们就可以利用目前所学的知识去…

HCIA-HarmonyOS设备开发认证V2.0-内核扩展组件

目录 一、CPU 占用率1.1、CPU 占用率基本概念1.2、CPU 占用率运行机制1.3、CPU 占用率开发流程 二、动态加载2.1、 动态加载基本概念2.2、动态加载运行机制 坚持就有收获 一、CPU 占用率 1.1、CPU 占用率基本概念 CPU(中央处理器,Central Processing U…

第三节作业:基于 InternLM 和 LangChain 搭建你的知识库

参考文档:https://github.com/InternLM/tutorial/tree/main/langchain 基础作业:复现课程知识库助手搭建过程 (截图) 1.环境配置 2.知识库搭建 (1)数据收集 收集由上海人工智能实验室开源的一系列大模型工具开源仓库作为语料库来…

单html页面使用Vue3和Element-Plus

快速入门&#xff08;直接整案例&#xff0c;看显示效果&#xff09; 使用CDN方式引入Vue3使用CDN方式引入Element-Plus的样式文件和组件库 案例1&#xff08;按钮&#xff0c;表格&#xff09; <!DOCTYPE html> <html lang"en"> <head><meta …

人工智能时代

一、人工智能发展历史:从概念到现实 人工智能(Artificial Intelligence,简称AI)是计算机科学领域中一门旨在构建能够执行人类智能任务的系统的分支。其发展历程充满曲折,从概念的提出到如今的广泛应用,是技术、理论和实践相互交织的产物。 1. 起源(20世纪中期) 人工智…

对称密钥密码体制、公钥密码体制

1 对称密钥密码体制 加密密钥与解密密钥都使用相同密钥的密码体制。 数据加密标准 DES DES 属于对称密钥密码体制&#xff0c;是一种分组密码。 在加密前&#xff0c;先对整个明文进行分组。每一个组长为 64 位。 然后对每一个 64 位 二进制数据进行加密处理&#xff0c;…

云计算基础-华为存储实验

存储配置流程 创建硬盘域&#xff08;CK&#xff0c;包括热备CK&#xff09;创建存储池&#xff08;CKG、Extent&#xff09;创建LUN、LUN组、将LUN加入LUN组创建主机、主机组、将主机加入主机组创建映射视图&#xff08;LUN组和主机组的映射&#xff09; 1. 创建CK 创建硬盘…

【数据结构】二叉查找树和平衡二叉树,以及二者的区别

目录 1、二叉查找树 1.1、定义 1.2、查找二叉树的优点 1.2、查找二叉树的弊端 2、平衡二叉树 2.1、定义 2.2、 实现树结构平衡的方法&#xff08;旋转机制&#xff09; 2.2.1、左旋 2.2.2、右旋 3、总结 1、二叉查找树 二叉查找树又名二叉排序树&#xff0c;亦称二叉搜…

究极小白如何自己搭建一个自动发卡网站-独角数卡

本人从来没接触过建站&#xff0c;我之前都是在TB上花90叫别人给我搭建的网站&#xff0c;前几天这个TB店倒闭跑路了&#xff0c;而我的发卡网也打不开了&#xff0c;没办法&#xff0c;逼上梁山&#xff0c;自己捣鼓出来了&#xff01;下面是2023/4/2自己建好的&#xff01; …

租用一个服务器需要多少钱?2024阿里云新版报价

2024年最新阿里云服务器租用费用优惠价格表&#xff0c;轻量2核2G3M带宽轻量服务器一年61元&#xff0c;折合5元1个月&#xff0c;新老用户同享99元一年服务器&#xff0c;2核4G5M服务器ECS优惠价199元一年&#xff0c;2核4G4M轻量服务器165元一年&#xff0c;2核4G服务器30元3…

网络安全问题概述

1 计算机网络面临的安全性威胁 两大类威胁&#xff1a;被动攻击和主动攻击。 被动攻击 指攻击者从网络上窃听他人的通信内容。 通常把这类攻击称为截获。 攻击者只是观察和分析某一个协议数据单元 PDU&#xff0c;以便了解所交换的数据的某种性质&#xff0c;但不干扰信息…

AI Infra论文阅读之LIGHTSEQ(LLM长文本训练的Infra工作)

感觉这篇paper有几个亮点&#xff0c;首先把Megatron-LM的Self-Attention模块的模型并行方式变成序列并行&#xff0c;优化了通信量&#xff0c;同时通过计算和通信重叠近一步压缩了训练迭代时间。另外&#xff0c;在使用重计算的时候发现当前Huggingface/Megatron-LM的重计算策…