【机器学习】四大类监督学习_模型选择与模型原理和场景应用_第03课

监督学习中模型选择原理及场景应用

监督学习应用场景

在这里插入图片描述

  1. 文本分类场景:
    o 邮件过滤:训练模型识别垃圾邮件和非垃圾邮件。
    o 情感分析:根据评论或社交媒体内容的情感倾向将其分类为正面、负面或中性评价。
    o 新闻分类:将新闻文章自动分类到预定义的类别(如体育、科技、娱乐等)。
  2. 图像识别与分类场景:
    o 图像物体识别:使用标注好的数据集训练模型,使其能够识别图片中的特定对象,例如猫、狗、汽车等。
    o 医学影像诊断:在医疗领域,对X光片、CT扫描或MRI图像进行分类以判断是否存在某种疾病。
    o 车牌识别:通过摄像头捕获的车牌图像,训练模型识别车牌号码并进行分类。
  3. 生物医学应用场景:
    o 基因序列分类:预测DNA或蛋白质序列的功能属性或结构类型。
    o 疾病诊断:基于患者的生理指标、基因表达数据等特征,预测患者是否患有某种疾病。
  4. 金融风控场景:
    o 信贷风险评估:通过对用户提交的贷款申请信息进行分类,判断用户的信用等级或违约可能性。
  5. 用户推荐系统场景:
    o 用户行为分类:基于用户历史行为数据,将用户分类为不同的群体,以便推送个性化推荐内容。
  6. 语音识别场景:
    o 语音命令分类:将音频片段转换为文字指令,并进一步分类为不同的操作命令。
  7. 社交网络分析场景:
    o 用户兴趣分类:通过分析用户在社交平台上的活动,对其兴趣爱好进行分类,以便推送相关广告或内容。
    这些场景下的分类任务都是通过构建一个基于标签数据训练出的模型来完成的,模型可以基于统计学习理论、神经网络或其他机器学习算法。
    为分类问题选择特定合适的算法,就像如何选择一双适合脚的鞋一样,我们需要知道脚的大小,和脚穿什么鞋会感到舒服,这时需要我们来理解算法,以下是一些算法的原理:
    监督学习中对模型进行2个大类划分,一个是分类 (Classification)模型,另一个是回归(Regression)模型:
    • 分类模型:如逻辑回归(Logistic Regression, LR)、支持向量机(Support Vector Machines, SVM)、朴素贝叶斯(Naive Bayes)、决策树(Decision Trees)、随机森林(Random Forest)、K近邻(K-Nearest Neighbors, KNN)、神经网络(Artificial Neural Networks, ANNs)等。
    • 回归模型:线性回归(Linear Regression)、多项式回归(Polynomial Regression)、岭回归(Ridge Regression)、拉索回归(Lasso Regression)、Elastic Net回归等。

算法种类与原理

在这里插入图片描述

逻辑回归(Logistic Regression)算法
o 核心数学公式:逻辑回归使用sigmoid函数将线性组合映射到(0,1)区间内,从而得到一个概率值。最终通过设定阈值进行类别预测。
o 预测公式:( P(Y=1|X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1X_1 + \cdots + \beta_pX_p)}} )
o 损失函数(最大似然估计): 交叉熵损失函数 ( J(\theta) = -\sum_{i=1}^{n} [y_i \log(p(x_i|\theta)) + (1-y_i)\log(1-p(x_i|\theta))] )
支持向量机(Support Vector Machines, SVM)
o 核心思想:寻找最大化间隔的超平面来分割不同类别的样本,同时可能通过核函数处理非线性问题。
o 最优化问题:找到最优分类超平面使得边际上的点距离超平面最远(最大化间隔),用拉格朗日乘子法求解。
K近邻(K-Nearest Neighbors, KNN)
o 核心思想:根据新样本在特征空间中与已知类别样本的距离,选取最近的k个邻居,以这k个邻居的多数类别作为新样本的预测类别。
决策树(Decision Trees)
o 核心思想:构建一个树形结构模型,通过一系列规则划分数据集,每个内部节点表示一个特征测试,每个分支代表一个测试输出,而叶节点则表示类别或数值输出。
朴素贝叶斯(Naive Bayes)
o 核心公式:基于贝叶斯定理和特征条件独立假设,计算后验概率最大的类别。
o 分类公式:( P(C_k|X) = \frac{P(X|C_k)P(C_k)}{P(X)} ),其中选择使后验概率最大的类别 ( C_k ) 作为预测结果。
随机森林(Random Forests)
o 核心思想:集成多个决策树的预测结果,每个决策树都是在随机抽取的特征子集上训练得到的。
神经网络(Artificial Neural Networks, ANNs)
o 核心数学公式:多层感知器(Multilayer Perceptron, MLP)等前馈神经网络通过反向传播算法更新权重,最小化损失函数,如交叉熵损失函数。
o 前向传播和反向传播涉及矩阵运算和激活函数的应用。
每种算法都有其特定的数学基础和适用场景,实际应用时需要根据数据特点和需求选择合适的模型。

算法选择条件和依据

在选择合适的机器学习算法时,需要考虑数据的特性、问题类型、计算资源以及模型解释性等因素。以下是一些关于如何结合算法适用场景和理由的系统说明:

  1. 数据量与特征维度或(数据的特性,例如数据的规模、维度和分布):
    o 小数据集模型选择:对于小样本数据集,简单模型如逻辑回归、决策树或K近邻等可能更为合适,因为它们不易过拟合且易于理解。
    o 大数据集模型选择:在大数据背景下,可以利用深度学习模型(如神经网络)或集成方法(如随机森林、梯度提升机等),这些模型能处理高维特征空间并从大量数据中挖掘复杂模式。
  2. 数据分布与线性可分性:
    o 线性分割问题模型选择:当类别可以通过一个超平面清晰地划分时,线性分类器如逻辑回归、支持向量机(线性核),另外支持向量机更适合具有高维度特征的数据集。
    o 非线性问题模型选择:如果数据分布具有非线性特征,则需采用非线性模型,一般分类问题,如核SVM(使用非线性核函数)、神经网络或多层感知器、决策树(能够构建非线性决策边界)。
    o 上两条中提到线性和非线性问题,是根据超平面来决定的,当数据集可以清晰的通过一个超平面进行分割时,我们就采用线性方法解决,当数据集中无法用一个超平面进行数据的分割时,就要采用非线性的方法解决了。
    o 超平面的特点:那么对于分类问题,到底是线性的还是非线性的呢?还是需要找到前面说到的分割的超平面,只要在二维环境中把数据能用线分割两部分,三维中能用一个平面分割两部分, 我们就称之为超平面。
  3. 计算资源限制:
    o 计算能力弱环境选择模型:如果计算资源有限,轻量级模型如逻辑回归、朴素贝叶斯或小规模的决策树更优。
    o 计算能力强环境选择模型:若拥有充足的计算资源,可以尝试训练复杂的深度学习模型或者大规模集成模型,如深度神经网络、XGBoost、LightGBM等。
  4. 实时预测需求:
    o 实时或快速响应模型选择:对于需要实时响应的应用场景,例如推荐系统中的在线学习或流式数据处理,要求模型有较高的推理速度。此时,简单的模型或优化过的树模型(如基于树的梯度提升模型)更加适合。
    o 实时性不高离线任务模型选择:对实时性要求不高的离线任务,可以选择训练时间较长但性能优秀的模型,如深度神经网络。
  5. 模型解释性:
    o 高解释性模型选择:在法律、医疗,人脸识别等领域,模型的决策过程需要高度透明,这时可以优先选用可解释性强的模型,如决策树、规则学习或LIME解释工具辅助的其他模型,这样更容易发现潜在的偏见或歧视问题。
    o 低解释性模型选择:在金融领域我们只关心结果和能否准确的对交易盈亏预测的模型,类似这种追求极致准确性能而不强调模型解释性时,可以选择神经网络或支持向量机等黑盒模型。
  6. 数据类型:
    o 结构化数据模型选择:对于数值型和离散型特征为主的数据,大多数监督学习算法都能处理,关键是看数据的具体结构和分布特点。
    o 文本数据模型选择:通常会采用NLP领域的特定模型,如词袋模型、TF-IDF加朴素贝叶斯或深度学习模型(如卷积神经网络、循环神经网络等)进行文本分类。
    o 图像数据模型选择:图像分类主要依赖于卷积神经网络(CNNs)和其他视觉模型。

综上所述,在实际应用中,选择哪种算法并不是孤立的过程,而是要充分分析项目需求、数据特性以及可用资源,并在此基础上权衡模型的精度、效率、可解释性和泛化能力等多个因素。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/635683.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

适用于 Windows 11 的 12 个最佳免费 PDF 编辑器

除了绘图等基本功能外,一些适用于 Windows 11 的免费 PDF 编辑器还具有 AI、OCR 识别和书签等高级功能。 我们的列表包含易于立即下载的 PDF 编辑软件工具。 这些工具不仅可以帮助转换 PDF、编辑、上传、删除、裁剪、分割、提取等。 PDF 是指便携式文档格式&…

【爬虫实战】2024知乎热榜可视化爬取

项目功能简介: 1.支持配置; 2.单次爬取; 3.循环爬取; 4.爬虫暂停; 5.数据清除; 6.数据保存到csv文件; 7.程序支持打包成exe文件; 8.项目操作说明文档; 9.模块封装到类&a…

Vue中的组件

在应用程序的开发中,组件是不可缺少的。在Vue的使用中,同样也会用到组件。   1、组件的名字唯一;   2、组件以Html形式书写;   3、组件可以复用;   4、组件可以嵌套;   5、组件可以相互调用&…

Docker(七)使用网络

作者主页: 正函数的个人主页 文章收录专栏: Docker 欢迎大家点赞 👍 收藏 ⭐ 加关注哦! Docker 中的网络功能介绍 Docker 允许通过外部访问容器或容器互联的方式来提供网络服务。 一、外部访问容器 容器中可以运行一些网络应用&…

【计算机网络】2、传输介质、通信方向、通信方式、交换方式、IP地址表示、子网划分

文章目录 传输介质双绞线无屏蔽双绞线UTP屏蔽双绞线STP 网线光纤多模光纤MMF单模光纤SMF 无线信道无线电波红外光波 通信方向单工半双工全双工 通信方式异步传输同步传输串行传输并行传输 交换方式电路交换报文交换分组交换 IP地址表示IP地址的定义IP地址的分类无分类编址特殊I…

NVIDIA 大模型 RAG 分享笔记

文章目录 大语言模型在垂直领域落地的三个挑战:什么是 RAG以及为什么能解决大预言模型所带来的的这三个问题RAG 不是一项技术而是整体的 Pipeline非参数化 :数据库部分加载到数据库中检索阶段 提升检索效率的技术检索前:对query做处理use que…

2024年MacBookPro电脑数据恢复软件EasyRecovery数据恢复

前天新入手了一台MacBook pro,第一次用Mac激动的心情简直难以言喻,可是随后这激动的心情顿时就烟消云散了,因为对Mac操作系统的不熟练,导致我删除了一份很重要的Word文件。MacBook pro如何恢复误删除的文件?就这件事我向朋友求助…

网站批量管理软件【最新免费】

在网站运营的过程中,站群软件成为提高效率、管理多个网站的得力助手。本文将专心分享三款卓越的站群软件,其中特别推荐147SEO软件,它不仅能够批量管理网站,还能自动更新原创文章,并主动推送各大搜索引擎。不论您运营何…

c语言空指针

系列文章目录 c语言空指针 c语言空指针 系列文章目录c语言空指针 c语言空指针 空指针 没有指向任何的地址(其指向0的地址) 空制指针就是指向内存编号为零的空间,操作该内存空间会报错,一般情况空指针用于程序条件判断 操作空指针 …

AIGC实战——深度学习 (Deep Learning, DL)

AIGC实战——深度学习 0. 前言1. 深度学习基本概念1.1 基本定义1.2 非结构化数据 2. 深度神经网络2.1 神经网络2.2 学习高级特征 3. TensorFlow 和 Keras4. 多层感知器 (MLP)4.1 准备数据4.2 构建模型4.3 检查模型4.4 编译模型4.5 训练模型4.6 评估模型 小结系列链接 0. 前言 …

数据在内存中的存储(整型与浮点数类型)

目录 数据类型详细介绍 数据类型介绍 数据类型的基本归类 整型在内存中的存储 原码、反码、补码 ​编辑 大小端介绍 例题 浮点型在内存中的存储 常见的浮点数 浮点数存储的例子(具体解析浮点数存储) 解析最初的例题 数据类型详细介绍 数据类…

FPGA高端项目:Xilinx Artix7 系列FPGA纯verilog图像缩放工程解决方案 提供4套工程源码和技术支持

目录 1、前言版本更新说明给读者的一封信FPGA就业高端项目培训计划免责声明 2、相关方案推荐我这里已有的FPGA图像缩放方案本方案在Xilinx Kintex7 系列FPGA上的应用本方案在国产FPGA紫光同创系列上的应用本方案在国产FPGA高云系列上的应用 3、设计思路框架设计框图视频源选择o…

前台vue配置

前台 vue环境 1.傻瓜式安装node: 官网下载:https://nodejs.org/zh-cn/2.安装cnpm: >: npm install -g cnpm --registryhttps://registry.npm.taobao.org3.安装vue最新脚手架: >: cnpm install -g vue/cli注:如果2、3步报错,清除缓…

ClickHouse与Doris数据库比较

概述 都说“实践是检验真理的唯一标准”,光说不练假把式,那么本文就通过实际的测试来感受一下Doris和clickhouse在读写方面的性能差距,看看Doris盛名之下,是否真有屠龙之技;clickhouse长锋出鞘,是否敢缚苍…

JVM 如何判断一个对象可以被回收

Hi, 我是 浮生。 今天分享一道一线互联网公司必问的面试题。 ”JVM 如何判断一个对象可以被回收“ 关于这个问题,来看看高手的回答。 一、问题解析 在 JVM 里面,要判断一个对象是否可以被回收,最重要的是判断这个对象是否还在被…

Web3解密:区块链技术如何颠覆传统互联网

随着区块链技术的崛起,Web3正逐渐成为新一代互联网的代名词。它不再依赖中心化的权威机构,而是通过去中心化、透明、安全的特性,为用户带来更为开放和公正的互联网体验。本文将深入解密Web3,揭示区块链技术如何颠覆传统互联网的基…

ZABBIX根据IP列表,主机描述,或IP子网批量创建主机的维护任务

有时候被ZABBIX监控的主机可能需要关机重启等维护操作,为了在此期间不触发告警,需要创建主机的维护任务,以免出现误告警 ZABBIX本身有这个API可供调用(不同版本细节略有不同,本次用的ZABBIX6.*),实现批量化建立主机的维护任务 无论哪种方式(IP列表,主机描述,或IP子网)创建维护…

【C语言】linux内核ipoib模块 - ipoib_start_xmit

一、ipoib_start_xmit函数定义 static netdev_tx_t ipoib_start_xmit(struct sk_buff *skb, struct net_device *dev) {struct ipoib_dev_priv *priv ipoib_priv(dev);struct rdma_netdev *rn netdev_priv(dev);struct ipoib_neigh *neigh;struct ipoib_pseudo_header *phdr…

[AI]文心一言爆火的同时,ChatGPT-4.5的正确打开方式

前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家:https://www.captainbed.cn/z ChatGPT体验地址 文章目录 前言4.5key价格泄漏ChatGPT4.0使用地址ChatGPT正确打开方式最新功能语音助手存档…

STM32标准库开发——串口发送/单字节接收

USART基本结构 串口发送信息 启动串口一的时钟 RCC_APB2PeriphClockCmd(RCC_APB2Periph_USART1,ENABLE);初始化对应串口一的时钟,引脚,将TX引脚设置为复用推挽输出。 RCC_APB2PeriphClockCmd(RCC_APB2Periph_GPIOA,ENABLE); GPIO_InitTypeDef GPIO_In…