机器学习常用术语

目录

概要

机器学习常用术语

1、模型

2、数据集

3、样本与特征

4、向量

5、矩阵

6、假设函数与损失函数

7、拟合、过拟合与欠拟合

8、激活函数(Activation Function)

9、反向传播(Backpropagation)

10、基线(Baseline)

11、批量(Batch)

12、批量大小(Batch Size)

13、二元分类器(Binary Classification)

14、标定层(Calibration Layer)

15、候选采样(Candidate Sampling)

16、检查点(Checkpoint)

17、类别(Class)

18、类别不平衡数据集(Class-Imbalanced Data Set)

19、分类模型(Classification)

20、分类阈值(Classification Threshold)

21、混淆矩阵(Confusion Matrix)

22、连续特征(Continuous Feature)

23、收敛(Convergence)

24、凸函数(Convex Function)

25、交叉熵(Cross-Entropy)

26、数据集(Data Set)

27、决策边界(Decision Boundary)

28、深度模型(Deep Model)

29、密集特征(Dense Feature)

30、Dropout正则化(Dropout Regularization)

31、动态模型(Dynamic Model)

32、早期停止法(Early Stopping)

33、嵌入(Embeddings)

34、集成(Ensemble)

35、评估器(Estimator)

36、样本(Example)

37、假负类(False Negative,FN)

38、假正类(False Positive,FP)

39、假正类率(False Positive Rate,FP率)

40、特征列(Feature Columns)

41、特征集(Feature Set)

42、特征定义(Feature Spec)

43、泛化(Generalization)

44、广义线性模型(Generalized Linear Model)

45、梯度(Gradient)

46、梯度截断(Gradient Clipping)

47、梯度下降(Gradient Descent)

48、图(Graph)


概要

机器学习有很多陌生的词汇,有必要对这些常用术语词汇进行一定的了解。

资料来源:《机器学习实战(视频教学版)》迟殿委 王培进 王兴平著 2024-04出版

机器学习常用术语

1、模型

模型可以把它看作一个“魔法盒”​,我们向它许愿(输入数据)​,它就会帮我们实现愿望(输出预测结果)​。整个机器学习的过程都将围绕模型展开,训练出一个最优质的“魔法盒”​,它可以尽量精准地实现我们许的“愿望”​,这就是机器学习的目标。

2、数据集

数据集,表示一个承载数据的集合。如果说“模型”是“魔法盒”​,那么数据集就是负责给它充电的“能量电池”​。简单地说,如果缺少了数据集,那么模型就没有存在的意义了。数据集可划分为“训练集”和“测试集”​,它们分别在机器学习的“训练阶段”和“预测输出阶段”起着重要的作用。

3、样本与特征

样本指的是数据集中的数据,一条数据被称为“一个样本”​。通常情况下,样本会包含多个特征值,用来描述数据,特征值也可以理解为数据的相关性,每一列的数据都与这一列的特征值相关。

4、向量

向量也称欧几里得向量、几何向量、矢量,指具有大小和方向的量。可以形象地把它理解为带箭头的线段,箭头代表向量的方向,线段长度代表向量的大小。与向量对应的量叫作数量(物理学中称标量)​,数量只有大小,没有方向。

在机器学习中,模型算法的运算均基于线性代数运算法则,例如行列式、矩阵运算、线性方程等。

数据集中的每一个样本都是一条具有向量形式的数据

5、矩阵

矩阵可以把它看作由向量组成的二维数组。数据集就是以二维矩阵的形式存储数据的,可以把它形象地理解为电子表格,​“一行一样本,一列一特征”​。

6、假设函数与损失函数

假设函数(Hypothesis Function)和损失函数(Loss Function)

假设函数可表述为y=f(x),其中x表示输入数据,y表示输出的预测结果,而这个结果需要不断地优化才会达到预期的结果,否则会与实际值偏差较大。

损失函数又叫目标函数,简写为L(x)。这个L(x)的值是假设函数得出的预测结果y,如果L(x)的返回值越大,就表示预测结果与实际偏差越大;如果L(x)的返回值越小,则证明预测值越来越“逼近”真实值,这才是机器学习最终的目的。损失函数就像一个度量尺,让我们知道“假设函数”预测结果的优劣,从而做出相应的优化策略。

“优化方法”可以理解为假设函数和损失函数之间的沟通桥梁。通过L(x)可以得知假设函数输出的预测结果与实际值的偏差值,当该值较大时,就需要做出相应的调整,这个调整的过程叫作“参数优化”​。而如何实现优化呢?有梯度下降、牛顿法与拟牛顿法、共轭梯度法等。

7、拟合、过拟合与欠拟合

拟合”就是把平面坐标系中一系列散落的点,用一条光滑的曲线连接起来,因此拟合也被称为“曲线拟合”​。拟合的曲线一般用函数来表示,但是由于拟合曲线会存在许多种连接方式,因此就会出现多种拟合函数。

过拟合,就是模型的泛化能力较差,也就是过拟合的模型在训练样本中表现优越,但是在验证数据以及测试数据集中表现不佳。过拟合问题主要是因为训练时样本过少、特征值过多导致的。

欠拟合(Underfitting)恰好与过拟合相反,它指的是“曲线”不能很好地“拟合“数据。在训练和测试阶段,欠拟合模型表现均较差,无法输出理想的预测结果。造成欠拟合的主要原因是没有选择好合适的特征值。

欠拟合和过拟合是机器学习中会遇到的问题,这两种情况都不是我们期望看到的,因此要避免。

8、激活函数(Activation Function)

激活函数(例如ReLU或Sigmoid)将前一层所有神经元激活值的加权和输入一个非线性函数中,然后向下一层传递该函数的输出值(典型的非线性)​。

9、反向传播(Backpropagation)

反向传播算法是神经网络中完成梯度下降的重要算法。首先,在前向传播的过程中计算每个节点的输出值;然后,在反向传播的过程中计算与每个参数对应的误差的偏导数

10、基线(Baseline)

基线是指用作比较参考的简单模型,它帮助模型开发者量化模型在特定问题上的预期表现

11、批量(Batch)

批量是指模型训练中一个迭代(指一次梯度更新)所使用的样本集。

12、批量大小(Batch Size)

批量大小指一个批量中样本的数量。批量大小通常在训练与推理的过程中确定,但是TensorFlow框架不允许动态更改批量大小。

13、二元分类器(Binary Classification)

二元分类器输出两个互斥(不相交)类别中的一个。

14、标定层(Calibration Layer)

标定层是一种调整后期预测的结构,通常用于解释预测偏差。调整后的预期和概率必须匹配一个观察标签集的分布。

15、候选采样(Candidate Sampling)

候选采样是一种在训练时进行的优化方法,使用Softmax等算法计算所有正标签的概率,同时只计算一些随机取样的负标签的概率

16、检查点(Checkpoint)

检查点指在特定时刻标记模型变量的状态的数据。检查点允许输出模型的权重,也允许通过多个阶段训练模型。检查点还允许跳过错误继续进行(例如,抢占作业)​。注意,模型自身的图式并不包含于检查点内。

17、类别(Class)

所有同类属性的目标值作为一个标签

18、类别不平衡数据集(Class-Imbalanced Data Set)

数据集样本类别极不平衡,一般针对二元分类问题,表示两个类别的标签的分布频率有很大的差异。

19、分类模型(Classification)

机器学习模型的一种,将数据分离为两个或多个离散类别。分类模型与回归模型(Regression Model)成对比。

20、分类阈值(Classification Threshold)

分类阈值指应用于模型的预测分数以分离正类别和负类别的一种标量值标准。当需要将逻辑回归的结果映射到二元分类模型中时,就需要使用分类阈值。

21、混淆矩阵(Confusion Matrix)

混淆矩阵指总结分类模型的预测结果的表现水平(即标签和模型分类的匹配程度)的NN×维表格。混淆矩阵的一个轴列出模型预测的标签,另一个轴列出实际的标签。N表示类别的数量。

22、连续特征(Continuous Feature)

连续特征拥有无限个取值点的浮点特征。和离散特征(Discrete Feature)相反

23、收敛(Convergence)

训练过程达到的某种状态,其中训练损失和验证损失在经过确定的迭代次数后,在每一次迭代中改变很小或完全不变。换句话说,当对当前数据继续训练而无法再提升模型的表现水平的时候,就称模型已经收敛。在深度学习中,损失值在下降之前,有时候经过多次迭代仍保持常量或者接近常量,就会造成模型已经收敛的错觉。

24、凸函数(Convex Function)

一种形状大致呈字母U形或碗形的函数。但是,在退化情形中,凸函数的形状就像一条线

25、交叉熵(Cross-Entropy)

多类别分类问题中对Log损失函数的推广。交叉熵量化两个概率分布之间的区别

26、数据集(Data Set)

样本的集合。

27、决策边界(Decision Boundary)

在一个二元分类或多类别分类问题中,模型学习的类别之间的分离器

28、深度模型(Deep Model)

一种包含多个隐藏层的神经网络。深度模型依赖于其可训练的非线性性质。和宽度模型(Wide Model)对照

29、密集特征(Dense Feature)

大多数取值为非零的一种特征,通常用取浮点值的张量(Tensor)表示。和稀疏特征(Sparse Feature)相反。

30、Dropout正则化(Dropout Regularization)

训练神经网络时一种有用的正则化方法。Dropout正则化的过程是在单次梯度计算中删去一层网络中随机选取的固定数量的单元。删去的单元越多,正则化越强

31、动态模型(Dynamic Model)

动态模型是一种以连续更新的方式在线训练的模型,即数据连续不断地输入模型

32、早期停止法(Early Stopping)

一种正则化方法,在训练损失完成下降之前停止模型训练过程。当验证数据集(Validation Data Set)的损失开始上升的时候,即泛化表现变差的时候,就应该使用早期停止法。

33、嵌入(Embeddings)

一类表示为连续值特征的明确的特征。嵌入通常指将高维向量转换到低维空间中

34、集成(Ensemble)

多个模型预测的综合考虑

35、评估器(Estimator)

评估器是一种封装了各种机器学习模型的工具,是拟合和训练数据的机器学习算法或者其他算法的抽象。

36、样本(Example)

一个数据集的一行内容。一个样本包含了一个或多个特征,也可能是一个标签。标注样本(Labeled Example)和无标注样本(Unlabeled Example)

37、假负类(False Negative,FN)

被模型错误预测为负类的样本。例如,模型推断一封邮件为非垃圾邮件(负类)​,但实际上这封邮件是垃圾邮件。

38、假正类(False Positive,FP)

被模型错误预测为正类的样本。例如,模型推断一封邮件为垃圾邮件(正类)​,但实际上这封邮件是非垃圾邮件

39、假正类率(False Positive Rate,FP率)

ROC曲线中的x轴。FP率的计算公式是:假正率=假正类数/(假正类数+真负类数)​。

40、特征列(Feature Columns)

具有相关性的特征的集合,例如用户可能居住的所有国家的集合。一个样本的一个特征列中可能会有一个或者多个特征。

41、特征集(Feature Set)

特征集指机器学习模型训练的时候使用的特征群。例如,邮政编码、面积要求和物业状况等,可以组成一个简单的特征集,使模型能预测房价。

42、特征定义(Feature Spec)

特征指的是描述一个实例的属性或特征,也可以称为自变量(independentvariable)或输入变量(input variable)

43、泛化(Generalization)

泛化是指模型利用新的没见过的数据而不是训练数据做出正确预测的能力

44、广义线性模型(Generalized Linear Model)

广义线性模型是线性模型的扩展,通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系

45、梯度(Gradient)

梯度是模型函数的偏导数向量。梯度指向最陡峭的上升路线

46、梯度截断(Gradient Clipping)

 在应用梯度之前先修饰数值,梯度截断有助于确保数值稳定性,防止梯度爆炸出现。

47、梯度下降(Gradient Descent)

梯度下降通过计算模型的相关参数和损失函数的梯度来最小化损失,值取决于训练数据。梯度下降迭代地调整参量,逐渐靠近权重和偏置的最佳组合,从而最小化损失函数

48、图(Graph)

图是由节点(Node)和边(Edge)组成的一种数据结构,用于描述事物之间的关系。图近来正逐渐变成机器学习的一大核心领域,例如,可以通过图来预测潜在的连接,从而理解社交网络的结构、检测欺诈、理解汽车租赁服务的消费者行为,或者进行实时推荐。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/65466.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微服务篇-深入了解 MinIO 文件服务器(你还在使用阿里云 0SS 对象存储图片服务?教你使用 MinIO 文件服务器:实现从部署到具体使用)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 MinIO 文件服务器概述 1.1 MinIO 使用 Docker 部署 1.2 MinIO 控制台的使用 2.0 使用 Java 操作 MinIO 3.0 使用 minioClient 对象的方法 3.1 判断桶是否存在 3.2…

第一个C++程序|cin和cout|命名空间

第一个C程序 基础程序 使用DevC5.4.0 写一个C程序 在屏幕上打印hello world #include <iostream> using namespace std;int main() {cout << "hello world" << endl;return 0; } 运行这个C程序 F9->编译 F10->运行 F11->编译运行 mai…

【大模型】wiki中文语料的word2vec模型构建

在自然语言处理&#xff08;NLP&#xff09;任务中&#xff0c;词向量&#xff08;Word Embedding&#xff09;是一个非常重要的概念。通过将词语映射到一个高维空间中&#xff0c;我们能够以向量的形式表达出词语之间的语义关系。Word2Vec作为一种流行的词向量学习方法&#x…

1.RPC基本原理

文章目录 RPC1.定义2.概念3.优缺点4.RPC结构5.RPC消息协议5.1 消息边界5.2 内容5.3 压缩 6.RPC的实现6.1 divide_protocol.py6.2 server.py6.3 client.py RPC 1.定义 远程过程调用(remote procedure call) 2.概念 广义:所有通过网络进行通讯,的调用统称为RPC调用 狭义:不采…

强化特种作业管理,筑牢安全生产防线

在各类生产经营活动中&#xff0c;特种作业由于其操作的特殊性和高风险性&#xff0c;一直是安全生产管理的重点领域。有效的特种作业管理体系涵盖多个关键方面&#xff0c;从作业人员的资质把控到安全设施的配备维护&#xff0c;再到特种设备的精细管理以及作业流程的严格规范…

iOS 苹果开发者账号: 查看和添加设备UUID 及设备数量

参考链接&#xff1a;苹果开发者账号下添加新设备UUID - 简书 如果要添加新设备到 Profiles 证书里&#xff1a; 1.登录开发者中心 Sign In - Apple 2.找到证书设置&#xff1a; Certificate&#xff0c;Identifiers&Profiles > Profiles > 选择对应证书 edit &g…

基于单片机的大型家禽养殖基地智能环境控制系统构建

摘要:我国是一个大型家禽养殖大国,无论是大型家禽养殖数量或是大型家禽相关产品总量都位居世界前列。但是我国的大型家禽相关产品的市场竞争力却表现的差强人意,与一些发达国家的同类产品相比还有较大的差距。导致这一情况主要是因为我国很多大型家禽养殖基地往往只关注大型…

如何让Tplink路由器自身的IP网段 与交换机和电脑的IP网段 保持一致?

问题分析&#xff1a; 正常情况下&#xff0c;我的需求是&#xff1a;电脑又能上网&#xff0c;又需要与路由器处于同一局域网下&#xff08;串流Pico4 VR眼镜&#xff09;&#xff0c;所以&#xff0c;我是这么连接 交换机、路由器、电脑 的&#xff1a; 此时&#xff0c;登录…

视听语言与手机拍摄技巧

视听语言----------------------------------------- 景别&#xff1a;远全中近特 远景&#xff1a;人物只占画面很小的一部分&#xff0c;主要展示环境&#xff08;背景为画面主体&#xff0c;人物占画面很小的一部分&#xff09;–》定调子&#xff08;确定电影基调&#xf…

企业安全建设——安全防线框架建设(一)

前言 为什么会有此篇文章&#xff0c;早期的攻击&#xff0c;从弱口令&#xff0c;SQL注入&#xff0c;上传漏洞&#xff0c;演变到现在的反序列化&#xff0c;供应链&#xff0c;公私云&#xff0c;区块链等攻击方式&#xff0c;早期的防御方式从防火墙&#xff0c;防病毒&am…

(南京观海微电子)——GH7009开机黑屏案例分析

一、 现象描述&#xff1a; 不良现象: LVDS模组&#xff0c;开机大概2秒后就黑屏。 二、问题分析 等主机进入Kernel 后做以下测试&#xff1a; 1、手动reset LCM 后 可以显示正常&#xff1b; 总结&#xff1a; 1&#xff09;uboot 部分HS 太窄&#xff0c;仅有4个clk宽度&am…

第10章 初等数论

2024年12月27日一稿&#xff08;P341&#xff09; 2024年12月28日二稿 2024年12月29日三稿 当命运这扇大门向你打开的时候&#xff0c;不要犹豫和害怕&#xff0c;一直往前跑就是了&#xff01; 10.1 素数 这里写错了&#xff0c;不能整除应该表示为 10.2 最大公约数与最小公…

XXE漏洞 黑盒测试 白盒测试 有无回显问题

前言 什么是XXE&#xff08;xml外部实体注入漏洞&#xff09;&#xff1f; 就是网站以xml传输数据 的时候我们截取他的传输流进行修改&#xff08;网站没有对我们的输入进行过滤&#xff09; 添加恶意代码 导致数据传输到后台 后台解析xml形式 导致恶意代码被执行 几种常见的…

yolov5 yolov6 yolov7 yolov8 yolov9目标检测、目标分类 目标切割 性能对比

文章目录 YOLOv1-YOLOv8之间的对比如下表所示&#xff1a;一、YOLO算法的核心思想1. YOLO系列算法的步骤2. Backbone、Neck和Head 二、YOLO系列的算法1.1 模型介绍1.2 网络结构1.3 实现细节1.4 性能表现 2. YOLOv2&#xff08;2016&#xff09;2.1 改进部分2.2 网络结构 3. YOL…

NV-Embed详细技术解析

NV-Embed详细技术解析 1. 方法论 1.1 双向注意力 背景&#xff1a;解码器块中的因果掩码原本用于防止自回归文本生成时的信息泄露创新&#xff1a;在对比学习过程中移除因果注意力掩码优势&#xff1a;提升模型的表示能力,允许双向信息流动 1.2 潜在注意力层 动机&#xf…

jdk版本介绍

1.JDK版本编号 • 主版本号&#xff1a;表示JDK的主要版本&#xff0c;如JDK 8、JDK 11中的8和11。主版本号的提升通常意味着引入了重大的新特性或变更。 • 次版本号&#xff1a;在主版本号之后&#xff0c;有时会跟随一个或多个次版本号&#xff08;如JDK 11.0.2中的0.2&…

低代码开源项目Joget的研究——基本概念和Joget7社区版应用

大纲 1. 基本概念1.1 Form1.1.1 Form1.1.1.1 概述1.1.1.2 主要特点和用途1.1.1.3 创建和使用 Form1.1.1.4 示例 1.1.2 Section1.1.2.1 概述1.1.2.2 主要特点和用途1.1.2.3 示例 1.1.3 Column1.1.4 Field1.1.5 示例 1.2 Datalist1.2.1 Datalist1.2.1.1 主要特点和用途1.2.1.2 创…

【LeetCode 04】 209. 长度最小的子数组

暴力解法&#xff1a; 测试通过✅提交超时❌ class Solution {public int minSubArrayLen(int target, int[] nums) {//暴力解法int sum0;int subLength0;int resultInteger.MAX_VALUE;int lennums.length;for(int i0;i<len;i){//起始位置sum0;for(int ji;j<len;j){//终…

【已解决】图片png转ico格式

起因&#xff1a; pyinstaller 打包时需要 ico 格式图片&#xff0c;但是通常手上只有png格式的图片&#xff0c;为了将png转为ico&#xff0c;直接改后缀会报错“struct.error: unpack requires a buffer of 16 bytes”&#xff0c;我就上网搜了一下&#xff0c;发现都是一些…

Java 中 Stream 流的使用详解

Java 中 Stream 流的使用详解 什么是 Stream&#xff1f; Stream 是 Java 8 引入的一种全新的操作集合的方式。它支持通过声明性方式对集合进行复杂的数据操作&#xff08;如过滤、排序、聚合等&#xff09;&#xff0c;避免使用大量的 for 循环&#xff0c;提高代码的可读性…