OpenMax算法详解:深度学习中的高效开集识别技术

OpenMax

OpenMax算法详解:深度学习中的高效开集识别技术

在深度学习领域,模型的识别能力往往受限于其训练数据集的范畴。传统的分类模型,如卷积神经网络(CNN)或循环神经网络(RNN),通常被设计为在闭集环境下工作,即只能识别训练时见过的类别。然而,在现实世界的应用中,模型不可避免地会遇到未知类别的数据。为了应对这一挑战,OpenMax算法应运而生,它扩展了传统分类模型的能力,使其能够识别并拒绝未知类别的输入。

一、引言

随着深度学习技术的飞速发展,其在图像识别、语音识别、自然语言处理等领域取得了显著成就。然而,一个不容忽视的问题是,现有的大多数深度学习模型都假设测试数据仅包含训练时见过的类别,这在许多实际应用场景中是不切实际的。因此,开发能够处理未知类别的开集识别算法显得尤为重要。

二、OpenMax算法概述

OpenMax算法是一种基于深度神经网络的开集识别方法,它通过对模型输出的激活向量进行后处理,实现了对未知类别的有效识别。该算法的核心思想是利用已知类别的统计特性来推断未知类别的存在。

2.1 激活向量与均值激活向量

在深度神经网络中,倒数第二层(通常是全连接层)的输出被称为激活向量(Activation Vector, AV)。对于每个已知类别,OpenMax算法计算该类所有训练样本的激活向量的均值,得到该类的均值激活向量(Mean Activation Vector, MAV)。MAV表示该类在特征空间中的中心位置。

数学表达式如下:

MAV c = 1 N c ∑ i = 1 N c AV i \text{MAV}_c = \frac{1}{N_c} \sum_{i=1}^{N_c} \text{AV}_i MAVc=Nc1i=1NcAVi

其中, MAV c \text{MAV}_c MAVc 是类别 c c c 的均值激活向量, N c N_c Nc 是类别 c c c 的样本数量, AV i \text{AV}_i AVi 是第 i i i 个样本的激活向量。

2.2 距离集与Weibull分布

对于每个类别,OpenMax算法计算该类中所有正确分类的样本的激活向量与该类别MAV之间的欧式距离,形成该类的距离集。然后,使用极值理论中的Weibull分布来拟合每个类别的距离集。Weibull分布是一种用于描述极值事件的概率分布,它能够很好地刻画距离集中的极端值。

欧式距离的计算公式为:

d i c = ∥ AV i − MAV c ∥ 2 d_{ic} = \|\text{AV}_i - \text{MAV}_c\|_2 dic=AViMAVc2

其中, d i c d_{ic} dic 是第 i i i 个样本的激活向量与类别 c c c 的MAV之间的欧式距离。

Weibull分布的概率密度函数为:

f ( x ; λ , k ) = k λ ( x λ ) k − 1 e − ( x λ ) k f(x; \lambda, k) = \frac{k}{\lambda} \left(\frac{x}{\lambda}\right)^{k-1} e^{-\left(\frac{x}{\lambda}\right)^k} f(x;λ,k)=λk(λx)k1e(λx)k

其中, λ \lambda λ 是尺度参数, k k k 是形状参数。

2.3 测试样本识别

对于测试样本,OpenMax算法首先计算其激活向量到各个类别MAV的距离,然后将这些距离分别代入对应类别的Weibull分布的累积分布函数(CDF)中,得到测试样本属于各个已知类别的概率。

累积分布函数的表达式为:

F ( x ; λ , k ) = 1 − e − ( x λ ) k F(x; \lambda, k) = 1 - e^{-\left(\frac{x}{\lambda}\right)^k} F(x;λ,k)=1e(λx)k

如果测试样本属于所有已知类别的概率之和低于某个设定的阈值(通常称为开放空间风险),则将其识别为未知类别。

为了进一步调整模型的输出概率,OpenMax引入了一个参数化的SoftMax函数,即OpenMax函数。OpenMax通过逐类缩减每个已知类别的SoftMax分数,并将它们的差值分配给未知类别。

OpenMax的计算步骤为:

  1. 计算原始SoftMax概率:假设原始分类模型输出类别为 c c c 的概率为 S c ( x ) S_c(x) Sc(x)

  2. 缩减SoftMax概率:基于每个类别的Weibull分布,计算缩减后的概率 S c ′ ( x ) S'_c(x) Sc(x),公式如下:

    S c ′ ( x ) = S c ( x ) ⋅ ( 1 − F ( d c x ; λ c , k c ) ) S'_c(x) = S_c(x) \cdot \left(1 - F(d_{cx}; \lambda_c, k_c)\right) Sc(x)=Sc(x)(1F(dcx;λc,kc))

    其中, d c x d_{cx} dcx 是测试样本到类别 c c c 的MAV的距离, λ c \lambda_c λc k c k_c kc 是类别 c c c 的Weibull分布参数。

  3. 计算未知类别概率:未知类别的概率 S unknown ( x ) S_{\text{unknown}}(x) Sunknown(x) 为原始SoftMax概率与缩减后的概率之差:

    S unknown ( x ) = ∑ c = 1 C ( S c ( x ) − S c ′ ( x ) ) S_{\text{unknown}}(x) = \sum_{c=1}^{C} \left(S_c(x) - S'_c(x)\right) Sunknown(x)=c=1C(Sc(x)Sc(x))

  4. 归一化:最后,OpenMax对所有类别的概率进行归一化处理:

    S OpenMax ( x ) = S c ′ ( x ) ∑ j = 1 C + 1 S j ′ ( x ) S_{\text{OpenMax}}(x) = \frac{S'_c(x)}{\sum_{j=1}^{C+1} S'_j(x)} SOpenMax(x)=j=1C+1Sj(x)Sc(x)

其中, C C C 是已知类别的总数。

2.4 举个栗子

为了帮助理解OpenMax算法的核心概念,我们来看一个简单的例子:

假设我们正在开发一个识别水果的模型,模型在训练时见过的水果类别有苹果、香蕉和橙子。现在,模型需要识别一个从未见过的水果——梨。

在传统的SoftMax分类器中,模型会被强制选择一个最接近的已知类别,因此它可能会错误地将梨识别为苹果、香蕉或橙子。然而,OpenMax算法通过计算梨的激活向量与苹果、香蕉和橙子的均值激活向量的距离,并利用Weibull分布评估这些距离的极端性,来判断梨是否属于已知类别。

假设计算结果显示梨与所有已知类别的距离都较远,且其属于这些类别的概率之和低于设定的阈值,OpenMax算法就会将梨识别为未知类别,并输出一个低的已知类别概率和一个较高的未知类别概率。

三、算法优势与局限性

3.1 优势

  1. 有效处理未知类别:OpenMax算法通过学习已知类别的分布特性,能够推断出未知类别的存在,从而提高了模型的泛化能力和安全性。
  2. 适用场景广泛:该算法可以应用于多种深度学习模型,如CNN、RNN等,并且适用于图像分类、文本分类等多种任务。
  3. 可解释性强:通过计算测试样本到各个类别MAV的距离,OpenMax算法提供了关于测试样本与已知类别之间相似性的直观解释。

3.2 局限性

  1. 数据需求量大:为了准确拟合每个类别的Weibull分布,OpenMax算法需要大量的已知类别数据。这在实际应用中可能是一个挑战。
  2. 计算复杂度高:由于需要计算每个类别的MAV、构建距离集并拟合Weibull分布,OpenMax算法的计算复杂度相对较高。这可能会限制其在实时或资源受限的应用场景中的使用。
  3. 对复杂数据的适应性有限:在处理高度复杂或高度重叠的数据集时,OpenMax算法的性能可能会受到影响。

四、结论与展望

OpenMax算法作为一种有效的开集识别方法,在深度学习领域具有广泛的应用前景。通过扩展传统分类模型的能力,使其能够识别并拒绝未知类别的输入,OpenMax算法提高了模型的安全性和可靠性。然而,随着数据复杂性的增加,OpenMax算法的性能可能会受到一定限制。未来的研究可以集中于优化算法的计算效率、增强其对复杂数据的适应性,并探索更多适用于实际应用的开集识别方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/51073.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

算法5:位运算

文章目录 小试牛刀进入正题 没写代码的题,其链接点开都是有代码的。开始前请思考下图: 小试牛刀 位1的个数 class Solution { public:int hammingWeight(int n) {int res 0;while (n) {n & n - 1;res;}return res;} };比特位计数 class Solution…

关于我的生信笔记开通《知识星球》

关于知识星球 1. 为什么到现在才开通《知识星球》 从很早关注我的同学应该了解小杜的知识分享历程,小杜是从2021年11月底开始进入此“坑”,一直坚持到现在,马上3年了(24年11月底到期)。自己也从一个小青年&#xff0…

查看U盘的具体信息,分区表格式、实际容量和分区状态

查看U盘的具体信息,分区表格式、实际容量和分区状态 前言: 利用windows自带的命令行窗口就可以 1、使用命令提示符查看MBR和GPT分区类型 (1)按“Windows R”键,在弹出的运行对话框中输入“diskpart”,并按…

redis面试(十九)读写锁ReadLock

读写锁ReadLock 简单来说就是互斥锁和非互斥锁。多个客户端可以同事加的锁叫读锁,只能有一个客户端加的锁叫写锁。这个理论应该是从数据库中来的,放在这里也是同样的解释。 多个客户端同时加读锁,是不会互斥的,多个客户端可以同…

YOLOv8_det/seg/pose/obb推理流程

本章将介绍目标检测、实例分割、关键点检测和旋转目标检测的推理原理,基于onnx模型推理,那么首先就需要了解onnx模型的输入和输出,对输入的图片需要进行预处理的操作,对输出的结果需要进行后处理的操作,这部分内容在我的另一个专栏《YOLOv8深度剖析》中也有介绍,如果对YO…

canal数据同步工具介绍与应用

canal服务 canal介绍canal版本与环境canal 服务集canal应用场景: canal常见问题xml配置问题连接认证问题jar版本问题连接问题 canal介绍 ‌1、Canal是‌阿里巴巴开源的‌MySQL增量数据订阅和消费工具,通过模拟MySQL的‌slave与‌master交互,捕…

一文搞懂微服务架构之降级

前置知识 比如双十一之类的大促高峰,平台是会关闭一些服务的,比如退款服务。这就是降级的典型应用,不过它是一种手动的跨服务降级,对于整个系统来说,提供了一部分服务,但是没有提供另外一部分服务&#xf…

InternLM2_PracticalCamp_L2_task3_LMDeploy量化部署进阶实践

1 配置LMDeploy环境 1.1 InternStudio开发机创建与环境搭建 点选开发机,自拟一个开发机名称,选择Cuda12.2-conda镜像。 我们要运行参数量为7B的InternLM2.5,由InternLM2.5的码仓查询InternLM2.5-7b-chat的config.json文件可知,…

数据库多表设计:深入理解一对多、一对一、多对多关系 【后端 12】

数据库多表设计:深入理解一对多、一对一、多对多关系 在数据库设计中,表之间的关系决定了如何组织和存储数据。常见的表关系包括一对多、一对一和多对多。在不同的业务场景下,我们会选择不同的关系模式进行数据库设计。本文将通过具体案例介绍…

企业高性能web服务器

目录 一、web服务介绍 1.1 Web 服务访问流程 1.2 Web 服务器类型 1.3 Apache常用工作模式 1.3.1 Apache prefork 模型 1.3.2 Apache worker 模型 1.3.3 Apache event 模型 【补充】 子进程角色主要负责以下: 二、Nginx 架构和安装 2.1 Nginx 编译安装示例…

Maven的依赖范围

依赖的jar包,默认情况下,可以在任何地方使用,可以通过scope来设置作用范围 作用范围: 主程序范围有效(main文件夹范围内)测试程序范围有效(test文件夹范围内)是否参与打包运行&…

投资伦敦银一般看什么点位做单?

伦敦银的价格走势不断变化,无论投资者选择做多还是做空,进场的点位都不是一成不变的, 如果投资者想找到胜率比较高的进场点位,可以尝试在走势图中找出银价的支撑与压力位所在,然后在压力位附近布局空单,在…

fastadmin 安装

环境要求,大家可以参考官方文档的,我这里使用的是phpstudy,很多已经集成了。 注意一点,PHP 版本:PHP 7.4 。 第二步:下载 下载地址:https://www.fastadmin.net/download.html 进入下载地址后…

SpringBoot依赖之Spring Data Redis 实现地理坐标(Geospatial)

Spring Boot 项目中使用 Spring Data Redis 实现地理坐标(Geospatial) 概念 Spring Data Redis (AccessDriver) 依赖名称: Spring Data Redis (AccessDriver)功能描述: Advanced and thread-safe Java Redis client for synchronous, asynchronous, and reactive usage. Sup…

如何制作统信UOS启动盘?

如何制作统信UOS启动盘? 一、下载UOS系统安装镜像二、在UOS系统环境下制作启动盘步骤一:准备U盘步骤二:打开启动盘制作工具步骤三:选择ISO镜像文件步骤四:选择安装介质并格式化步骤五:等待制作完成 三、在W…

Redis 技术详解

一、Redis 基础 (一)为什么使用 Redis 速度快,因为数据存在内存中,类似于 HashMap,查找和操作的时间复杂度都是 O(1)。支持丰富数据类型,支持 string、list、set、Zset、hash 等。支持事务,操…

AScript 的UI asui模板的导入

两种方案: 第一种直接在web端,右击UI文件夹 第二种在pycharm,也是右击UI文件夹 调用UI,在init类中直接调用即可

Transformer微调实战:通过低秩分解(LoRA)对T5模型进行微调(LoRA Fine Tune)

scient scient一个用python实现科学计算相关算法的包,包括自然语言、图像、神经网络、优化算法、机器学习、图计算等模块。 scient源码和编译安装包可以在Python package index获取。 The source code and binary installers for the latest released version ar…

Aria2安装和使用-Mac版

起因是需要网盘下载,无奈限速很烦,查找很多方案后,最终决定使用Aria2 Tampermonkey。 其中Aria2是一款开源轻量的下载软件,简单来说就是可以通过URL直接下载。 Tampermonkey则是一款插件,我这里是.crx结尾的谷歌插件…

文件IO函数:open/close,read/write,lseek

open和close函数 C语言中的文件IO操作需要使用到open()函数和close()函数来打开和关闭文件。 open()函数的原型如下: int open(const char *pathname, int flags); int open(const char *filename, int flags,mode_t mode);其中,filename表示要打开…