【深度学习】多粒度、多尺度、多源融合和多模态融合的区别

多粒度(multiresolution)和多尺度(multiscale)

多粒度(multiresolution)和多尺度(multiscale)都是指在不同的空间或时间尺度上对数据或信号进行分析和处理。其中

  1. 多尺度:通常是指在不同的空间或时间尺度上对数据或信号进行分析和处理,通常采用不同的滤波器或分解方法,以从低到高分析不同尺度的信号结构。例如,在图像处理中,可以使用高斯金字塔或小波变换对图像进行多尺度分析。多尺度分析可以用于识别不同尺度的特征,例如,在图像中检测不同大小的物体或在信号中检测不同频率的成分。
  2. 多粒度:则更加强调数据的分辨率不同,特别是在数字图像处理中,指的是不同分辨率的图像表示。例如,通过对原始图像进行下采样,可以得到具有不同分辨率的图像金字塔,然后可以将这些图像用于不同的应用,例如图像压缩或目标检测。多粒度分析也可以应用于其他领域,例如地理信息系统和信号处理中。因此,虽然多尺度和多粒度的概念有一些相似之处,但它们的应用范围和重点略有不同。

多源数据融合和多模态数据融合

  1. 多源信息融合(简称为信息融合):是指组合和合并多个来源的信息或数据以便形成一个统一结果的技术。它起源于军事领域中的多传感器综合应用,往往又叫多传感器数据融合(或数据融合),是对人或动物利用各种感官来获取信息并通过大脑综合分析来认识客观世界的一种功能模拟。随着研究的进展,信息融合领域中的“传感器”泛指各种信息来源,除了电子传感器,还包括数据库、网络系统等等。
  2. 多模态融合:一般来说,模态是指事物发生或存在的方式,多模态是指两个或者两个以上的模态的各种形式的组合。对每一种信息的来源或者形式,都可以称为一种模态(Modality),目前研究领域中主要是对图像、文本和语音三种模态的处理。之所以要对模态进行融合,是因为不同模态的表现方式不一样,看待事物的角度也会不一样,所以存在一些交叉(所以存在信息冗余),互补(所以比单特征更优秀) 的现象,甚至模态间可能还存在多种不同的信息交互,如果能合理的处理多模态信息,就能得到丰富特征信息。多模态数据的融合策略主要包括数据级融合、特征级融合和决策级融合,在数据分析的不同阶段选取恰当的融合策略,利用多模态数据之间的信息互补来提升数据分析的准确性。

融合的策略

传统特征融合算法主要可以分为三类:
1.基于贝叶斯决策理论的算法 2.基于稀疏表示理论的算法 3.基于深度学习理论算法。传统方法不做整理,其中的深度学习方法按照融合的层次从下到上每一层都可以fusion:

  1. pixel level(像素级):对原始数据最小粒度进行融合。
  2. feature level (特征级):对抽象的特征进行融合,这也是用的最多的。包括early 和 late fusion,代表融合发生在特征抽取的早期和晚期,如上图。early是指先将特征融合后(concat、add)再输出模型,缺点是无法充分利用多个模态数据间的互补性,且存在信息冗余问题(可由PCA,AE等方法缓解)。late分融合和不融合两种形式,不融合有点像集成学习,不同模态各自得到的结果了之后再统一打分进行融合,好处是模型独立鲁棒性强。融合的方式即在特征生成过程中(如多层神经网络的中间)进行自由的融合,灵活性比较高,如金字塔融合。
  3. decision level(决策级):对决策结果进行融合,这就和集成学习很像了。
  4. hybrid(混合):混合融合多种融合方法。
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/31203.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ABPVNEXT-微服务框架基础入门

准备工作: 1.登录ABPvNext官网 网址 http://abp.io 2.跳转到商业版的说明文档,目前商业版没有中文,只能使用谷歌浏览器的内置翻译功能了 3.框架的相关环境要求,请自自行查看 适用于 Windows 的Visual Studio 2022 (v17.3) /…

战术的勤奋,弥补不了战略的重大缺陷

战术的勤奋,弥补不了战略的大缺陷 战略的懒惰,遍地都是 王兴说过:人为了逃避思考可以干任何事 趣讲大白话:局部优秀,改变不了整体 【趣讲信息科技252期】 **************************** 中小企业顶顶层设计薄弱 这也是…

最后一次模拟考试题解

哦我想这不用看都知道是为了水任务 T1 黑白染色 其实这题有原 什么手写体 md (指 markdown) 分析 首先这题如果你题目没看错的话 ,会发现其实他是 n m n \times m nm 让你求 n n n \times n nn 的区域内的点(不会只有我一个人题目看错了罢 然后我们会发现…

js 正则表达式 限制input元素内容必须以abc开头,123结尾

要通过正则表达式验证一个输入元素的内容是否以"abc"开头且以"123"结尾,您可以使用 ^ 表示开头,$ 表示结尾,以及适当的字符类或具体字符。以下是一个示例正则表达式: var regex /^abc.*123$/;上面的正则表达…

使用 prometheus client SDK 暴露指标

目录 1. 使用 prometheus client SDK 暴露指标1.1. How Go exposition works1.2. Adding your own metrics1.3. Other Go client features 2. Golang Application monitoring using Prometheus2.1. Metrics and Labels2.2. Metrics Types2.2.1. Counters:2.2.2. Gauges:2.2.3. …

MySQL中的索引

1.2.MySQL中的索引 InnoDB存储引擎支持以下几种常见的索引:B树索引、全文索引、哈希索引,其中比较关键的是B树索引 1.2.1.B树索引 InnoDB中的索引自然也是按照B树来组织的,前面我们说过B树的叶子节点用来放数据的,但是放什么数…

云计算作业

云计算作业 Linux DAY1[08/09] 1、创建alan1用户,并使用root用户切换用户至alan1用户。(两种方式切换【加-与不加-】,并总结其效果) [rootlocalhost ~]# useradd alan1 [rootlocalhost ~]# su alan1 [alan1localhost root]$ p…

【JavaScript】一文详解事件循环机制

目录 一、是什么 二、同步任务和异步任务 三、宏任务和微任务 小结:微任务是跟屁虫,一直跟着当前宏任务后面代码执行到一个微任务就跟上,一个接着一个。 例子理解: 五、题目巩固 六、总结 一、是什么 首先JavaScript是一种…

使用自己的数据集预加载 Elasticsearch

作者:David Pilato 我最近在讨论论坛上收到一个问题,关于如何修改官方 Docker 镜像以提供一个现成的 Elasticsearch 集群,其中已经包含一些数据。 说实话,我不喜欢这个想法,因为你必须通过提 entrypoint.sh 的分叉版本…

UEFI: 模块和包概述

UEFI规范中有两个最重要的概念:模块(Module)和包(Package)。 模块 Module UEFI上最小的可单独编译的代码单元,或者是预编译的二进制文件比如efi执行文件。 包 Package 由模块、平台描述文件(DSC)和包声明…

文章六:实际场景应用 - Git实战:解析Git在项目开发中的应用

开始本篇文章之前先推荐一个好用的学习工具,AIRIght,借助于AI助手工具,学习事半功倍。欢迎访问:http://airight.fun 概述 Git是当今最流行的分布式版本控制系统,广泛应用于软件开发和团队协作。在本文中,…

Jenkins+Docker+SpringCloud微服务持续集成项目优化和微服务集群

JenkinsDockerSpringCloud微服务持续集成项目优化和微服务集群 JenkinsDockerSpringCloud部署方案优化JenkinsDockerSpringCloud集群部署流程说明修改所有微服务配置 设计Jenkins集群项目的构建参数编写多选项遍历脚本多项目提交进行代码审查多个项目打包及构建上传镜像把Eurek…

react钩子函数理解

React钩子(Hooks)是React 16.8版本引入的一种特性,用于在无需编写类组件的情况下,在函数组件中添加状态管理和其他React特性。React钩子解决了函数组件在处理状态、副作用和代码复用方面的一些问题,使得代码更加清晰、…

[国产MCU]-BL602开发实例-DAC与音频播放

DAC与音频播放 文章目录 DAC与音频播放1、DAC介绍2、DAC驱动API介绍3、音频数据转换3.1 音频格式转换3.2 音频数据生成C数组4、DAC使用示例数模转换器(digital-to-analog converter,通常称为DAC)是一种数字与模拟转换器,,FIFO深度为1,支持2路DAC调制输出。 可用于音频播放…

数据库线程池可用线程分析

1.事情的起源 项目在跑的过程中,突然间报没有可用的连接数。这个时候,服务进程还在,但是只要涉及到数据库的操作都会报错。 2.排查的思路 事件发生后,我们重启服务,监控的Connections数是258个,某台机器…

Latex安装与环境配置(TeXlive、TeXstudio与VS code的安装)编译器+编辑器与学习应用

TeXlive 配置Tex排版系统需要安装编译器+编辑器。TeX 的源代码是后缀为 .tex 的纯文本文件。使用任意纯文本编辑器,都可以修改 .tex 文件:包括 Windows 自带的记事本程序,也包括专为 TeX 设计的编辑器(TeXworks, TeXmaker, TeXstudio, WinEdt 等),还包括一些通用的文本编…

Python获取淘宝详情API接口流程

随着电子商务的快速发展,越来越多的企业意识到利用API接口进行淘宝营销的重要性。万邦淘宝API接口凭借其稳定性和丰富的功能,成为众多商家的首选。本文将为您介绍如何利用万邦淘宝API接口开展营销,并附上相关代码,助您轻松开启电商…

就业前的准备:web前端面试题及答案

今天小编来发布一些收集到的常见web前端面试题以及很多同学在面试过程中遇到的一些不知道如何回答的难题,通过对这些问题的整理,大家也要重新的巩固自身的基础,为日后的就业提前做好准备: 1、什么是盒子模型? 在网页中&#xff…

行业追踪,2023-08-10

自动复盘 2023-08-10 凡所有相,皆是虚妄。若见诸相非相,即见如来。 k 线图是最好的老师,每天持续发布板块的rps排名,追踪板块,板块来开仓,板块去清仓,丢弃自以为是的想法,板块去留让…

【图像恢复】基于交替乘子方法(ADMM)图像恢复算法研究[固定点收敛和应用](Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…