【论文串烧】多媒体推荐中的模态平衡学习 | 音视频语音识别中丢失导致的模态偏差对丢失视频帧鲁棒性的影响

文章目录

    • 一、多媒体推荐中的模态平衡学习
      • 1.1 研究背景
      • 1.2 解决问题
      • 1.3 实施方案
      • 1.4 文章摘要
      • 1.5 文章重点
      • 1.6 文章图示
        • 图 1:不同模型变体在 AmazonClothing 数据集上的初步研究
        • 图 2:CKD模型架构的说明
        • 图 3:在 Amazon-Clothing 数据集上训练过程中的性能曲线
    • 二、音视频语音识别中丢失导致的模态偏差对丢失视频帧鲁棒性的影响
      • 2.1 研究背景
      • 2.2 解决问题
      • 2.3 实施方案
      • 2.4 文章摘要
      • 2.5 文章贡献
      • 2.6 文章图示
        • 图 1:不同dropout率下AVSR的CER退化曲线
        • 图 2:ASR和AVSR转录相似性分析
        • 图 3:ASR和不同AVSR设置的中间表示相似性矩阵
        • 图 4:模态偏差假设(MBH)的说明
        • 图 5:所提出的AVSR系统的整体框架

一、多媒体推荐中的模态平衡学习

1.1 研究背景

  • 多媒体内容在现代网络时代的主导地位,以及推荐系统在处理多媒体内容时面临的挑战。随着互联网内容以多种形式(如图像、文本、视频等)呈现,如何有效地整合这些多模态信息成为推荐系统研究的关键问题。然而,多模态信息的整合常常遇到模态不平衡问题,即不同模态之间的信息量不平衡,导致在所有模态上优化相同目标时,弱模态的性能优化不足

1.2 解决问题

  • 多模态推荐模型中的模态不平衡问题,即在多模态推荐系统中,由于不同模态的信息量不平衡,导致某些模态(如视觉模态)的性能优化不足,从而影响整体推荐效果

1.3 实施方案

  • 提出了一种名为Counterfactual Knowledge Distillation (CKD) 的方法,通过模态特定的知识蒸馏来指导多模态模型从单模态教师模型中学习特定于模态的知识。此外,设计了一种新颖的通用和特定蒸馏损失,以指导多模态学生模型从教师模型中学习更广泛和深入的知识。通过使用反事实推断技术估计每个模态对训练目标的因果效应,可以确定弱模态,量化不平衡程度,并相应地重新加权蒸馏损失。CKD方法可以作为插件模块,用于晚期融合和早期融合的任何现有多媒体推荐模型。

1.4 文章摘要

论文的摘要指出,多模态内容的推荐系统需要有效地整合来自不同模态的信息。然而,不同模态之间的信息不平衡导致了弱模态的性能优化不足。为了解决这些问题,论文提出了CKD方法,该方法通过模态特定的知识蒸馏和反事实推断技术,解决了模态不平衡问题,并充分利用了所有模态。通过在六个不同的推荐系统模型上进行广泛的实验,证明了CKD方法可以显著提高推荐性能。

1.5 文章重点

  • 提出了CKD框架,用于解决多模态推荐中的模态不平衡问题
  • 设计了模态特定的知识蒸馏方法和通用-特定蒸馏损失。
  • 使用反事实推断技术来估计模态的因果效应,并据此调整蒸馏损失的权重。
  • 在多个数据集和推荐系统模型上验证了CKD的有效性。

1.6 文章图示

图 1:不同模型变体在 AmazonClothing 数据集上的初步研究

在这里插入图片描述

  • 这张图展示了在 AmazonClothing 数据集上,多模态模型与单模态模型(仅文本和仅图像模型)的性能比较。图中显示了召回率(Recall@20)随训练周期(Epoch)的变化。阴影区域表示每种模态在多模态模型中的优化不足程度。使用早停法(early stopping)结束训练,导致不同模型的曲线长度不同。从图中可以看出,多模态模型中的视觉和文本模态的性能都不如相应的单模态模型,这表明在多模态联合训练过程中,不同模态之间存在相互抑制现象,导致整体性能低于单模态模型的简单相加(1 + 1 < 2)。此外,性能较差的弱模态(例如示例中的视觉模态)遭受更严重的优化不足问题。

在推荐系统中,召回率(Recall)是衡量模型性能的一个重要指标,它表示的是推荐系统能够从所有相关项中检索到的项的比例。召回率越高,意味着推荐系统能够找到更多用户可能感兴趣的项目,从而提供更全面的推荐。

召回率的计算公式为:
Recall = Number of relevant items retrieved Number of relevant items \text{Recall} = \frac{\text{Number of relevant items retrieved}}{\text{Number of relevant items}} Recall=Number of relevant itemsNumber of relevant items retrieved

召回率关注的是推荐系统是否能够捕捉到用户的所有潜在兴趣,而不是推荐列表中的排名或排序。

然而,召回率并不是唯一的性能指标。在实际应用中,通常会结合其他指标来全面评估推荐系统的性能,例如:

  1. 精确率(Precision):推荐系统推荐的项目中,相关项目所占的比例。精确率越高,表示推荐结果的质量越好,用户遇到不相关推荐的概率越低。

  2. F1分数(F1 Score)精确率和召回率的调和平均数,用于在两者之间取得平衡。

图 2:CKD模型架构的说明

在这里插入图片描述

这个图表由三部分组成,分别展示了 CKD 模型的整体框架、蒸馏损失的说明以及学习速度估计的说明。

  • (a) 整体框架:展示了通过模态特定的知识蒸馏,CKD 如何指导多模态模型从单模态教师模型中学习特定于模态的知识,从而缓解模态之间的竞争。λ 通常表示一个超参数,用于平衡不同损失函数之间的权重。在机器学习模型中,特别是在包含多个损失函数或目标函数的情况下,超参数 λ 用于调整这些函数在最终优化目标中的相对重要性

  • (b) 蒸馏损失的说明:在训练三元组上,使用铰链蒸馏损失鼓励学生模型在训练三元组上的表现优于教师模型;在没有监督的通用三元组上,使用交叉熵蒸馏损失鼓励学生模型模仿教师模型。

  • © 学习速度估计的说明:通过反事实推断,可以估计每个模态在黑盒多模态模型中的学习速度,从而估计模态之间的不平衡程度。

图2:(a)CKD模型架构示意图。通过特定于模态的知识蒸馏,CKD可以引导多模态模型从单模态教师那里学习特定于模态的知识,从而缓解模态之间的竞争(§3.1)。(b)在训练三元组上,铰链蒸馏损失鼓励学生模型比教师表现得更好(§3.1.3),而在没有监督的通用三元组上,CE蒸馏损失鼓励学生模型模仿教师(§3.1.4)。©通过反事实推理,我们可以估计黑盒多模态模型中每个模态的学习速度(§3.2)。

  1. w/supervision (有监督)

    • 这个术语指的是在训练过程中使用明确标注的数据,即训练集中的三元组 ((u, i, j)),其中 (i) 是用户 (u) 的正样本(用户与项目的实际互动),而 (j) 是负样本(用户未与该项目互动)。在这种情况下,模型有明确的信号来判断一个推荐是好是坏,因此可以使用这种监督信息来指导模型的训练。
  2. w/o supervision (无监督)

    • 相对的,“w/o supervision” 指的是在训练过程中不依赖于明确标注的数据。在多模态学习中,这可能意味着使用一些通用的三元组 ((u, i, j)),其中 (i) 和 (j) 并不固定为正负样本,而是随机或均匀采样的。这种情况下,模型没有明确的监督信号来区分好的推荐和坏的推荐,因此需要使用不同的策略来学习。
  3. Lhinge (铰链损失)

    • “Lhinge” 指的是铰链损失(Hinge Loss),这是一种常用于分类任务的损失函数,特别是在支持向量机(SVM)中。在蒸馏过程中,铰链损失用于鼓励学生模型在训练三元组上的预测性能超越教师模型。具体来说,铰链损失会惩罚那些学生模型预测不如教师模型的情况,从而推动学生模型在模仿教师的同时,努力超越教师模型的性能。
  4. Lce (交叉熵损失)

    • “Lce” 指的是交叉熵损失(Cross-Entropy Loss),这是一种常用于分类任务的损失函数,特别是在训练神经网络时。在蒸馏过程中,交叉熵损失用于无监督场景,鼓励学生模型模仿教师模型的输出。即使没有明确的正负样本标签,交叉熵损失也可以通过比较学生模型和教师模型对通用三元组的预测来帮助学生模型学习。
  • 在CKD框架中,通过结合有监督和无监督的蒸馏损失,模型可以在保留教师模型知识的同时,提高对多模态数据的理解和预测性能。这种结合使用铰链损失和交叉熵损失的策略,使得模型在训练时既能够利用明确的监督信号,又能够从更广泛的数据中学习,从而提高模型的泛化能力和推荐质量。
图 3:在 Amazon-Clothing 数据集上训练过程中的性能曲线
  • 这张图展示了在 Amazon-Clothing 数据集上,使用 CKD 方法和不使用 CKD 方法的多模态模型以及单模态模型的性能变化。图中显示了召回率(Recall@20)随训练周期(Epoch)的变化。可以看出,使用 CKD 方法的模型在整体多模态性能和单模态性能上都优于不使用 CKD 方法的模型,这表明 CKD 方法能够有效提高模型在多模态学习中的性能。

在这里插入图片描述

在Amazon-Clothing数据集上训练期间的性能曲线。阴影区域表示我们的方法的改进(最好用彩色显示)。

二、音视频语音识别中丢失导致的模态偏差对丢失视频帧鲁棒性的影响

AVSR 视听语音识别
ASR 自动语音识别

2.1 研究背景

研究背景:

  • 先进的视听语音识别(AVSR)系统在处理缺失视频帧的情况下表现出敏感性,性能甚至不如单模态模型。
  • 尽管在视频模态上应用常见的dropout技术可以增强对缺失帧的鲁棒性,但在处理完整数据输入时却会导致性能损失。

2.2 解决问题

研究解决的问题:

  • 论文探讨了为什么在视频训练数据上应用dropout策略虽然增强了对缺失视频模态的鲁棒性,但在处理完整数据输入时却导致性能下降的矛盾现象。
  • 研究了由dropout引起的模态偏差问题,特别是对音频模态的过度依赖,并提出了解决这一问题的方法。

2.3 实施方案

研究实施方案:

  1. 提出了模态偏差假设(Modality Bias Hypothesis, MBH),系统地描述了模态偏差与多模态系统中缺失模态的鲁棒性之间的关系。
  2. 提出了**多模态分布近似与知识蒸馏(Multimodal Distribution Approximation with Knowledge Distillation, MDA-KD)**框架,以减少对音频模态的过度依赖,同时保持性能和鲁棒性。
  3. 为了处理完全缺失的模态,采用了适配器(adapters)来动态切换决策策略。

2.4 文章摘要

  • 论文首先通过实验验证了dropout技术引入的模态偏差,发现这种偏差在隐藏的表示子空间中本质上表现为从多模态到单模态分布的转变。
  • 接着,提出了MBH来描述多模态系统中模态偏差对决策过程的影响,以及模态偏差与模态缺失鲁棒性之间的关系。
  • 为了改善AVSR在视频数据缺失时的鲁棒性,同时避免在完整输入时性能下降,提出了MDA-KD方法。该方法通过从相对无偏差的教师模型中提取隐藏知识,指导鲁棒学生模型的学习,以防止任务相关表示的分布转移到单模态分布。
  • 对于视频严重或完全缺失的情况,通过适配器动态切换决策偏差,以特定模态的表示为主导。
  • 通过在MISP2021和MISP2022数据集上的综合实验评估了所提方法的有效性。

2.5 文章贡献

论文的主要贡献包括:

  • 揭示了dropout引起的模态偏差,并发现它本质上是隐藏表示子空间中从多模态到单模态分布的转变。
  • 提出了MBH来系统描述多模态系统中模态偏差对决策过程的影响,以及模态偏差与模态缺失鲁棒性之间的关系。
  • 提出了MDA-KD框架来增强对缺失视频的鲁棒性,并避免在完整输入时性能下降。
  • 在MISP2021和MISP2022数据集上实现了顶级的AVSR性能,同时保持了对缺失视频帧的鲁棒性。

2.6 文章图示

图 1:不同dropout率下AVSR的CER退化曲线
  • 横坐标表示的是测试时视频帧的缺失率。这些数值(0.1、0.3、0.5、0.7)代表了在模型测试阶段,视频数据中被随机丢弃或缺失的视频帧的比例
    在这里插入图片描述

  • 这张图展示了在不同训练dropout率下,AVSR系统在面对缺失视频帧时的性能(以字符错误率CER表示)。

Dropout率是指在训练过程中随机“丢弃”(即用特殊的填充值,如零,替换)输入数据(在本文中是视频帧)的比例。例如:

0.1 表示在训练过程中有10%的视频帧数据被随机丢弃。
0.3 表示有30%的视频帧数据被随机丢弃。
0.5 表示有50%的视频帧数据被随机丢弃。
0.7 表示有70%的视频帧数据被随机丢弃。

  • 与没有dropout的基线AVSR系统(红色线)相比,应用dropout策略的其他AVSR系统在处理缺失输入时表现更好,但在处理完整数据输入时表现更差。
  • 随着训练dropout率的增加,AVSR的CER曲线逐渐趋向于单模态ASR的CER曲线(虚线)。

在视频帧上用不同的丢失率训练的AVSR的CER(以%计)退化曲线。与基线AVSR相比,无丢失(红色),其他AVSR系统在缺失输入时表现更好,但在完整数据输入时表现更差。随着训练脱落率的增加,AVSR的CER曲线逐渐收敛到ASR的CER曲线(虚线)。

图 2:ASR和AVSR转录相似性分析

在这里插入图片描述

  • 这两组图展示了随着训练dropout率的增加,ASR和AVSR识别转录的相似性如何变化。
  • 相似性通过相对CER(%)来衡量,其中ASR转录替代了基准真实转录。
  • 随着训练dropout率的增加,可以看到转录相似性增加,表明AVSR系统在dropout训练下越来越倾向于ASR的决策模式。
图 3:ASR和不同AVSR设置的中间表示相似性矩阵

在这里插入图片描述

AVSR 视听语音识别
ASR 自动语音识别

  • 这张图展示了ASR和不同AVSR配置之间中间层表示的余弦距离相似性矩阵
  • 对角线上的元素表示相同输入的中间表示之间的相似性。
  • 随着训练dropout率的增加,对角线变亮,表明AVSR多模态分布在潜在决策子空间中越来越接近ASR的单模态分布。

这通常表示的是两种不同系统的样本索引的对比。

AVSR sample indices指的是来自视听语音识别(Audio-Visual Speech Recognition)系统的样本索引。这些样本可能包括了音频和视频信息,用于训练或测试AVSR模型。

ASR sample indices:指的是来自自动语音识别 Automatic Speech Recognition)系统的样本索引。这些样本仅包括音频信息,没有视频信息。

图 4:模态偏差假设(MBH)的说明

在这里插入图片描述

  • 左侧子图展示了多模态系统中潜在决策特征的组成部分,采用维恩图的形式表示。
  • 右侧子图展示了随着训练dropout率的增加,决策偏差的动态过程
  • Dropout导致在音频上的一致性模态偏差,无论缺失的程度如何。

模态偏差假设(Modality Bias Hypothesis,MBH)在左侧子图中,潜在表征的任务相关分量(阴影部分)由Zsa、Zsv和Zg组成,分别表示音频特定的、视觉特定的决策特征和模态一般的决策特征。相应的比例用α、β和γ表示。右边的子图显示了一个决定性偏差的动态过程,随着训练退出率的增加。无论缺失的程度如何,丢弃都会导致音频上一致的模态偏差。

图 5:所提出的AVSR系统的整体框架

在这里插入图片描述

  • 展示了处理缺失视频帧和嘈杂语音的AVSR系统的整体框架。
  • 在MDA-KD中,从具有完整数据输入的教师模型的潜在分布中采样潜在知识,作为防止鲁棒性训练中dropout引起的模态偏差的锚点
  • 对于完全缺失的视频输入,激活MS-Adapter以实现动态决策切换。

拟议的AVSR系统的总体框架。我们解决了具有挑战性的现实世界中的场景,包括丢失的视频帧和嘈杂的语音,在训练和测试阶段的重叠率超过40%。在MDA-KD中,潜在知识是从具有完整数据输入的教师模型的潜在分布中采样的。这种潜在的知识作为一个锚点,以防止辍学引起的模态偏差在鲁棒性训练的学生网络。对于完全丢失的视频输入,MS适配器被激活以启用动态决策开关

  1. CA (Cross-Attention)

    • 交叉注意力(Cross-Attention)是一种注意力机制,它允许模型在处理一种类型的输入(如文本)时,考虑另一种类型的输入(如图像)的信息。这种机制在多模态学习中非常重要,因为它可以帮助模型学习不同模态之间的关联。
  2. FFN (Feed-Forward Network)

    • 前馈网络(Feed-Forward Network)是神经网络中的一种基本组件,它由一组全连接层(也称为线性层)组成,通常在卷积神经网络(CNN)和Transformer架构中使用。FFN可以学习输入数据的非线性表示。
  3. Conformer (Convolutional Transformer)

    • Conformer是一种结合了卷积神经网络(CNN)和Transformer架构优点的神经网络模型。它在处理序列数据时,通过使用卷积层来捕捉局部特征,同时使用Transformer的自注意力机制来捕捉全局依赖关系。Conformer在自然语言处理任务中,尤其是语音识别和机器翻译中表现出色。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/880330.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

科研绘图系列:R语言多个AUC曲线图(multiple AUC curves)

文章目录 介绍加载R包导入数据数据预处理画图输出结果组图系统信息介绍 多个ROC曲线在同一张图上可以直观地展示和比较不同模型或方法的性能。这种图通常被称为ROC曲线图,它通过比较不同模型的ROC曲线下的面积(AUC)大小来比较模型的优劣。AUC值越大,模型的诊断或预测效果越…

介绍 Agent Q:迎接下一代 AI 自动化助手

引言 在科技领域&#xff0c;随着人工智能的不断进步&#xff0c;自动化工具日益成为提升效率的重要手段。今天&#xff0c;我将向大家介绍一款名为 Agent Q 的 AI 自动化助手。这款工具不仅能够完成复杂的任务&#xff0c;还支持交互式命令行操作&#xff0c;使得用户体验更为…

Linux相关概念和重要知识点(8)(操作系统、进程的概念)

1.操作系统&#xff08;OS&#xff09; &#xff08;1&#xff09;基本结构的认识 任何计算机系统都包含一个基本的程序集合&#xff0c;用于实现计算机最基本最底层的操作&#xff0c;这个软件称为操作系统。操作系统大部分使用C语言编写&#xff0c;少量使用汇编语言。 从…

利用低代码快速搭建电商小程序之商品列表页

目标&#xff1a; 搭建商城的一个商品列表页面&#xff08;先做静态页&#xff09; 开发环境&#xff1a; 访问白码低代码平台&#xff1a;https://www.bnocode.com/ 白码的新自定义页功能&#xff08;使用vue框架&#xff09; 前期准备&#xff1a; 需要先准备商品数据表…

云手机的海外原生IP有什么用?

在全球数字化进程不断加快的背景下&#xff0c;企业对网络的依赖程度日益加深。云手机作为一项创新的工具&#xff0c;正逐步成为企业优化网络结构和全球业务拓展的必备。尤其是云手机所具备的海外原生IP功能&#xff0c;为企业进入国际市场提供了独特的竞争优势。 什么是海外原…

封装一个vue3的文件上传组件(拖拽或点击选择文件)

1. 效果 选择文件后: 2. 代码 <template><divclass"drop-zone c-normal":class"{borderOutline: outline,}"dragover.preventdrop.prevent"handleDrop"click"chooseFiles"><div v-if"files.length < 1"…

并查集 (Union-Find) :从基础到优化

并查集 (Union-Find) 并查集是一种树形数据结构&#xff0c;主要用于处理不相交集合&#xff08;Disjoint Set&#xff09;的合并和查询问题。它特别适用于解决有关连通性的问题&#xff0c;比如在图论中判断两点是否在同一个连通分量中。并查集可以高效地支持以下两种操作&am…

2024年数字化转型与管理国际学术会议(DTM 2024)

目录 重要信息 大会简介 大会组委 征稿主题 论文出版 会议议程 参会方式 重要信息 大会官网&#xff1a;www.icemme.org&#xff08;点击了解大会&#xff0c;投稿等详细信息&#xff09; 大会时间&#xff1a;2024年11月22-24日 大会地点&#xff1a;中国-大连 大会…

Cloudflare为网站添加AI审计 可检查AI爬虫何时抓取和抓取频次以及直接屏蔽爬虫

网络服务提供商 Cloudflare 宣布即日起为所有网站 (包括免费托管的网站) 带来 AI 审计功能&#xff0c;该功能目前处于测试阶段&#xff0c;可以分析 AI 公司的爬虫和抓爬数据。新的 AI 审计工具 (Cloudflare AI Audit) 主要提供 AI 公司的爬虫何时到网站来抓取数据、抓取的数据…

【Rust练习】16.模式

文章题目来自&#xff1a;https://practice-zh.course.rs/pattern-match/patterns.html 1 &#x1f31f;&#x1f31f; 使用 | 可以匹配多个值, 而使用 … 可以匹配一个闭区间的数值序列 fn main() {} fn match_number(n: i32) {match n {// 匹配一个单独的值1 > println!(…

16. C++ TinyWebServer项目总结(16. 服务器调制、调试和测试)

主要包括&#xff1a; 使用 tcpdump 抓包&#xff1b;使用 gdb 调试器&#xff1b;使用压力测试工具&#xff0c;模拟现实世界中的高并发请求&#xff0c;测试服务器在高压状态下的稳定性。 最大文件描述符数 Linux 对应用进程能打开的最大文件描述符数量有两个层次的限制&a…

4. 数据结构: 对象和数组

数字、布尔值和字符串是构建数据结构的原子。不过&#xff0c;许多类型的信息需要不止一个原子。对象允许我们对值&#xff08;包括其他对象&#xff09;进行分组&#xff0c;从而构建更复杂的结构。到目前为止&#xff0c;我们所构建的程序都受到限制&#xff0c;因为它们只能…

软件设计模式——工厂模式

软件设计模式——工厂模式 文章目录 软件设计模式——工厂模式一、设计模式的认知1.1 什么是软件设计模式&#xff1a;1.2 为什么要学习设计模式&#xff1a;1.3 设计模式的分类&#xff1a; 二、工厂模式2.1 工厂模式实例&#xff1a; 一、设计模式的认知 1.1 什么是软件设计…

WordPress LearnPress插件 SQL注入复现(CVE-2024-8522)

0x01 产品描述&#xff1a; LearnPress 是一款功能强大的 WordPress LMS&#xff08;学习管理系统&#xff09;插件&#xff0c;适用于创建和销售在线课程。凭借其直观的界面和丰富的功能&#xff0c;无论您是否具备编程背景&#xff0c;都能轻松搭建起在线教育网站。学会如何使…

Java之路--瓦解逻辑控制与方法使用已是瓮中捉鳖

嗨嗨大家&#xff01;今天我们来学习逻辑运算和方法的使用~ 目录 一 逻辑控制 1 分支结构 1.1 if语句 1.2 switch 语句 2 循环结构 2.1 while 循环 2.2 for 循环 2.3 do while 循环 2.4 break 2.5 continue 3. 输出输入 二、方法的使用 1 方法定义语法 2 实参和…

网络通信——DHCP

目录 一.DHCP应用场景 二.通信过程 三.DHCP报文 四.DHCP通信原理 &#xff08;1&#xff09;租借过程 &#xff08;2&#xff09;DHCP 租期更新 &#xff08;3&#xff09;DHCP重绑定 五.一般路由器的DHCP支持两种地址池 &#xff08;1&#xff09;接口地址池 &…

进制转换,原码反码补码

正数的三码合一 1个byte8位&#xff0c;-128符号位溢出了&#xff0c;所以是1000 0000

基于Python大数据的B站热门视频的数据分析及可视化系统

作者&#xff1a;计算机学姐 开发技术&#xff1a;SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等&#xff0c;“文末源码”。 专栏推荐&#xff1a;前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码 精品专栏&#xff1a;Java精选实战项目…

全连接神经网络

这里写目录标题 全连接神经网络vs前馈神经网络基于全连接神经网络的手写数字识别使用Pytorch实现纯Python实现 全连接神经网络的局限 端到端学习 深度学习有时也称为端到端机器学习&#xff08;end-to-end machine learning&#xff09;。这里所说的端到端是指从一端到另一端的…

David律所代理Jose Martin幽默水果版权首发维权,尚未TRO

案件基本情况&#xff1a;起诉时间&#xff1a;2024/9/18案件号&#xff1a;2024-cv-08484原告&#xff1a;Jose Martin原告律所&#xff1a;David起诉地&#xff1a;伊利诺伊州北部法院涉案商标/版权&#xff1a;原告品牌简介&#xff1a;西班牙的卓越艺术家Jose Martin以他非…