CoShNet:使用复数改进神经网络

  

使用复数改进神经网络

文章目录

  • 一、说明
  • 二、了解卷积神经网络
  • 三、进入混合神经网络
  • 四、令人惊叹的 CoSh 网络
  • 五、复杂函数的神奇性质
  • 六、相位一致性
  • 七、结论

一、说明

   本文题为“CoShNet:使用Shearlets的混合复杂值神经网络”,提出了在混合神经网络中使用复杂函数的方法。如果你对这些话感到非常困惑,在本文中,我将解释混合神经网络的概念,以及如何使用它们来改进传统的卷积神经网络。然后,我们将介绍如何使用复杂函数来进一步提高这些模型的性能。这将是一个非常有趣的过程。

   由此产生的网络称为复杂剪切网络 (CoShNet)。它在 Fashion-MNIST 上针对 ResNet-50 和 Resnet-18 进行了测试,分别获得了 92.2% 和 90.7% 和 91.8% 的分数。与ResNet-18相比,所提出的网络具有49.9k参数,参数为11.18m,使用的FLOP减少了52倍。最后,我们在不到 20 个 epoch 中进行了训练,而 ResNet 需要 200 个 epoch,并且不需要任何超参数调整或正则化。

  •    如果您正在寻找对这个想法感到兴奋的理由。

二、了解卷积神经网络

   卷积神经网络自诞生以来一直是OG计算机视觉架构。事实上,CNN的基础比我还要古老。CNN实际上是为视觉而生的。
在这里插入图片描述

   特征提取是真正的CNN革命。摘自 IBM 关于 ConvNets 的文章
   那么CNN有什么好处呢?卷积神经网络背后的主要思想是它们逐段浏览图像,并从中提取主要特征。CNN 的早期图层通常会提取更粗糙的特征,例如边缘和颜色。但是,添加更多图层允许以非常高的细节分辨率提取特征。
在这里插入图片描述

   CNN 使用滑动窗口技术来构建其特征图。正如你所看到的,好的机器学习需要好的软件工程。图片来源
   本文将更详细地介绍CNN。就我们的目的而言,有一件事很重要:CNN一直是计算机视觉的首选,主要是因为它们能够构建特征图。 即使随着视觉变形金刚的兴起,CNN 仍然保持强劲(前提是您使用下面给出的技术对管道进行现代化改造)。

   目前为止,一切都好。那么有什么收获呢?他们的方法存在一个问题。卷积(构建特征图)可能会变得非常昂贵。

三、进入混合神经网络

   如果你学过一点计算机科学(你应该在ML上做得很有效),你就会对特征映射过程有所了解。它真的很贵。您必须多次滑动窗口。正如我们已经说过的,早期的图层只提取了粗略的特征。高分辨率特征仅在后面的级别中被发现。这是一些真正聪明的人看到机会的地方。如果我们做一些数学运算来找到一个可以帮助我们直接发现一些低级特征的函数呢? 这样,我们就可以发现特征,而无需经历昂贵的早期卷积——

   在混合神经网络中,昂贵的卷积层被不可训练的固定变换所取代,参数大大减少。

   如果你能找到一个好的函数,那么你就大大减少了你的计算开销。我们有一些很棒的功能可以做到这一点。事实证明,复杂函数效果更好。请看下图和结果的差异。

在这里插入图片描述

   这张图片是进入下一节的完美续集。现在让我们来谈谈复杂函数为我们的神经网络带来的所有优势,以及为什么它们首先能如此出色地工作。其中一些可能会变得非常数学化,但如果你有这种感觉,一定要闭上眼睛,想想 Twitter 上的深度学习兄弟告诉你的机器学习不需要数学。真正的机器学习是关于将大模型过度拟合到整洁的数据中,而不是这种技术性的数学知识(涉及大量实验)。

   因此,让我们进入混合网络中的复杂函数(特别是复杂剪切函数)。
在这里插入图片描述

   混合神经网络和本文背后的基本思想

四、令人惊叹的 CoSh 网络

   在我进入细节之前,这里简要介绍了这个网络可以完成的一些令人惊奇的事情。这应该告诉你为什么我要介绍这个想法(并希望说明为什么我周末会阅读随机的 ML 论文)。

在这里插入图片描述

   你已经知道我对这些结果感到非常兴奋。使用 Math 构建的经济高效的 ML 解决方案?一个概括得很好?我只是打这个就很兴奋。然而,真正让我印象深刻的一件事是该网络对噪声和扰动的适应能力。这是我从开始写作以来一直在报道的内容,这些结果非常令人兴奋,可以解决这个问题。

   看看这张图,他们用干净和受干扰的数据集的排列来测试网络。结果非常稳定,特别是考虑到相对较小的训练数据集大小。我通常期望更大的数据集具有这种鲁棒性。
在这里插入图片描述

   煽风点火,为什么会这样?是什么原因可以如此有效?这是侥幸,还是复杂函数有什么效果很好的东西?
在这里插入图片描述

   如果我们能够理解是什么让这些惊人的结果发挥作用,我们就可以创造出更好的解决方案。
   让我们继续讨论为什么复杂函数可能是深度学习的下一个飞跃。

   这与最近的一篇论文形成鲜明对比[41]“…共同优化架构和培训程序的必要性:…拥有相同的培训程序不足以比较不同架构的优点。这与人们想要的相反——针对不同数据集和模型的简单、可靠的训练程序。

   — 作者表明,调整和昂贵的搜索并不是唯一的方法。

五、复杂函数的神奇性质

   有一些非常有趣的特性使复杂神经网络与众不同。首先,我们来谈谈决策边界。复杂神经元创建以下边界-

在这里插入图片描述

   这没什么奇怪的。然而,这带来了一些有趣的属性,尤其是泛化。根据作者的说法——

   CVnn 的决策边界由两个正交相交的超曲面组成(图 7),并将决策区域划分为四个相等的部分。此外,3层CVnn的决策边界几乎保持正交[27]。这种正交性改善了泛化。例如,几个不能用单个真实神经元解决的问题(例如 Xor),可以使用正交属性用单个复值神经元求解

   对我来说,下一个突出的是马鞍点的存在。鞍点出现在多变量函数中。它们是函数既不达到局部最大值也不达到局部最小值的临界点。
在这里插入图片描述

图片来源
   为什么这很重要?在鞍点处,损失函数的导数仍然等于 0。然而,正如作者所指出的,“具有随机inits的SGD可以在很大程度上避免鞍点[29] [30],但不是局部最小值。这种行为可能允许更快的收敛,因为算法不会卡在局部最小值中。这种方法提供了与集成随机重启以对更大的搜索空间进行采样非常相似的好处。作者甚至提到,这个CoShNet不需要数据增强来达到稳定嵌入(关于扰动)。

在这里插入图片描述

   如果您有使用 split-ReLU 的经验,请告诉我。
   这两个属性都朝着同一个方向起作用——它们允许网络以更少的资源实现更多的目标。
在这里插入图片描述

   最后一个属性值得拥有自己的部分。是时候进入相位一致性以及它如何帮助对抗鲁棒性了。

六、相位一致性

   在电子信号中,相位是波形周期上时间点(瞬时)位置的定义。相位也可以是具有相同频率的波之间或波之间的相对位移的表达(源)。该视频提供了视觉表示。相位在信号处理中非常重要。

   如果相位在扰动后可以保持稳定,那么我们就可以提取出稳定的特征。这与我之前分享的麻省理工学院关于为什么会发生扰动的分析论文非常吻合。“CoShRem 可以提取对比度不变的稳定特征——边缘、脊和斑点。在图6.b中,我们可以看到通过使用相位一致性,图像中关键特征的稳定和稳健(不受噪声和对比度变化的影响)定位。
在这里插入图片描述

   渐变在尺度上波动很大,但在图像的关键部分,相位仍然非常稳定。这使得相位成为检测重要特征的重要基础。
   在检测施加扰动的图像中的特征(及其大小)时,这非常有效。
在这里插入图片描述

   “图4显示,尽管存在相当大的扰动(模糊和高斯噪声),但CoShRem对大多数特征边缘和脊(近距离的两步不连续)保持稳定。”
   这种阶段一致性在创建健壮的模型方面创造了奇迹。我很想看看这种性能如何与更专业的对抗性网络(如单像素攻击)相媲美。这将是对稳健性的真正考验。

   我想多谈谈这个问题,但其中很多都与信号处理有关。我对此一无所知。我有足够的数学知识来浏览和理解主要的想法/推导,但我并不完全相信我理解有关相位和复杂小波的一些细节。如果您对此主题有任何经验/资源,请在评论中留言。我很想向你学习。

   在这篇论文之后,我将更多地研究复杂的函数和分析,因为它看起来非常强大。期待后续跟进,提供有关复杂功能如何在网络中使用的更多细节/想法。如果您有任何问题/说明,可以联系 Manny Ko。他是苹果公司的首席工程师,也是本文的作者之一。他与我分享了这篇文章,并且绝对比我更了解这个主题。
在这里插入图片描述

七、结论

   神经网络CNN的最大不妥之处在于只能解实数方程,这意味着对于频率较高的信号只能pass掉,这极大妨碍图像信息提取的详细精致性。本文引出 CoSh 网络,这种网络特点就是兼顾震荡的信号、周期性信号等,此更能保留图像细节。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/13911.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入理解SVM和浅层机器学习算法的训练机制

深入理解SVM和浅层机器学习算法的训练机制支持向量机(SVM)的训练过程SVM的基本概念SVM的损失函数训练方法 浅层机器学习算法的训练机制决策树K-最近邻(K-NN)朴素贝叶斯 结论 深入理解SVM和浅层机器学习算法的训练机制 在探讨浅层…

nrf52832自定义蓝牙名字过长,广播显示不全

自定义蓝牙名字过长,广播显示不全 原因:nrf52832默认使用蓝牙4.x的广播,它的广播包数据只有32byte数据,当广播已经包含足够多的数据的时候,广播每次过长就会显示部分名称,即便你选择"BLE_ADVDATA_FULL_NAME"…

Python学习---基于多任务协程的并发下载器案例

目标:使用协程实现网络图片的下载(适合网络io) 多进程: 密集CPU任务,需要充分使用多核CPU资源(服务器,大量的并行计算)的时候,用多进程。 缺陷:多个进程之间通…

Python基础学习笔记(六)——列表

目录 一维列表1. 索引的查询与返回2. 切片3. 添加元素4. 删除元素5. 更改元素6. 排序7. 生成式 一维列表 列表,也称数组,是一种有序、可变、允许重复元素的组合数据结构,属于可变序列,由方括号[]内、用逗号分隔的一组元素组成。 列…

【Clickhouse】DB::Exception: Table is in readonly mode问题解决

1. 问题描述 公司电力检修&#xff0c;机房断电再上电之后clickhouse的一张表出现了只读现象 2024.05.20 16:58:08.702472 [ 173655 ] {17C25AD8068BBE9A} <Error> executeQuery: Code: 242, e.displayText() DB::Exception: Table is in readonly mode (version 20.5…

展现金融科技前沿力量,ATFX于哥伦比亚金融博览会绽放光彩

不到半个月的时间里&#xff0c;高光时刻再度降临ATFX。而这一次&#xff0c;是ATFX不曾拥有的桂冠—“全球最佳在线经纪商”(Best Global Online Broker)。2024年5月15日至16日&#xff0c;拉丁美洲首屈一指的金融盛会—2024年哥伦比亚金融博览会(Money Expo Colombia 2024) 于…

【华为OD机试-C卷D卷-200分】文本统计分析(C++/Java/Python)

【华为OD机试】-(A卷+B卷+C卷+D卷)-2024真题合集目录 【华为OD机试】-(C卷+D卷)-2024最新真题目录 题目描述 有一个文件,包含以一定规则写作的文本,请统计文件中包含的文本数量。 规则如下: 文本以 ";" 分隔,最后一条可以没有 ";" ,但空文本不能算…

数据对大模型预训练效果的影响

文章目录 数据数量的影响数据质量的影响数据集污染数据预处理实践 在训练大语言模型的过程中&#xff0c;预训练数据的质量对模型能力的影响至关重要。已有的研究表明&#xff0c;基于含有噪音、有毒和重复数据的低质量语料库进行预训练&#xff0c;会严重损害模型性能。 数据…

hdfs机器下线维修

HDFS&#xff08;Hadoop Distributed File System&#xff09;是Hadoop分布式文件系统&#xff0c;它设计用来跨多个物理服务器存储大量数据。当HDFS集群中的某个机器需要下线维修时&#xff0c;需要谨慎处理以避免数据丢失或服务中断。以下是处理HDFS机器下线的步骤&#xff1…

[C][C运算][取模/取余运算][隐式类型转换][算术转换]详细讲解

目录 1.取模/取余运算1.取整2.取模 2.隐式类型转换3.算术转换 1.取模/取余运算 1.取整 C语言默认向0取整 – trunc()同作用floor() -> 向-∞取整ceil() -> 向∞取整round() -> 四舍五入 2.取模 定义&#xff1a;如果a和d是两个自然数&#xff0c;d非零&#xff0c…

AI智能体|使用扣子Coze基于IDE创建自定义插件

大家好&#xff0c;我是无界生长。 在使用Coze的过程中&#xff0c;有些个性化场景无法通过插件商店已有的插件满足&#xff0c;这个时候就需要通过自定义插件的方式来实现业务需求。下面将通过一个实际案例来简单介绍下如何使用Coze基于IDE创建自定义插件&#xff0c;完成在Co…

Godot游戏引擎有哪些优势

哈喽呀&#xff0c;大家好呀&#xff0c;淼淼又来和大家见面啦&#xff0c;众所周知在当今游戏开发领域&#xff0c;各种游戏引擎如雨后春笋般涌现&#xff0c;为开发者提供了丰富的选择。而在这些众多的选择中&#xff0c;Godot游戏引擎以其独特的特性和开放源代码的优势&…

java.util.ConcurrentModificationException异常分析及解决

问题描述 有一个RecycleView视图组件&#xff0c;数据变更得时候进行了增加和删除操作&#xff0c;频繁触发 增加、删除数据得操作&#xff0c;低概率出现此问题&#xff0c;代码片段无法展示&#xff0c;可以语言描述一下代码片段 recycleview使用了adapter来展示数据adapte…

SpringBoot集成腾讯云敏感词校验API流程

1.pom.xml中引入腾讯云jar配置信息 <dependency><groupId>com.tencentcloudapi</groupId><artifactId>tencentcloud-sdk-java</artifactId><version>4.0.11</version> </dependency> 2.application.yaml中添加配置 tencent…

2024最新流媒体在线音乐系统网站源码| 音乐社区 | 多语言 | 开心版

简介&#xff1a; 2024最新流媒体在线音乐系统网站源码| 音乐社区 | 多语言 | 开心版 下载地址 https://www.kuaiyuanya.com/product/article/index/id/33.html 图片&#xff1a;

Microsoft.NET 框架程序设计 —— 基元类型、引用类型与值类型

本文讨论.NET 框架开发人员经常遇到的各种数据类型。熟悉这些类型的不同行为对于一个开发人员来说至关重要。当我刚开始接触.NET框架时,就没有完全理解基元类型、引用类型和值类型之间的一些差别。这种模糊的认识甚至无意间导致了一些难以査找的bug以及性能问题。我希望通过本…

【QT】实时语言切换

前言&#xff1a;一个完整的软件开发通常需要支持多种语言&#xff0c;本文主要讲述实时语言切换开发时的相关解决方案。 1. 制作字库文件 添加标识 在需要被翻译的字符串前面标识tr&#xff0c;如QString str&#xff1d;tr(“hello,world!”); &#xff0c;这很重要&#xf…

使用 Django Rest Framework 构建强大的 Web API

文章目录 安装 Django Rest Framework创建序列化器创建视图和 URL 路由配置认证和权限测试 API Django Rest Framework&#xff08;DRF&#xff09;是一个强大的工具&#xff0c;用于在 Django Web 框架中构建灵活且功能丰富的 Web API。它提供了许多功能&#xff0c;包括序列化…

ubuntu22.04 kubeadm安装k8s集群(从零到有)

ubuntu kubeadm安装k8s集群 前言一、初始化所有ubuntu服务器二、安装kubeadm三、kubeadm初始化节点、加入集群四、安装kubesphere1、下载yaml文件2、运行apply报错3、安装完成。4、忘记密码,强制修改5、Kubesphere其他组件安装前言 k8s 三master 三node所有节点hosts文件添加…

android radiongroup应用举例

android radiongroup应用举例 在 Android 中&#xff0c;RadioGroup 是一个特殊的布局容器&#xff0c;用于包含多个 RadioButton 控件。这些 RadioButton 通常一起使用&#xff0c;以便用户可以从一组选项中选择一个。当用户选择其中一个 RadioButton 时&#xff0c;其他 Rad…