【持续学习系列(八)】《Continual Learning Through Synaptic Intelligence》

一、论文信息

1 标题

Continual Learning Through Synaptic Intelligence

2 作者

Friedemann Zenke, Ben Poole, Surya Ganguli

3 研究机构

Stanford University

二、主要内容

论文探讨了如何在人工神经网络(ANNs)中实现持续学习(continual learning),即在不断变化的数据分布中学习新任务时,如何避免遗忘旧任务。论文指出,尽管深度学习在许多应用领域取得了显著进展,但在数据分布随学习过程变化的领域中表现不佳。相比之下,生物神经网络能够不断适应变化的领域,可能通过复杂的分子机制同时解决多个任务。研究者引入了“智能突触”(intelligent synapses)的概念,将一些生物复杂性引入到ANNs中。每个突触随时间积累与任务相关的信息,并利用这些信息快速存储新记忆,同时不遗忘旧记忆。论文在分类任务的持续学习上评估了这种方法,并展示了它在保持计算效率的同时显著减少了遗忘。

三、相关研究

论文提到了解决灾难性遗忘(catastrophic forgetting)问题的一些先前研究,这些研究可以分为三类:(1)架构方法,通过改变网络结构来减少任务间的干扰;(2)功能方法,通过在目标函数中添加正则化项来惩罚神经网络输入输出函数的变化;(3)结构方法,通过对参数施加惩罚来鼓励它们保持接近旧任务的参数。

四、解决方案

论文提出了一种新的突触框架,其中每个突触都跟踪过去和当前的参数值,并维护一个在线估计,即突触在解决过去遇到的问题时的“重要性”。这种重要性度量可以在训练期间高效且局部地计算,并代表了每个突触对全局损失变化的局部贡献。当任务变化时,通过防止重要突触在未来任务中发生变化来巩固它们,从而主要通过对过去任务不重要的突触进行学习,避免灾难性遗忘。

  1. 突触重要性度量( ω k µ ω^µ_k ωkµ

    • 突触重要性度量 ω k µ ω^µ_k ωkµ反映了单个突触 θ k θ_k θk对任务 µ µ µ目标函数 L µ L_µ Lµ改进的贡献。这个度量是通过在线计算得到的,即在训练过程中不断更新。
    • ω k µ ω^µ_k ωkµ的计算基于梯度和参数更新的乘积,即 ω k µ = − ∫ g k ( t ) θ ′ k ( t ) d t ω^µ_k = -∫ gk(t)θ^{\prime} k(t)dt ωkµ=gk(t)θk(t)dt,其中 g k ( t ) g_{k(t)} gk(t)是梯度, θ ′ k ( t ) θ^{′}k(t) θk(t)是参数更新。
  2. 累积重要性度量( Ω k µ Ω^µ_k Ωkµ

    • 累积重要性度量 Ω k µ Ω^µ_k Ωkµ是突触重要性度量 ω µ k ωµk ωµk的累积版本,它代表了突触在解决过去任务时的总贡献。
    • Ω k µ Ω^µ_k Ωkµ的计算涉及到参数更新的路径积分,即 Ω k µ = ∑ ν < µ ω ν ( k ) Ω^µ_k = ∑_{ν<µ}^ων(k) Ωkµ=ν<µων(k)
  3. 突触状态的动态性

    • 突触状态不仅仅是一个单一的权重值,而是一个高维的动态系统,能够随时间积累任务相关的信息。
  4. 突触巩固(Consolidation)

    • 在新任务的学习过程中,通过引入一个代理损失函数˜Lµ,来近似先前任务的累积损失函数 L ( ν ) ( ν < µ) L(ν)(ν < µ) L(ν)ν<µ
    • 代理损失函数确保在新任务的学习中,对过去重要突触的变化进行惩罚,从而避免灾难性遗忘。
  5. 理论分析

    • 文章通过理论分析展示了在特定情况下,Q矩阵(用于计算突触重要性度量的矩阵)可以简化为Hessian矩阵,这表明突触重要性度量与参数空间中的几何结构有关。
  6. 实验验证

    • 在实验中,通过在不同的数据集上测试智能突触框架,论文证明了这种方法能够有效地减少遗忘,并在多个任务上保持高准确率。

通过这些公式和概念,论文提出了一种在线计算突触重要性的方法,并利用这些信息来调整学习过程,以实现在不断变化的数据分布中持续学习的目标。这种方法的核心在于,通过突触的动态性和重要性度量,能够在学习新任务时保护旧任务的记忆。

五、实验环节

论文在分割MNIST、置换MNIST以及分割CIFAR-10/CIFAR-100数据集上进行了实验。实验结果表明,与传统的梯度下降(SGD)和带有dropout的SGD相比,提出的智能突触方法在保持旧任务性能的同时,学习新任务的能力更强。

六、进一步探索点:

论文提出了将生物突触的复杂性引入ANNs的新方向,这可能需要进一步探索如何为突触赋予更复杂的动态属性,以便智能地控制神经网络的学习动态。此外,智能突触的概念可能还可以应用于其他机器学习问题,如在线学习和迁移学习。

七、总结

论文通过引入智能突触的概念,提出了一种新的持续学习方法,该方法通过让每个突触估计其对解决过去任务的重要性,并惩罚变化最重要的突触,从而在不断变化的数据分布中实现新任务的学习,同时最小化对旧任务的遗忘。实验结果表明,这种方法在多个数据集上都表现出了良好的性能,为解决灾难性遗忘问题提供了一种新的视角。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/599732.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

英飞凌TC3xx之一起认识GTM(十)详细说说GTM子模块TIM

英飞凌TC3xx之一起认识GTM(十)详细说说GTM子模块TIM 1 TIM简介1.1 输入源选择寄存器INPUTSRCx1.2 外部捕捉源选择寄存器 EXTCAPSRCx2 TIM通道2.1 TIM通道架构2.2 TIM通道模式3 总结编者话:GTM的定时器输入模块TIM是经常被使用的模块,因为它简单易用。它可以接入多种源,包括…

Qt元对象系统Meta-Object System

元对象系统 元对象系统是一个基于标准C++的扩展,为Qt提供了信号与槽机制、实时类型信息、动态属性系统。 元对象系统的三个基本条件:类必须继承自QObject、类声明Q_OBJECT宏、元对象编译器moc。 Qt元对象编译器(Moc)是Qt框架中的一个重要工具,用于处理Qt特有的元对象系统…

快递物流怎么寄最便宜?你一定要知道的5个方法 !

家人们&#xff0c;临近年关&#xff0c;大家的钱包是不是鼓鼓的了&#xff0c;难免的亲戚朋友之间会相互寄送一些东西&#xff0c;所以最近因为需要经常寄快递物流&#xff0c;小编所以特地整理了5个我们平时个人寄快递便宜的方法攻略&#xff0c;推荐第五个&#xff0c;实用干…

【Java集合篇】HashMap 在 get 和 put 时经过哪些步骤

HashMap在get和put时经过哪些步骤? ✔️ 典型解析✔️get方法✔️put方法✔️ 拓展知识仓✔️ HashMap如何定位key✔️ HashMap定位tablelndex的骚操作作✔️HashMap的key为null时&#xff0c;没有hashCode是如何存储的?✔️ HashMap的value可以为null吗? 有什么优缺点讷? …

群太多,有什么办法可以定时、批量、标签分类群发的吗?

你或许会遇到微信群组过多而导致管理困难等问题吗&#xff1f;对于如何高效地管理众多微信群组&#xff0c;实现分类管理同样具有不可忽视的重要性。 实际上&#xff0c;对此问题小编收到了部分朋友的疑问&#xff1a;“既然可以为微信好友添加标签&#xff0c;那为何不能为微…

数据库定义和操作语句的重要语法

数据库&#x1f4ca;的10种语法 数据查询语句 select : 用于从数据库中检索数据。 select column1, column2,.... from table_name where condition; select distinct : 用于从数据库中检索唯一的数据值。 select DISTINCT column1, clumn2,... from table_name; 工作原理…

torch.meshgrid和np.meshgrid的区别

numpy中meshgrid&#xff1a; 把数组a当作一行&#xff0c;再根据数组b的长度扩充行。 把数组b当作一列&#xff0c;再根据数组a的长度扩充列。 torch中meshgrid&#xff1a; 把数组a当作一列&#xff0c;再根据数组b的长度扩充列。 把数组b当作一行&#xff0c;再根据数组a的…

CAVER: Cross-Modal View-Mixed Transformer for Bi-Modal Salient Object Detection

目录 一、论文阅读笔记&#xff1a; 1、摘要&#xff1a; 2、主要贡献点&#xff1a; 3、方法&#xff1a; 3.1 网络的总体框架图&#xff1a; 3.2 Transformer-based Information Propagation Path (TIPP) 3.3 Intra-Modal/Cross-Scale Self-Attention (IMSA/CSSA) Q1…

onxxruntime使用cuda以及tensorrt进行加速

1、版本匹配 版本需要匹配&#xff0c;不然运行会报错 2、onnxruntime之tensorrt加速 方式一&#xff1a; OrtTensorRTProviderOptions trt_options{}; trt_options.trt_max_workspace_size 2147483648; trt_options.trt_max_partition_iterations 10; trt_options.trt_m…

kali-Linux安装ARL灯塔教程以及timeout of 20000ms exceeded 的解决方法

FLAG&#xff1a;别和妈妈诉苦&#xff0c;她帮不上&#xff0c;也睡不着。 专研方向: docker&#xff0c;ARL资产灯塔系统 每日emo&#xff1a;天冷了&#xff0c;你还在坚持吗&#xff1f; 欢迎各位与我这个菜鸟交流学习 kali安装ARL灯塔教程 1.安装docker环境&#xff0c;…

【MySQL】orderby/groupby出现Using filesort根因分析及优化

序 在日常的数据库运维中&#xff0c;我们可能会遇到一些看似难以理解的现象。比如两个SQL查询语句&#xff0c;仅仅在ORDER BY子句上略有不同&#xff0c;却造成了性能的天壤之别——一个飞速完成&#xff0c;一个则让数据库崩溃。今天就让我们围绕这个问题&#xff0c;深入剖…

LeetCode每日一题 | 1944. 队列中可以看到的人数

文章目录 队列中可以看到的人数题目描述问题分析程序代码&#xff08;Golang 版本&#xff09; 队列中可以看到的人数 题目描述 原题链接 有 n 个人排成一个队列&#xff0c;从左到右 编号为 0 到 n - 1 。给你以一个整数数组 heights &#xff0c;每个整数 互不相同&#xff…

Mysql的安装配置教程(非常详细)从零基础入门到精通,看完这一篇就够了

首先简单概述分为几个步骤&#xff1a; 一、下载Mysql 二、安装Mysql 三、验证Mysql安装是否成功 四、 配置环境变量 五、验证配置环境变量是否成功 一、下载Mysql 要在Windows或Mac上安装MySQL&#xff0c;首先从MySQL官方网站下载最新的MySQL Community Server版本&am…

QCharView使用

QChart是 QGraphicsWidget的子类。 QCharView是QGraphicsView的子类 QCharView概念:title、系列、图标Chart、视图 说明: 需要添加Qt组件charts 在使用QChart或者QChartView之前需要添加宏定义QT_CHARTS_USE_NAMESPACE &#xff08;其实是使用了命名空间&#xff09;&#xff…

Baumer工业相机堡盟工业相机如何联合NEOAPI SDK和OpenCV实现相机图像转换为Mat图像格式(C++)

Baumer工业相机堡盟工业相机如何通过NEOAPI SDK实现相机掉线自动重连&#xff08;C&#xff09; Baumer工业相机Baumer工业相机的图像转换为OpenCV的Mat图像的技术背景在NEOAPI SDK里实现相机图像转换为Mat图像格式联合OpenCV实现相机图像转换为Mat图像格式测试演示图 工业相机…

SQL-取连续日期或者数值

从LVV_START_TIMEKEY开始&#xff0c;取LVV_END_TIMEKEY - LVV_START_TIMEKEY 1个连续的日期&#xff1a; SELECTTO_DATE (:LVV_START_TIMEKEY,YYYYMMDD) ROWNUM-1 AS wwm FROMDUAL CONNECT BYROWNUM < LAST_DAY (TO_DATE (:LVV_END_TIMEKEY,YYYYMMDD)) - TO_DATE (:LVV_…

大容量交流中间继电器RXMK1 RK225052 220VAC 板前接线带座 JOSEF约瑟

系列型号&#xff1a; RXMK1 RK 255 049大容量交流中间继电器 RXMK1 RK 255 050大容量交流中间继电器 RXMK1 RK 255 051大容量交流中间继电器 RXMK1 RK 255 052大容量交流中间继电器 RXMK1 RK 255 053大容量交流中间继电器 RXMK1大容量交流中间继电器 一、 用途及工作原理 RX…

【深入理解 ByteBuf 之一】 release() 的必要性

引言 开个新坑 【深入理解 ByteBuf】 至于为什么&#xff0c;本篇就是原因 我大概会花一个较长的时间来剖析 Netty 对于 ByteBuf 的实现&#xff0c;对象池的设计&#xff0c;从分配到释放重用&#xff0c;希望可以借此学习理解对象池的设计思想&#xff0c;以及搞清楚&#x…

XTU OJ 1525瓷片

题意 给定一个2n的地面&#xff0c;用11和1*2的瓷片铺满&#xff0c;问有多少种方案 数据范围 n<30 输入 3 1 2 30 输出 2 7 1084493574452273 代码 #include<stdio.h>int main() {int t;scanf("%d",&t);long long a[40];a[0]1,a[1]2,a[2]7;fo…

Vue 3.4 发布

本文为翻译 原文地址&#xff1a;Announcing Vue 3.4 | The Vue Point — Vue 3.4 发布公告 |Vue 点 (vuejs.org) 今天&#xff0c;我们很高兴地宣布 Vue 3.4 “&#x1f3c0;灌篮高手”的发布&#xff01; 此版本包括一些实质性的内部改进 - 最引人注目的是重写的模板解析器&…