激活函数(Activation Function)

定义

  • 激活函数( A c t i v a t i o n F u n c t i o n Activation\ Function Activation Function)是一种添加到人工神经网络中的函数,旨在帮助网络学习数据中的复杂模式。在神经网络中,除了输入层外,隐藏层和输出层的每个神经元都配备有一个激活函数。这个函数的作用是将神经元的输入(即来自前一层神经元的加权和)映射到输出端,并引入非线性因素,使得神经网络能够学习和理解复杂的非线性函数。

作用

引入非线性因素:

  • 激活函数的主要作用之一是向神经网络引入非线性因素,以解决线性模型表达能力不足的缺陷。没有激活函数的神经网络,其每一层输出都是上层输入的线性函数,这限制了神经网络的表达能力和学习能力。而激活函数通过其非线性特性,使得神经网络可以逼近任意复杂的非线性函数。

执行数据归一化:

  • 激活函数还能执行数据的归一化,将输入数据映射到某个范围内,再往下传递。这样做的好处是可以限制数据的扩张,防止数据过大导致的溢出风险。

改变数据的线性关系:

  • 激活函数的存在使得神经网络的“多层”有了实际的意义。通过改变数据的线性关系,激活函数使得神经网络可以学习复杂的事物、复杂的数据以及表示输入输出之间非线性的复杂任意函数映射。

增强网络能力:

  • 引入激活函数后,神经网络可以学习并表示更广泛的函数映射关系,这极大地增强了神经网络的学习能力和适应性。

常见激活函数

  1. S i g m o i d Sigmoid Sigmoid函数:
    公式 ( f ( x ) = 1 1 + e − x ) (f(x) = \frac{1}{1 + e^{-x}}) (f(x)=1+ex1)
    特点
    输出范围在 [ 0 , 1 ] [0, 1] [0,1]之间,适用于作为预测概率输出。
    梯度平滑,避免跳跃的输出值,函数可微。
    缺点
    在深度神经网络中梯度反向传递时,可能导致梯度消失,因为 s i g m o i d sigmoid sigmoid函数的导数取值范围在 [ 0 , 0.25 ] [0, 0.25] [0,0.25]之间。
    函数输出不是以 0 0 0为中心的,这可能会降低权重更新的效率。
    执行指数运算,计算速度相对较慢。

  2. T a n h Tanh Tanh函数:
    公式 ( f ( x ) = e x − e − x e x + e − x ) (f(x) = \frac{e{x} - e{-x}}{e{x} + e{-x}}) (f(x)=ex+exexex)
    特点
    输出范围在 [ − 1 , 1 ] [-1, 1] [1,1]之间,以 0 0 0为中心。
    s i g m o i d sigmoid sigmoid函数类似,但输出范围更广。
    缺点
    s i g m o i d sigmoid sigmoid函数相似,在深度神经网络中也可能导致梯度消失。

  3. R e L U ( R e c t i f i e d L i n e a r ) ReLU(Rectified Linear ) ReLURectifiedLinear函数:
    公式 ( f ( x ) = max ⁡ ( 0 , x ) ) (f(x) = \max(0, x)) (f(x)=max(0,x))
    特点
    当输入大于 0 0 0时,输出等于输入;当输入小于或等于 0 0 0时,输出为 0 0 0
    优点包括计算效率高(只涉及加法和乘法)、有助于缓解梯度消失问题(因为导数在输入大于 0 0 0时为1)。
    缺点
    在训练过程中,某些神经元可能会“死亡”,即权重不再更新,因为它们的输出始终为 0 0 0

  4. L e a k y R e L U Leaky\ ReLU Leaky ReLU函数:
    公式 ( f ( x ) = { x , x ≥ 0 a l p h a x , x < 0 ) (f(x) = \begin{cases}x, x \geq 0 \\alpha x, x < 0\end{cases}) (f(x)={x,x0alphax,x<0)
    特点
    类似于 R e L U ReLU ReLU,但当输入小于 0 0 0时,输出不为 0 0 0,而是乘以一个小的正数 ( α ) (\alpha) (α)
    旨在解决ReLU中的“死亡神经元”问题。

  5. E L U ( E x p o n e n t i a l L i n e a r U n i t ) ELU(Exponential\ Linear\ Unit) ELUExponential Linear Unit函数:
    公式 ( f ( x ) = { x , x ≥ 0 a l p h a ( e x − 1 ) , x < 0 ) (f(x) = \begin{cases}x, x \geq 0 \\alpha (e^{x} - 1), x < 0\end{cases}) (f(x)={x,x0alpha(ex1),x<0)
    特点
    当输入小于 0 0 0时,输出是一个指数函数,有助于缓解梯度消失问题。

  6. S o f t m a x Softmax Softmax函数:
    通常用于多分类问题的输出层。
    将神经网络的输出转换为概率分布,使得所有类别的概率之和为 1 1 1
    对于输入向量 x x x中的第 i i i个元素 x i x_i xi,其 S o f t m a x Softmax Softmax y i y_i yi由以下公式给出: y i = Softmax ( x i ) = e x i ∑ k = 1 N e x k y_i = \text{Softmax}(x_i) = \frac{e^{x_i}}{\sum_{k=1}^{N}e^{x_k}} yi=Softmax(xi)=k=1Nexkexi
    其中: e x i e^{x_i} exi x i x_i xi的自然指数函数值。 N N N 是输入向量 x x x的元素个数。 ∑ k = 1 N e x k \sum_{k=1}^{N}e^{x_k} k=1Nexk 是对所有输入元素 x k x_k xk(其中 k k k 1 1 1 N N N)的自然指数函数值进行求和。这个公式的作用是将输入向量 x x x中的每个元素转换为一个在 ( 0 , 1 ) (0, 1) (0,1)区间内的值,并且这些值的总和为 1 1 1,因此可以将其解释为概率分布。
    关键点归纳:
    指数化:通过计算 e x i e^{x_i} exi,将输入值映射到一个正数域。
    归一化:通过除以所有元素指数化后的和 ∑ k = 1 N e x k \sum_{k=1}^{N}e^{x_k} k=1Nexk,确保输出的概率值在 ( 0 , 1 ) (0, 1) (0,1)之间,并且总和为 1 1 1
    多分类 S o f t m a x Softmax Softmax函数通常用于多分类问题的输出层,将神经网络的输出转换为类别概率分布。
    数学性质 S o f t m a x Softmax Softmax函数具有一些优良的数学性质,如平移不变性、满足概率性质、对称性和可导性等。
    注意:由于使用了指数函数,当输入值 x i x_i xi的绝对值很大时,经过 S o f t m a x Softmax Softmax函数后,对应的输出值 y i y_i yi将趋近于 1 1 1,而其他元素的输出值将趋近于 0 0 0。这种现象在多分类问题中很常见,因为通常我们希望模型能够明确地将输入分类到某个类别中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/27851.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis原理篇——分布式锁

Redis原理篇——分布式锁 分布式锁是什么&#xff1f;分布式锁有哪些特性&#xff1f;分布式锁常用实现方式Redis 实现分布式锁一、简单的 Redis 锁二、带过期时间的 Redis 锁三、加上 Owner 的 Redis 锁四、Lua 脚本确保原子性 分布式锁是什么&#xff1f; 分布式锁是在分布式…

centos 8 换源

centos 8 换源 进入 root&#xff0c;切换至 yum.repos.d 目录 cd /etc/yum.repos.d/创建新文件夹并将源文件备份为 repo.bak mkdir backup && mv *repo backup/下载国内 yum 源文件 curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos…

软件体系结构笔记(自用)

来自《软件体系结构原理、方法与实践&#xff08;第三版&#xff09;》清华大学出版社 张友生编著 1-8章12章 复习笔记 如有错误&#xff0c;欢迎指正&#xff01;&#xff01;&#xff01;

HCIP认证笔记(填空)

1、为防止攻击者伪造BGP报文对设备进行攻击,可以通过配置GTSM功能检测IP报文中的TTL值的范围来对设备进行保护。如果某台设备配置了“peer x.x.x.x valid-ttl-hops 100",则被检测的报文的TTL值的有效范围为【(156),255】; 解析: peer {group-name | ipv4-address…

学习cel-go了解一下通用表达语言评估是什么

文章目录 1. 前言2. cel-go2.1 cel-go关键概念Applications(应用)Compilation(编译)Expressions(表达式)Environment环境解析表达式的三个阶段 3. cel-go的使用4. cel-go使用5. 说明6. 小结7. 参考 1. 前言 最近因为在项目里面实现的一个使用和||来组合获取字段值的功能有点儿…

MySQL员工练习

MySQL员工练习 1.数据显示 员工信息表emp&#xff1a; 字段&#xff1a;员工id,员工名字,工作岗位,部门经理,受雇日期,薪水,奖金,部门编号 英文名&#xff1a;EMPNO,ENAME,JOB,MGR,HIREDATE,SAL,BONUS,DEPTNO 部门信息表dept&#xff1a; 字段&#xff1a;部门编号,部门名称,部…

自然抽样和平顶抽样

自然抽样和平顶抽样是两种信号处理和采样技术&#xff0c;它们在音频信号处理、信号重建以及数字信号处理中有着不同的应用。 1. 自然抽样&#xff08;也称为理想抽样或无失真抽样&#xff09;&#xff1a;样值脉冲的幅度随原始信号m(t)的幅度而变&#xff1b; 自然抽样过程的…

Java算法常用技巧

一、排序 资料&#xff1a;https://blog.csdn.net/weixin_72499901/article/details/136592073 正排序 import java.util.Arrays;public class SortArray {public static void main(String[] args) {int[] citations {5, 3, 8, 2, 1, 4};// 打印原数组System.out.println(&…

windows10或者windows11怎么查看自己电脑显卡型号

win10系统&#xff1a; 右键单击任务栏后弹出菜单选择任务管理器 打开任务管理器后&#xff0c;点击性能查看左侧GPU0或者GPU1 如果有nvidia字样表示自己电脑有nvidia显卡&#xff0c;如果是AMD或者intel字样表示没有nvidia显卡。注意如果你有GPU0或者GPU1说明你电脑是双显卡&…

后端中缓存的作用以及基于Spring框架演示实现缓存

缓存的作用及演示 现在我们使用的程序都是通过去数据库里拿数据然后展示的 长期对数据库进行数据访问 这样数据库的压力会越来越大 数据库扛不住了 创建了一个新的区域 程序访问去缓存 缓存区数据库 缓存里放数据 有效降低数据访问的压力 我们首先进行一个演示 为了演示…

spring boot配置ssl证书,支持https访问

1. 阿里云官网下载证书,云控制台搜索ssl&#xff0c;点击进入。 2.点击免费证书&#xff0c;立即购买。 3. 点击创建证书&#xff0c;填写完证书申请后&#xff0c;等待证书签发。 4. 证书签发以后&#xff0c;点击下载证书&#xff0c;spring boot选tomcat服务器类型的。 5. …

[机缘参悟-198] - 互联网时代正在逐渐消融原先的金字塔结构的企业管理架构,管理者转变成创业者是大公司是新的游戏法则,大公司转变成孵化创业的生态和平台

目录 前言&#xff1a; 一、四次工业革命 1.1 概述 1.2 引发的社会变化 二、信息革命&#xff1a;互联网、移动互联网时代特点 2.1 技术的变化&#xff1a;数字化、信息化 2.2 个体的崛起&#xff1a;个人IP化 2.3 组织架构的变化&#xff1a;扁平化 2.4 软件开发的扁…

Android开发更改JDK版本

今天在跑GitHub上面一个Android项目时&#xff0c;在Android编译时出现如下错误&#xff1a; Unsupported Java. Your build is currently configured to use Java 17.0.2 and Gradle 7.0.2.错误原因&#xff1a; JDK和Gradle版本对应出错。 本地的JDK为1.8正好可以更改为本…

跨境电商测评、采购大额下单自养号需要解决哪些技术原理?

市场上有许多伪装工具&#xff0c;但大多数只是为了方便开发人员测试系统程序&#xff0c;它们并不能针对特定的电商平台进行伪装。每个电商平台都有其独特的风控机制&#xff0c;因此&#xff0c;我们需要从硬件环境的底层配合软件控制&#xff0c;以满足各平台的检测规则。 …

永磁同步直线电机(PMLSM)控制与仿真4-永磁同步直线电机数学三环闭环控制仿真

文章目录 1、参数设置及脚本2、相电流波形3、位置波形4、速度波形5、控制电流波形6、永磁同步直线电机在实际控制中如何控制参考 写在前面&#xff1a;原本为一篇文章写完了永磁同步直线电机数学模型介绍&#xff0c;永磁同步直线电机数学模型搭建&#xff0c;以及永磁同步直线…

Jacob环境探索(兼容性、管理员、DLL位置、VS环境,COM权限)

概述&#xff1a; 最近在生产开发实践出现了很多问题&#xff0c;经过了一系列排查&#xff0c;特做如下总结 探索成果&#xff1a; 1. jacob.dll的建议位置 首先jacob的官网&#xff0c;以及官方GitHub&#xff0c;你可以从这里找到DLL文件&#xff0c;以及相关资料然后DLL文…

【APP移动端自动化测试】第一节.环境配置和adb调试工具

文章目录 前言一、Java环境搭建二、AndroidSDK环境搭建三、Android模拟器安装四、adb调试工具基本介绍 4.1 adb构成和基本原理 4.2 adb获取包名&#xff0c;界面名 4.3 adb文件传输 4.4 adb获取app启动时间 4.5 adb获取手机日志 4.6 adb其他有关…

【Kafka专栏 09】Kafka消费者如何实现如何实现消息回溯与重放:谁说“覆水难收”?

作者名称&#xff1a;夏之以寒 作者简介&#xff1a;专注于Java和大数据领域&#xff0c;致力于探索技术的边界&#xff0c;分享前沿的实践和洞见 文章专栏&#xff1a;夏之以寒-kafka专栏 专栏介绍&#xff1a;本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用…

Windows 11 中安装 Docker Desktop 并安装镜像

本该主要介绍在 Windows 11 中安装 Docker Desktop 时的一些准备工作&#xff0c;以及该如何下载和安装&#xff0c;然后分别使用管理界面和 Docker 命令安装两个镜像。 一、准备工作 在 Windows 11 中安装 Docker Desktop 前&#xff0c;需要做一些准备。打开 【Windows 功能…

MySQL 保姆级教程(三):排序检索数据

第 5 章 排序检索数据 5.1 排序数据 输入: SELECT help_category.name FROM help_category ORDER BY help_category.name; 输出: --------------------------------------- | name | --------------------------------------- | Account M…