深度学习(3)--常用激活函数的有用性质

1 sigmoid函数

sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线。
sigmoid函数由下列公式定义:
σ(x)=11+e−x(1)\sigma(x) = \frac{1}{1 + e^{-x}} \tag1σ(x)=1+ex1(1)
sigmoid函数的级数表示:
σ(x)=12+14x−148x3+1480x5−1780640x7+311451520x9−691319334400x11+O(x12)(2)\sigma(x) = \frac{1}{2} + \frac{1}{4}x - \frac{1}{48}x^3 + \frac{1}{480}x^5 - \frac{17}{80640}x^7 + \frac{31}{1451520}x^9 - \frac{691}{319334400}x^{11} + O(x^{12}) \tag2σ(x)=21+41x481x3+4801x58064017x7+145152031x9319334400691x11+O(x12)(2)
计算结果如下:

xxxσ(x)\sigma(x)σ(x)xxxσ(x)\sigma(x)σ(x)xxxσ(x)\sigma(x)σ(x)
-80.00033535-70.00091108-60.0024726
-50.0066930-40.017986-30.047425
-20.11920-10.2689400.5
10.7310520.8808230.95256
40.9820350.9933060.99751
70.9991080.99970

该函数的曲线如下:
在这里插入图片描述
在信息科学中,由于其单增以及反函数单增等性质,sigmoid函数常被用作神经网络的激活函数,将变量映射到0,1之间。与之类似的还有softplus和softmax等函数。
函数具有以下几个特点:

  • 值域在0和1之间
  • 函数具有非常好的对称性
  • 函数对输入超过一定范围就会不敏感,在趋于正无穷或负无穷时,函数趋近平滑状态

但该函数有以下几个缺点:

  • 激活函数计算量大,反向传播求误差梯度时,求导涉及除法
  • 反向传播时,很容易就会出现梯度消失的情况,从而无法完成深层网络的训练

应用:在二分类任务中,采用sigmoid的输出的是事件概率,也就是当输出满足某一概率条件将其划分正类。
其对x的导数可以用自身表示:
σ′(x)=e−x(1+e−x)2=σ(x)(1−σ(x))(3)\sigma'(x) = \frac{e^{-x}}{(1 + e^{-x})^2} = \sigma(x)(1 - \sigma(x)) \tag3σ(x)=(1+ex)2ex=σ(x)(1σ(x))(3)

2 softplus函数

该函数的数学表达式为:
ζ(x)=ln⁡(1+ex)(4)\zeta(x) = \ln(1+e^{x}) \tag4ζ(x)=ln(1+ex)(4)
值域为(0,+∞)(0, +\infty)(0,+),其函数图像为:
在这里插入图片描述
softplus函数与ReLU函数对比如下:

  • softplus函数与ReLU函数接近,但比较平滑;
  • 同ReLU一样是单边抑制,有宽广的接受域(0,+∞)(0, +\infty)(0,+)
  • softplus函数指数运算及对数运算,计算量大导致不太被人使用;
  • 从一些人的使用经验来看(Glorot et al.(2011a)),softplus函数效果也并不比ReLU好。
    在这里插入图片描述

softplus的导数恰好是sigmoid函数.
softplus可以看作是ReLu的平滑。根据神经科学家的相关研究,softplus和ReLu与脑神经元激活频率函数有神似的地方。也就是说,相比于早期的激活函数,softplus和ReLu更加接近脑神经元的激活模型,而神经网络正是基于脑神经科学发展而来,这两个激活函数的应用促成了神经网络研究的新浪潮。

3 tanh函数

tanh是双曲函数中的一个,tanh()为双曲正切。在数学中,双曲正切“tanh”是由基本双曲函数双曲正弦和双曲余弦推导而来。
tanh⁡x=sinh⁡xcosh⁡x=ex−e−xex+e−x\tanh x = \frac{\sinh x}{\cosh x} = \frac{e^{x} - e^{-x}}{e^{x} + e^{-x}}tanhx=coshxsinhx=ex+exexex
其曲线如下图所示:
在这里插入图片描述
其导数为:
tanh⁡′x=1−(ex−e−x)2(ex+e−x)2=1−tanh⁡2x\tanh' x = 1- \frac{(e^{x} - e^{-x})^2}{(e^{x} + e^{-x})^2} = 1- \tanh^2xtanhx=1(ex+ex)2(exex)2=1tanh2x
其曲线如下图所示:
在这里插入图片描述

4 sigmoid函数σ(x)\sigma(x)σ(x)和softplus函数ζ(x)\zeta(x)ζ(x)一些重要性质

这些重要性质非常有用,需要背下来:
σ(x)=11+e−x=exex+1\sigma(x) = \frac{1}{1+e^{-x}} = \frac{e^x}{e^x + 1}σ(x)=1+ex1=ex+1ex
ddxσ(x)=σ(x)(1−σ(x))\frac{d}{dx}\sigma(x) = \sigma(x)(1-\sigma(x))dxdσ(x)=σ(x)(1σ(x))
1−σ(x)=σ(−x)1 - \sigma(x) = \sigma(-x)1σ(x)=σ(x)
log⁡σ(x)=−ζ(−x)\log \sigma(x) = -\zeta(-x)logσ(x)=ζ(x)
ddxζ(x)=σ(x)\frac{d}{dx}\zeta(x) = \sigma(x)dxdζ(x)=σ(x)
∀x∈(0,1),σ−1(x)=log⁡(x1−x)\forall x \in (0,1), \sigma^{-1}(x) = \log(\frac{x}{1-x})x(0,1),σ1(x)=log(1xx)
∀x>0,ζ−1(x)=log⁡(ex−1)\forall x > 0, \zeta^{-1}(x) = \log(e^{x} - 1)x>0,ζ1(x)=log(ex1)
ζ(x)=∫−∞xσ(y)dy\zeta(x) = \int_{-\infty}^{x}\sigma(y)dyζ(x)=xσ(y)dy
ζ(x)−ζ(−x)=x\zeta(x) - \zeta(-x) = xζ(x)ζ(x)=x

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507707.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

kvm虚拟机不通网关_linux ssh 虚拟机下CentOS7开启SSH连接

一. 没开启,连接会报错二. 开启后,连接成功在虚拟机(Vmware Workstation)下,安装了CentOS7,现在想通过SSH工具连接虚拟机中的CentOS71、 首先,要确保CentOS7安装了 openssh-server,在终端中输入 yum list i…

linux netstat服务,linux netstat查看服务和端口状态

netstat可以查看linux系统中正在使用的服务和端口情况常见参数-a (all)显示所有选项,默认不显示LISTEN相关-t (tcp)仅显示tcp相关选项-u (udp)仅显示udp相关选项-n 拒绝显示别名,能显示数字的全部转化成数字。-l 仅列出有在 Listen (监听) 的服务状态-p …

memcpy函数实现_等比例缩放c++ opencv 实现

背景&#xff1a;在目标检测算法中&#xff0c; 输入图片等比例resize时mAP比直接resize会高几个点。实现&#xff1a;使用c 和opencv实现(之所以没用python&#xff0c;是因为用于生产环境)先贴代码&#xff1a;#include <math.h> #include <opencv2/core/core.hpp&g…

睡眠音频分割及识别问题(十一)--基于Android的YAMNet音频识别(总结)

WAV文件格式介绍 WAV文件遵守资源交换文件格式之规则&#xff0c;在文件的前44(或46)字节放置标头(header)&#xff0c;使播放器或编辑器能够简单掌握文件的基本信息&#xff0c;其内容以区块(chunk)为最小单位&#xff0c;每一区块长度为4字节&#xff0c;而区块之上则由子区…

黑白棋游戏水平(2)--pytorch剪裁

系统需求 Linux系统&#xff0c;并已安装git、gcc、g、cmake⼯具 下载源码 从github克隆Pytorch仓库 git clone --recursive https://github.com/pytorch/pytorch如果已经克隆过&#xff0c;则使⽤以下命令更新 git submodule sync git submodule update --init --recurs…

二维码图像去噪文献调研(1)--Real Image Denoising with Feature Attention

简介 &#xff08;1&#xff09; 论文&#xff08;包括期刊和发表时间&#xff09;&#xff1a; Real Image Denoising with Feature Attention&#xff08;ICCV 2019&#xff09; &#xff08;2&#xff09; 论文链接&#xff1a; https://arxiv.org/pdf/1904.07396.pdf &…

idea gui插件_给 IDEA 换了酷炫的主题,研发小姐姐看到:feel so high。。。

点击上方[全栈开发者社区]→右上角[...]→[设为星标⭐]IntelliJ IDEA介绍IDEA&#xff0c;全称 IntelliJ IDEA &#xff0c;是 Java 语言的集成开发环境&#xff0c; IDEA 在业界被公认为是最好的 java 开发工具之一&#xff0c;尤其在智能 代码助手、代码自动提示、重构、 J2E…

华为荣耀电脑第三方linux,【第三方Linux版】荣耀MagicBook Pro 16.1英寸全面屏如何?某东入手评测...

这款【第三方Linux版】荣耀MagicBook Pro 16.1英寸全面屏轻薄笔记本电脑(酷睿i5 8G 512G MX250 IPS)冰河银&#xff0c;看网上评测推荐的&#xff0c;后面网上种草了这款笔记本&#xff0c;用过一段日子了&#xff0c;分享使用感受如下&#xff1a;一、【第三方Linux版】荣耀Ma…

二维码提升对比度文献调研(1)--Fast Image Processing with Fully-Convolutional Networks

简介 (1) 论文 &#xff08;期刊和发表时间&#xff09; Fast Image Processing with Fully-Convolutional Networks (ICCV 会议 2017) (2) 论文链接 https://openaccess.thecvf.com/content_iccv_2017/html/Chen_Fast_Image_Processing_ICCV_2017_paper.html (3) 源代码链接 …

linux下 c语言 用write open二进制写文件,Linux下用C语言fopen、fread和fwrite函数对二进制文件的操作-Go语言中文社区...

一、前言在做一个镜头的初始化操作&#xff0c;需要加载一个648*522像素大小的文件&#xff0c;厂商提供的是一个excel表&#xff0c;如果要加载数据&#xff0c;可用加载txt文本的方式&#xff0c;我选用二进制方式加载文件&#xff1b;大家都知道电脑真正执行的不是高级语言&…

二维码提升对比度文献调研(2)--Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement

简介 论文 &#xff08;期刊和发表时间&#xff09; Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement (CVPR 会议 2020)论文链接 https://openaccess.thecvf.com/content_CVPR_2020/html/Guo_Zero-Reference_Deep_Curve_Estimation_for_Low-Light_Imag…

python打开是什么样子的图片_黑洞6问:黑洞内部是什么样子?黑洞图片发布,理论和实测的碰撞...

在科学领域&#xff0c;没有什么比你在第一次观察或实验结果中验证一个长期的理论预测时更令人兴奋的了。2012年&#xff0c;大型强子对撞机揭示了希格斯玻色子——标准模型中最后未发现的基本粒子的存在。 几年前&#xff0c;LIGO合作直接探测到了引力波&#xff0c;证实了对爱…

二维码提升对比度文献调研(3)--A Low-Complexity Algorithm for Contrast Enhancement of Digital Images

简介 &#xff08;1&#xff09;论文&#xff08;包括期刊和发表时间&#xff09;&#xff1a;A Low-Complexity Algorithm for Contrast Enhancement of Digital Images &#xff08;2&#xff09;论文链接&#xff1a; http://www.mecs-press.net/ijigsp/ijigsp-v10-n2/IJIG…

安卓checkbox无响应_【安卓手机】无法连接电脑的解决方法

转自&#xff1a;广西南宁平衡信息技术有限公司&#xff0c;作者&#xff1a;平衡LivY一般在对手机的数据采集过程中&#xff0c;尤其是安卓手机&#xff0c;最令人头疼的就是手机接入电脑后无法识别。相信以下窗口是大家在做手机取证的时候最不想看到的。那么这里大伙就会有疑…

linux s删除第一行,Linux文本处理三驾马车之一sed

sed对"行"操作动作含义a &#xff1a;新增&#xff0c; a 接字串&#xff0c;而这些字串会在新的一行出现(目前的下一行)&#xff5e;sed 1a\llll llllllll \n lllllll t.txtnl /etc/passwd | sed 2a drink teased -i $a# This is a test regular_express.txt ####文…

二维码提升对比度文献调研(4)--Attention Guided Low-light Image Enhancement

简介 &#xff08;1&#xff09;论文2&#xff1a; Attention Guided Low-light Image Enhancement with a Large Scale Low-light Simulation Dataset &#xff08;2&#xff09;论文链接&#xff1a; https://arxiv.org/pdf/1908.00682v3.pdf &#xff08;3&#xff09;源代…

函数传参string_C/C++的三种函数传值方式及其区别

C/C函数传参方式我想很多朋友应该都知道&#xff0c;但是不同传参方式的背后他们的区别是什么我想很多人并不那么清楚。本文就给大家揭露一下各传参方式的区别。传参方式有这三种&#xff1a;值传递、引用传递、指针传递大家可以去看三种传递方式的写法的区别&#xff0c;关于写…

二维码提升对比度文献调研(5)--DeepLPF: Deep Local Parametric Filters for Image Enhancement

简介 &#xff08;1&#xff09;论文名称&#xff1a; DeepLPF: Deep Local Parametric Filters for Image Enhancement CVPR 2020 &#xff08;2&#xff09;论文链接&#xff1a; https://arxiv.org/abs/2003.13985 &#xff08;3&#xff09;源代码&#xff1a; https://gi…

c语言单选题大全,C语言单选题(五)

1.C语言结构体类型变量在程序执行期间(C)。A.部分成员驻留在内存中B.只有一个成员驻留在内存中C.所有成员一直驻留在内存中D.没有成员驻留在内存中2.当定义一个结构体变量时&#xff0c;系统分配给它的内存是(D)。A.结构中最后一个成员所需内存量B.结构中第一个成员所需内存量C…

java 匿名函数_Java 理论与实践,闭包之争

Java 语言是否应增加闭包以及如何添加&#xff1f;在跨越边界 系列最近的一篇文章中&#xff0c;我的朋友兼同事 Bruce Tate 以 Ruby 为例描述了闭包的强大功能。最近在安特卫普召开的 JavaPolis 会议上&#xff0c;听众人数最多的演讲是 Neal Gafter 的 “向 Java 语言增加闭包…