PyTorch官网demo解读——第一个神经网络（4）

PyTorch官网demo解读——第一个神经网络（4）

news/2025/4/26 5:22:21/文章来源:https://blog.csdn.net/fang437385323/article/details/135328527

上一篇：PyTorch官网demo解读——第一个神经网络（3）-CSDN博客

上一篇我们聊了手写数字识别神经网络的损失函数和梯度下降算法，这一篇我们来聊聊激活函数。

大佬说激活函数的作用是让神经网络产生非线性，类似人脑神经元一样，人脑神经元对输入的处理是非线性的。这个说法有些抽象，其实回到我们具体的模型中，激活函数的作用是将输出约束在某个预期的范围内，同时让输入到输出符合我们预期的分布。例如sigmod函数将输出约束在0~1之间，同时如果输入在0周围，输出的差异比较大，如果输入偏离0较多，则输出的差异就比较小。

代码解读

# 激活函数
def log_softmax(x):return x - x.exp().sum(-1).log().unsqueeze(-1)

完整代码请参见第一篇

demo代码中使用了一个自定义的log_softmax激活函数，其实这并不是一个标准的log_softmax函数，标准的log_softmax函数如下（来自PyTorch官网）：

对以上公式进行一波推导得出（参见推导原文）：

对比上面的代码发现代码里面的实现是没有减去M的，但这样也是可行的。

替换激活函数

单单看上面代码的激活函数有时候不是很好理解为什么这样做，不要激活函数可以吗？用其它激活函数又如何呢？下面我们就动手来捣鼓一下，看看换几个其它的激活函数会怎样？

首先我们把原来用log_softmax作为激活函数的结果跑出来，方便后面做对比：

接下来我们就来替换几个激活函数看看效果。

1. 替换成softmax函数

代码：

def softmax(x):return x.exp() / x.exp().sum(-1).unsqueeze(-1)

运行结果：

分析：

使用softmax函数训练出来的模型精度略逊于log_softmax，但不会相差太多。为什么呢？可以留言发表看法。

2. 替换成sigmod函数

代码：

def sigmod(x):return 1 / (1 + (-x).exp())

运行结果：

分析：

使用sigmod函数作为激活函数训练出来的模型精度只有0.6094，比使用log_softmax差很多，说明sigmod函数不能作为分类问题模型的激活函数

3. 替换成tanh函数

代码：

def tanh(x):p_exp = x.exp()n_exp = (-x).exp()return (p_exp - n_exp) / (p_exp + n_exp)

运行结果：

分析：

使用tanh函数作为模型的激活函数，训练出来精度为0.7188，比使用sigmod函数稍微好点，但比log_softmax还是差太多，所以tanh函数同样不适合作为分类问题模型的激活函数

总结

通过替换不同类型的激活函数，我们可以从侧面看出激活函数对于模型的重要性，也引起我们对激活函数的思考，算是抛砖引玉吧。在其它模型中如何选择激活函数呢？让我们共同学习！

如切如磋，如琢如磨！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/591638.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

十年磨一剑，花为缘享奢app打造行业的又一颠覆性创新

十年磨一剑，花为缘享奢app打造行业的又一颠覆性创新

随着国内生活质量的提高，人们对于奢侈品的消费需求也在不断增长。消费者对于高品质、高价值的商品和服务的需求日益增长。2022年我国内地消费者奢侈品市场规模约为4700亿元，预计2023年我国内地消费者奢侈品消费预计将达到5500亿元，呈现出强劲…

阅读更多...

旅游平台网页前后端

旅游平台网页前后端

功能清单游客功能用户注册、登录登录权限拦截按名称搜索房间支付流程查看订单信息和状态评论预定过的房间，并自动修改订单状态查看统计剩余房间数量，数量为0时不可预定管理员功能房间分类管理类型的删除、修改、查询（准备添加增添功能…

阅读更多...

Debezium日常分享系列之：Debezium 通知

Debezium日常分享系列之：Debezium 通知

Debezium日常分享系列之：Debezium 通知一、概论二、Debezium通知格式三、Debezium 有关初始快照状态的通知四、Debezium 有关增量快照进度的通知五、启用 Debezium 通知六、访问 Debezium JMX 通知七、自定义通知渠道八、应用案例一、概论 Debezium 通知提供了一…

阅读更多...

Wnmp本地部署结合内网穿透实现任意浏览器远程访问本地服务

Wnmp本地部署结合内网穿透实现任意浏览器远程访问本地服务

最近，我发现了一个超级强大的人工智能学习网站。它以通俗易懂的方式呈现复杂的概念，而且内容风趣幽默。我觉得它对大家可能会有所帮助，所以我在此分享。点击这里跳转到网站。文章目录前言1.Wnmp下载安装2.Wnmp设置3.安装cpolar内网穿透3.1…

阅读更多...

测开基础概念

测开基础概念

小王学习录前言测试1. 什么是测试2. 测试和调试的区别3. 优秀测试人员应该具备的素质需求1. 需求的定义2. 测试人员眼里的需求测试用例1. 什么是测试用例(case)2. 什么是Bug 开发测试模型1. 软件的生命周期2. 瀑布模型3. 螺旋模型3. 增量和迭代4. 敏捷开发5. scrum6. 瀑布模…

阅读更多...

chromium通信系统-ipcz系统(九)-ipcz系统代码实现-跨Node通信-代理和代理消除

chromium通信系统-ipcz系统(九)-ipcz系统代码实现-跨Node通信-代理和代理消除

chromium通信系统-ipcz系统(六)-ipcz系统代码实现-跨Node通信-基础通信一文我们分析了跨Node的基础通信过程。 a进程和b进程通信的过程。但在程序中a进程将自己打开的一对portal中的一个portal传递给了b进程。由于篇幅问题这个过程我们并没有分析，这篇文章我们就来…

阅读更多...

如何使用甘特图进行项目管理？

如何使用甘特图进行项目管理？

或许你在工作中或项目启动会议上听说过“甘特图”一词，但对此了解不多。虽然这些图表可能变得相当复杂，但基础知识并不难掌握。通过本文，你将清楚地了解什么是甘特图、何时使用甘特图、创建甘特图的技巧等等。什么是甘特图？ 甘特…

阅读更多...

第二十三章反射(reflection)

第二十三章反射(reflection)

一、反射机制（重点）（P711） 1. Java Reflection （1）反射机制允许程序在执行期借助 Reflection API 取得任何类的内部信息（比如成员变量、构造器、成员方法等等），并能操作…

阅读更多...

虚幻UE 材质-边界混合之PDO像素深度偏移量

虚幻UE 材质-边界混合之PDO像素深度偏移量

2024年的第一天！！！大家新年快乐！！！ 可能是长大了才知道当你过得一般你的亲朋好友对你真正态度只可能是没有表露出来的冷嘲热讽了希望大家新的一年平安、幸福、永远活力满满地追求自己所想做的、爱做的&…

阅读更多...

Nginx(十四) 配置文件详解 - 负载均衡（超详细）

Nginx(十四) 配置文件详解 - 负载均衡（超详细）

1. upstream Syntax: upstream name { ... } Default: — Context: http upstream块定义了一个上游服务器的集群，便于反向代理中的proxy_pass使用。 2. server Syntax: server address [parameters]; Default: — Context: upstream server指定一…

阅读更多...

HAL——点灯

HAL——点灯

学习目标掌握hal库开发流程掌握STMCubeMX配置过程掌握API查询和使用方式学习内容需求点灯PE3。开发流程新建项目芯片配置编写代码测试调试项目创建新建项目选择芯片。输入自己使用的芯片。选择芯片版本。芯片配置功能配置这里需求是点灯，配置…

阅读更多...

构建高效数据流转的 ETL 系统：数据库 + Serverless 函数计算的最佳实践

构建高效数据流转的 ETL 系统：数据库 + Serverless 函数计算的最佳实践

作者：柳下概述随着企业规模和数据量的增长，数据的价值越来越受到重视。数据的变化和更新变得更加频繁和复杂，因此及时捕获和处理这些变化变得至关重要。为了满足这一需求，数据库 CDC（Change Data Capture&#xff…

阅读更多...

@EnableXXX注解+@Import轻松实现SpringBoot的模块装配

@EnableXXX注解+@Import轻松实现SpringBoot的模块装配

文章目录前言原生手动装配模块装配概述模块装配的四种方式准备工作声明自定义注解导入普通类导入配置类导入ImportSelector导入ImportBeanDefinitionRegistrar 总结TODO后续--条件装配前言最早我们开始学习或接触过 SSH 或者 SSM 的框架整合，大家应该还记得那些…

阅读更多...

Oracle 19C DBA管理常用命令

Oracle 19C DBA管理常用命令

登入数据库主机，查看 CRS 资源状态： 集群资源启动完毕后，在任意一节点上利用crsctl查看集群状态。查看：/u01/app/19c/grid/bin/crsctl status res -t 集群资源管理命令： 启动：/u01/app/19c/grid/bin/cr…

阅读更多...

Redis 与 Spring: 解决序列化异常的探索之旅

Redis 与 Spring: 解决序列化异常的探索之旅

🌷🍁 博主猫头虎带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》文章图文并茂🦕生动形象🦖简单易学！欢迎大家来踩踩~🌺 &a…

阅读更多...

kotlin filter 过滤集合(filterIndexed,filterNot,filterIsInstance,filterNotNull)

kotlin filter 过滤集合(filterIndexed,filterNot,filterIsInstance,filterNotNull)

filter 在kotlin中一个高阶函数属于过滤集合中其中之一 filter作用： 用于根据提供的谓词函数过滤出集合中的元素，注意谓词只能检查元素的值，谓词可以理解为判断条件举例：检查集合中长度大于3的元素 val numbers listOf(&quo…

阅读更多...

YOLOv8改进 | 注意力篇 | ACmix自注意力与卷积混合模型（提高FPS+检测效率）

YOLOv8改进 | 注意力篇 | ACmix自注意力与卷积混合模型（提高FPS+检测效率）

一、本文介绍本文给大家带来的改进机制是ACmix自注意力机制的改进版本，它的核心思想是，传统卷积操作和自注意力模块的大部分计算都可以通过1x1的卷积来实现。ACmix首先使用1x1卷积对输入特征图进行投影，生成一组中间特征，然后根…

阅读更多...

ant-design-vue的form表单全局禁用不生效

ant-design-vue的form表单全局禁用不生效

文章目录一、问题二、解决2.1、4.0之前的版本2.2、4.0开始的版本三、最后一、问题实际使用ant-design-vue在开发表单的时候或许会遇到编辑与查看的需求，但是查看的时候表单不允许编辑，ant-design-vue的官方是没有像element一样提供全局disabled属…

阅读更多...

Tomcat 安装和运行教程

Tomcat 安装和运行教程

文章目录一、Tomcat 安装1.1 选择合适的 Tomcat 版本1.2 下载 Tomcat1.3 配置环境变量二、运行 Tomcat2.1 启动 Tomcat2.2 关闭 Tomcat 参考资料一、Tomcat 安装 1.1 选择合适的 Tomcat 版本 Apache Tomcat 是 Jakarta EE（正式JavaEE）技术子集的开…

阅读更多...

Unity关于easySave2 easySave3保存数据的操作；包含EasySave3运行报错的解决

Unity关于easySave2 easySave3保存数据的操作；包含EasySave3运行报错的解决

关于easySave2 easySave3保存数据的操作；包含EasySave3运行报错的解决 /// 数据存储路径（Easy Save的默认储存位置为：Application.persistentDataPath，为了方便我们可以给它指定储存路径） #region 存储数据/*/// /// 存…

阅读更多...

最新文章