pytorch l2正则化_吴恩达深度学习编程作业六正则化(2)

pytorch l2正则化_吴恩达深度学习编程作业六正则化(2)

news/2025/7/15 14:17:53/文章来源:https://blog.csdn.net/weixin_39908985/article/details/110843350

推荐守门员应该将球踢到哪个位置，才能让自己的队员用头击中。

1.无正则化模型

判别是否有正则化与调用其他计算函数。

准确率：0.948/0.915

明显过拟合overfiting了。

2.L2正则化

公式如下，在原有cost函数基础上增加L2项，L2为参数w的均方根

根据公式书写代码：

增加正则项后，反向传播的导数也会对应改变，其余参数不变。

准确率：0.938/0.93，相比没有正则化变好了一些，并且过拟合现象消失。

增加超参数

，越大越平滑。

L2正则认为权重越小的函数越简单，越平滑，因此在cost成本函数中增加L2项。

需要改的只有成本函数与反向传播的导数计算公式。

3.Dropout

在深度网络中，每次迭代都以1-keep_prob的概率关闭一些神经元。keep_prob保留神经元的概率。Dropout每次迭代关闭的神经元都不同，因此每次训练的模型其实是不同的，这相当于是另一种神经网络的集成。

步骤：

(1)建立随机数矩阵D，其维度和A输出一样。

(2)将随机数矩阵转化为0,1矩阵，随机数大于keep_prob转换为0，小于keep_prob转换为1。

(3)让矩阵D与矩阵A相乘(对应位置相乘而不是矩阵相乘)，得到新的矩阵A，相乘后为0的那些神经元被关闭。

(4)新的矩阵A除以keep_prob，为了使期望值不变。

前向传播+dropout，记得最后计算得到的A要除以keep_prob哦！

反向传播+dropout

反向传播时，对A求导数dA需要乘上同一层的D，在得到新的dA后，还需要除以keep_prob。

准确率：0.929/0.95，比之前效果更好。

dropout是一种正则化技术；

dropout只在训练时使用，不在测试中使用；

dropout在前向传播与反向传播中均需要参与，切记除以keep_prob；

小结：

正则化帮助处理过拟合问题；

正则化会减小参数，简化模型；

L2、dropout是一种很好的正则化手段。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/567290.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

java 代码锁_Java中的Lock锁

java 代码锁_Java中的Lock锁

Lock锁介绍：在java中可以使用 synchronized 来实现多线程下对象的同步访问，为了获得更加灵活使用场景、高效的性能，java还提供了Lock接口及其实现类ReentrantLock和读写锁 ReentrantReadWriteLock。相比synchronized来实现同步，使…

阅读更多...

vs中工具箱代表的意思_“日”除了代表太阳，其实还有这种意思，特别是出现在这些词语中的“日”...

vs中工具箱代表的意思_“日”除了代表太阳，其实还有这种意思，特别是出现在这些词语中的“日”...

对于“日”来说，大家都并不陌生，对于日的成语更是多得数不胜数，今天小编将日字成语进行了一个总结，需要用到的朋友们可以收藏！一：以“日”开头的成语，大多数形容的是时间。日积月累、日久天长、…

阅读更多...

java 访问路径_java获取项目访问路径的相关方法

java 访问路径_java获取项目访问路径的相关方法

java获取项目访问路径的相关方法刘振兴代码分享2016年02月11日6292暂无评论在jsp和class文件中调用的相对路径不同。在jsp里，根目录是WebRoot 在class文件中，根目录是WebRoot/WEB-INF/classes 当然你也可以用System.getProperty("user.dir")获…

阅读更多...

java 保存文件在服务器_java文件保存至服务器

java 保存文件在服务器_java文件保存至服务器

import java.io.ByteArrayOutputStream;import java.io.File;import java.io.FileOutputStream;import java.io.InputStream;import java.net.HttpURLConnection;import java.net.URL;public class ImageRequest{/*** 读取网络图片并保存至服务器硬盘中* param imgUrl* return …

阅读更多...

mysql or走索引吗_加了索引，mysql查询就一定会用吗？

mysql or走索引吗_加了索引，mysql查询就一定会用吗？

小白白跑去鹅厂面试，面试官提出了一个很实际的问题： mysql增加索引，那些情况会失效呢？谈一下实际工作中遇到的情况。我们的小白白又抛出了白氏秘籍：用不用索引，找DBA小姐姐！啊？这是你…

阅读更多...

java单词查找树_Trie 单词查找树 java实现(来自算法第4版)

java单词查找树_Trie 单词查找树 java实现(来自算法第4版)

强烈建议看书上的实现步骤，这里只是一个个人记录。单词查找树的性能：查找命中所需的时间与被查找的键的长度成正比。比如单词有7个字符，查找或插入操作最多只需要检查8个节点。查找未命中只需检查若干个字符。所需空间：在RN~RNw之…

阅读更多...

学python开发必须要会wsgi么_学python着几个要搞清楚WSGI和uWSGI区别

学python开发必须要会wsgi么_学python着几个要搞清楚WSGI和uWSGI区别

Python&colon; 解决pip安装源被墙的问题pip install -i http://mirrors.aliyun.com/pypi/simple --trusted-host mirrors.aliyun.c ...resin的简单介绍和使用1.resin是一款应用服务器(application server),它自身也包含一款支持Http1.1协议的WEB服务器(web server),它也可以…

阅读更多...

java 连接 sftp失败_java – 文件上传到SFTP失败(Apache VFS)

java 连接 sftp失败_java – 文件上传到SFTP失败(Apache VFS)

我有一个SFTP问题(WindowsWinSSHD).我尝试用Apache Commons VFS在一个文件夹中写一个文件.在本地SFTP上我没有上传的问题,但在第二个SFTP上我总是得到以下错误.FTP看起来像这样：我需要上传到文件夹“alis”.奇怪的是它没有User / Group和770权限.但是,使用FileZilla…

阅读更多...

基本农田卫星地图查询_如何基于西安80坐标查询定位

基本农田卫星地图查询_如何基于西安80坐标查询定位

1. 概述水经注软件除了可以轻松下载无水印Google Earth卫星影像、有明确拍摄日期的历史影像、地方高清天地图、百度高德大字体打印地图，且可按1万/5千等国家标准图幅下载，下载含高度的全国矢量建筑、全国乡镇及街区行政区划、地名点、高速铁路网、公交路…

阅读更多...

java getipaddress_教你java用getAddress方法取得IP地址

java getipaddress_教你java用getAddress方法取得IP地址

本篇教你java用getAddress方法取得IP地址：getAddress方法和getHostAddress类似，它们的唯一区别是getHostAddress方法返回的是字符串形式的IP地址，而getAddress方法返回的是byte数组形式的IP地址。getAddress方法的定义如下：public…

阅读更多...

tcp的无延时发送_高并发架构的TCP知识介绍

tcp的无延时发送_高并发架构的TCP知识介绍

这是关于高并发架构网络协议基础知识的第二篇，编程路上的基础心法！做为一个有追求的程序员，不能只满足增删改查，我们要对系统全方面无死角掌控。掌握了这些基本的网络知识后，相信一方面日常排错中会事半功倍&#xff0…

阅读更多...

java lambda sorted_Java8：Lambda表达式增强版Comparator和排序

java lambda sorted_Java8：Lambda表达式增强版Comparator和排序

1、概述在这篇教程里，我们将要去了解下即将到来的JDK 8(译注，现在JDK 8已经发布了)中的Lambda表达式——特别是怎样使用它来编写Comparator和对集合(Collection)进行排序。首先，让我们先定义一个简单的实体类：public class Human …

阅读更多...

如何对一个变量数据进行正则判定_生存分析数据中的BuckleyJamesMultipleRegression Model...

如何对一个变量数据进行正则判定_生存分析数据中的BuckleyJamesMultipleRegression Model...

一、模型简介目前，生存分析领域，最常用的是Cox比例风险回归模型，该模型具有良好的特性，不仅可以分析各种自变量对生存时间的影响，而且对基准风险分布不作任何要求(半参数模型)。Cox模型使用时要满足一定的条件&#xf…

阅读更多...

格兰杰因果关系检验r语言_R语言系列第四期：R语言单样本双样本差异性检验

格兰杰因果关系检验r语言_R语言系列第四期：R语言单样本双样本差异性检验

之前详细介绍了利用R语言进行统计描述，详情点击：R语言系列第三期：①R语言单组汇总及图形展示、R语言系列第三期：②R语言多组汇总及图形展示、R语言系列第三期：③R语言表格及其图形展示从这个部分我们就开始为大家介绍统…

阅读更多...

python数据预测代码_手把手教你用Python玩转时序数据，从采样、预测到聚类丨代码...

python数据预测代码_手把手教你用Python玩转时序数据，从采样、预测到聚类丨代码...

原标题：手把手教你用Python玩转时序数据，从采样、预测到聚类丨代码原作 Arnaud Zinflou郭一璞编译时序数据，也就是时间序列的数据。像股票价格、每日天气、体重变化这一类，都是时序数据，这类数据相当常见，…

阅读更多...

java 配置jmstemplate_SpringBoot集成JmsTemplate(队列模式和主题模式)及xml和JavaConfig配置详解...

java 配置jmstemplate_SpringBoot集成JmsTemplate(队列模式和主题模式)及xml和JavaConfig配置详解...

1.导入jar包：org.springframework.bootspring-boot-starter-activemqorg.apache.activemqactivemq-pool2.填写配置文件(application.properties)#设置JMS(AMQ)spring.activemq.broker-urltcp://localhost:61616spring.activemq.useradminspring.activemq.passwordad…

阅读更多...

切面是异步还是同步操作‘_分布式中采用Logback的MDC机制与AOP切面结合串联日志...

切面是异步还是同步操作‘_分布式中采用Logback的MDC机制与AOP切面结合串联日志...

导读：在实际开发中，打印日志是十分重要的。在生产环境中，如果日志打得好可以快速地排查问题，而在分布式的场景下，一个请求会跨越多个节点，既一个业务可能需要多个节点协调配合处理。那么日志将会分散&#…

阅读更多...

java 图类_Java集合类，一张图说清楚！

java 图类_Java集合类，一张图说清楚！

作者：skywang12345https://www.cnblogs.com/skywa...2019-03-23 10:32:24Java集合是java提供的工具包，包含了常用的数据结构：集合、链表、队列、栈、数组、映射等。Java集合工具包位置是java.util.*，Java集合主要可以划分为4个部分…

阅读更多...

python 取整_马克的Python学习笔记#数字，日期和时间

python 取整_马克的Python学习笔记#数字，日期和时间

对数值进行调整在Python中对整数和浮点数进行数字计算是很容易的。但是，如果你需要对分数，数组或者日期和时间进行计算，这就会稍微复杂点。对于简单的取整操作，我们可以使用内建的round(value, ndigits)函数就可，举个例…

阅读更多...

java 数据类型分为_JAVA中分为基本数据类型及引用数据类型

java 数据类型分为_JAVA中分为基本数据类型及引用数据类型

byte：Java中最小的数据类型，在内存中占8位(bit)，即1个字节，取值范围-128~127，默认值0short：短整型，在内存中占16位，即2个字节，取值范围-32768~32717，默认值0i…

阅读更多...

最新文章