sheng的学习笔记-【中文】【吴恩达课后测验】Course 2 - 改善深层神经网络 - 第二周测验

课程2_第2周_测验题

目录:目录

第一题

1.当输入从第8个mini-batch的第7个的例子的时候,你会用哪种符号表示第3层的激活?

A. 【  】 a [ 3 ] { 8 } ( 7 ) a^{[3]\{8\}(7)} a[3]{8}(7)

B. 【  】 a [ 8 ] { 7 } ( 3 ) a^{[8]\{7\}(3)} a[8]{7}(3)

C. 【  】 a [ 8 ] { 3 } ( 7 ) a^{[8]\{3\}(7)} a[8]{3}(7)

D. 【  】 a [ 3 ] { 7 } ( 8 ) a^{[3]\{7\}(8)} a[3]{7}(8)

答案:

A.【 √ 】 a [ 3 ] { 8 } ( 7 ) a^{[3]\{8\}(7)} a[3]{8}(7)

第二题

2.关于mini-batch的说法哪个是正确的?

A. 【  】mini-batch迭代一次(计算1个mini-batch),要比批量梯度下降迭代一次快

B. 【  】用mini-batch训练完整个数据集一次,要比批量梯度下降训练完整个数据集一次快

C. 【  】在不同的mini-batch下,不需要显式地进行循环,就可以实现mini-batch梯度下降,从而使算法同时处理所有的数据(矢量化)

答案:

A.【 √ 】mini-batch迭代一次(计算1个mini-batch),要比批量梯度下降迭代一次快

第三题

3.为什么最好的mini-batch的大小通常不是1也不是m,而是介于两者之间?

A. 【  】如果mini-batch的大小是1,那么在你取得进展前,你需要遍历整个训练集

B. 【  】如果mini-batch的大小是m,就会变成批量梯度下降。在你取得进展前,你需要遍历整个训练集

C. 【  】如果mini-batch的大小是1,那么你将失去mini-batch将数据矢量化带来的的好处

D. 【  】如果mini-batch的大小是m,就会变成随机梯度下降,而这样做经常会比mini-batch慢

答案:

B.【 √ 】如果mini-batch的大小是m,就会变成批量梯度下降。在你取得进展前,你需要遍历整个训练集

C.【 √ 】如果mini-batch的大小是1,那么你将失去mini-batch将数据矢量化带来的的好处

第四题

4.如果你的模型的成本随着迭代次数的增加,绘制出来的图如下,那么:
在这里插入图片描述

A. 【  】如果你正在使用mini-batch梯度下降,那可能有问题;而如果你在使用批量梯度下降,那是合理的。

B. 【  】如果你正在使用mini-batch梯度下降,那看上去是合理的;而如果你在使用批量梯度下降,那可能有问题。

C. 【  】无论你在使用mini-batch还是批量梯度下降,看上去都是合理的。

D. 【  】无论你在使用mini-batch还是批量梯度下降,都可能有问题。

答案:

B.【 √ 】如果你正在使用mini-batch梯度下降,那看上去是合理的;而如果你在使用批量梯度下降,那可能有问题。

第五题

5.假设一月的前三天卡萨布兰卡的气温是一样的:

  • 一月第一天: θ 1 = 10 \theta_1 = 10 θ1=10
  • 一月第二天: θ 2 = 10 \theta_2 = 10 θ2=10

假设您使用 β = 0.5 \beta = 0.5 β=0.5的指数加权平均来跟踪温度: v 0 = 0 , v t = β v t − 1 + ( 1 − β ) θ t v_0=0,v_t=\beta v_{t-1}+(1-\beta)\theta_t v0=0,vt=βvt1+(1β)θt。如果 v 2 v_2 v2是在没有偏差修正的情况下计算第2天后的值,并且 v 2 c o r r e c t e d v_2^{corrected} v2corrected是您使用偏差修正计算的值。 这些下面的值是正确的是?

A. 【  】 v 2 = 10 , v 2 c o r r e c t e d = 10 v_2=10,v_2^{corrected}=10 v2=10,v2corrected=10

B. 【  】 v 2 = 10 , v 2 c o r r e c t e d = 7.5 v_2=10,v_2^{corrected}=7.5 v2=10,v2corrected=7.5

C. 【  】 v 2 = 7.5 , v 2 c o r r e c t e d = 7.5 v_2=7.5,v_2^{corrected}=7.5 v2=7.5,v2corrected=7.5

D. 【  】 v 2 = 7.5 , v 2 c o r r e c t e d = 10 v_2=7.5,v_2^{corrected}=10 v2=7.5,v2corrected=10

答案:

D.【 √ 】 v 2 = 7.5 , v 2 c o r r e c t e d = 10 v_2=7.5,v_2^{corrected}=10 v2=7.5,v2corrected=10

第六题

6.下面哪一个不是比较好的学习率衰减方法?

A. 【  】 α = 1 1 + 2 ∗ t α 0 \alpha = \frac{1}{1+2*t}\alpha_0 α=1+2t1α0

B. 【  】 α = 1 t α 0 \alpha=\frac{1}{\sqrt{t}}\alpha_0 α=t 1α0

C. 【  】 α = 0.9 5 t α 0 \alpha=0.95^t\alpha_0 α=0.95tα0

D. 【  】 α = e t α 0 \alpha=e^t\alpha_0 α=etα0

答案:

D.【 √ 】 α = e t α 0 \alpha=e^t\alpha_0 α=etα0

第七题

7.您在伦敦温度数据集上使用指数加权平均, 使用以下公式来追踪温度: v t = β v t − 1 + ( 1 − β ) θ t v_t=\beta v_{t-1}+(1-\beta)\theta_t vt=βvt1+(1β)θt。下图中红线使用的是 β = 0.9 \beta=0.9 β=0.9来计算的。当你改变 β \beta β时,你的红色曲线会怎样变化?(选出所有正确项)
在这里插入图片描述

A. 【  】减小 β \beta β,红色线会略微右移

B. 【  】增加 β \beta β,红色线会略微右移

C. 【  】减小 β \beta β,红线会更加震荡

D. 【  】增加 β \beta β,红线会更加震荡

答案:

B.【 √ 】增加 β \beta β,红色线会略微右移

C.【 √ 】减小 β \beta β,红线会更加震荡

第八题

8.下图中的曲线是由:梯度下降,动量梯度下降( β = 0.5 \beta=0.5 β=0.5)和动量梯度下降( β = 0.9 \beta=0.9 β=0.9)。哪条曲线对应哪种算法?
在这里插入图片描述

A. 【  】(1)是梯度下降;(2)是动量梯度下降( β = 0.9 \beta=0.9 β=0.9);(3)是动量梯度下降( β = 0.5 \beta=0.5 β=0.5

B. 【  】(1)是梯度下降;(2)是动量梯度下降( β = 0.5 \beta=0.5 β=0.5);(3)是动量梯度下降( β = 0.9 \beta=0.9 β=0.9

C. 【  】(1)是动量梯度下降( β = 0.5 \beta=0.5 β=0.5);(2)是动量梯度下降( β = 0.9 \beta=0.9 β=0.9);(3)是梯度下降

D. 【  】(1)是动量梯度下降( β = 0.5 \beta=0.5 β=0.5);(2)是梯度下降;(3)是动量梯度下降($\beta=0.9
$)

答案:

B.【 √ 】(1)是梯度下降;(2)是动量梯度下降( β = 0.5 \beta=0.5 β=0.5);(3)是动量梯度下降( β = 0.9 \beta=0.9 β=0.9

第九题

9.假设在一个深度学习网络中,批量梯度下降花费了大量时间时来找到一组参数值,使成本函数 ( J ( W [ 1 ] , b [ 1 ] , … , W [ L ] , b [ L ] ) (J(W^{[1]},b^{[1]},…,W^{[L]},b^{[L]}) J(W[1],b[1],,W[L],b[L])小。以下哪些方法可以帮助找到 J J J值较小的参数值?

A. 【  】令所有权重值初始化为0

B. 【  】尝试调整学习率

C. 【  】尝试mini-batch梯度下降

D. 【  】尝试对权重进行更好的随机初始化

E. 【  】尝试使用 Adam 算法

答案:

B.【 √ 】尝试调整学习率

C.【 √ 】尝试mini-batch梯度下降

D.【 √ 】尝试对权重进行更好的随机初始化

E.【 √ 】尝试使用 Adam 算法

第十题

10.关于Adam算法,下列哪一个陈述是错误的?

A. 【  】Adam结合了Rmsprop和动量的优点

B. 【  】Adam中的学习率超参数 α \alpha α通常需要调整

C. 【  】我们经常使用超参数的“默认”值 β 1 = 0 , 9 , β 2 = 0.999 , ϵ = 1 0 − 8 \beta_1=0,9,\beta_2=0.999,\epsilon=10^{-8} β1=0,9,β2=0.999,ϵ=108

D. 【  】Adam应该用于批梯度计算,而不是用于mini-batch

答案:

D.【 √ 】Adam应该用于批梯度计算,而不是用于mini-batch

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/97372.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

hive 常用函数

1.分位数 percentile_approx(DOUBLE col, p [, B]) Returns an approximate pth percentile of a numeric column (including floating point types) in the group 含义: 在col列中返回p%的分位数 select percentile_approx( arr_id , 0.5 )from (selectarr_idfrom(selecta…

力扣-404.左叶子之和

Idea attention:先看清楚题目,题目说的是左叶子结点,不是左结点【泣不成声】 遇到像这种二叉树类型的题目呢,我们一般还是选择dfs,然后类似于前序遍历的方式加上判断条件即可 AC Code class Solution { public:void d…

【JavaEE】_HTTP请求与HTTP响应

目录 1. HTTP协议 2. HTTP请求 2.1 HTTP请求首行 2.2 URL 2.3 HTTP方法 2.3.1 GET请求 2.3.2 POST请求 2.3.3 GET与POST的区别 2.3.4 其他方法 2.4 请求报头header 2.4.1 Host: 2.4.2 Content-Length与Content-Type: 2.4.3 User-Agent&…

王道考研计算机组成原理——计算机硬件的基础知识

计算机组成原理的基本概念 计算机硬件的针脚都是用来传递信息,传递数据用的: 服务程序包含一些调试程序: 计算机硬件的基本组成 控制器通过电信号来协调其他部件的工作,同时负责解析存储器里存放的程序指令,然后指挥…

数据结构--》数组和广义表:从基础到应用的全面剖析

数据结构为我们提供了组织和处理数据的基本工具。而在这个广袤的数据结构领域中,数组和广义表是两个不可或缺的重要概念。它们作为线性结构的代表,在算法与应用中扮演着重要的角色。 无论你是初学者还是进阶者,本文将为你提供简单易懂、实用可…

十二、Django之模板的继承+用户列表

模板的继承 新建layout.html&#xff1a; {% load static %} <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title><link rel"stylesheet" href"{% static plugins…

计算机毕设 大数据B站数据分析与可视化 - python 数据分析 大数据

文章目录 0 前言1 课题背景2 实现效果3 数据获取4 数据可视化5 最后 0 前言 &#x1f525; 这两年开始毕业设计和毕业答辩的要求和难度不断提升&#xff0c;传统的毕设题目缺少创新和亮点&#xff0c;往往达不到毕业答辩的要求&#xff0c;这两年不断有学弟学妹告诉学长自己做…

阿里云轻量应用服务器有月流量限制吗?

阿里云轻量应用服务器限制流量吗&#xff1f;部分限制&#xff0c;2核2G3M和2核4G4M这两款轻量应用服务器不限制月流量&#xff0c;其他的轻量服务器套餐有月流量限制。 腾讯云轻量应用服务器价格便宜&#xff0c;活动页面&#xff1a;aliyunbaike.com/go/tencent 细心的同学看…

第四课 递归、分治

文章目录 第四课 递归、分治lc78.子集--中等题目描述代码展示 lc77.组合--中等题目描述代码展示 lc46.全排列--中等题目描述代码展示 lc47.全排列II--中等题目描述代码展示 lc226.翻转二叉树--简单题目描述代码展示 lc98.验证二叉搜索树--中等题目描述代码展示 lc104.二叉树的最…

八大排序详解(默认升序)

一、直接插入排序 直接插入排序&#xff1a;直接插入排序就是像打扑克牌一样&#xff0c;每张牌依次与前面的牌比较&#xff0c;遇到比自己大的就将大的牌挪到后面&#xff0c;遇到比自己小的就把自己放在它后面(如果自己最小就放在第一位)&#xff0c;所有牌排一遍后就完成了排…

GitHub工具之云资产管理

文章目录 0x01 介绍0x02 软件架构0x03 下载地址0x04 更新记录0x05 实现功能0x06 使用截图1、云存储工具-资产列表2、云存储工具-阿里云3、云存储工具-七牛云4、云存储工具-腾讯云5、云存储工具-亚马逊6、云存储工具-京东云7、云存储工具-金山云8、云存储工具-其他9、云存储工具…

【Kotlin精简】第1章 基础类型

1 Kotlin基础类型 Kotlin中&#xff0c;我们可以调用任何变量的成员函数和属性&#xff0c;从这个角度来说&#xff0c;一切皆对象。某些类型可以有特殊的内部表现。例如&#xff1a;数字、字符和布尔型在运行时可以表现为基础类型&#xff08;primitivetypes&#xff09;。 …

Stable diffusion的架构解读(本博客还是以unet架构为主)

博客只是简单的记录一下自己学的&#xff0c;基于自己的一些情况&#xff0c;所以简单了一些只是将来忘记&#xff0c;用来回顾用。 论文的大体框架 unet结构位于 unet会接受prompt特征、latent特征、和t时间步特征&#xff0c;最后生成新一轮的特征 可以参考知乎大佬htt…

Android之App跳转其他软件

文章目录 前言一、效果图二、实现步骤1.弹框xml(自己替换图标)2.弹框utils3.两个弹框动画4.封装方便调用5.调用6.长按事件方法7.跳转步骤8.复制utils 总结 前言 最近遇到一个需求&#xff0c;就是App内大面积需要长按复制并跳转指定App&#xff0c;没办法&#xff0c;只能埋头…

大语言模型之十六-基于LongLoRA的长文本上下文微调Llama-2

增加LLM上下文长度可以提升大语言模型在一些任务上的表现&#xff0c;这包括多轮长对话、长文本摘要、视觉-语言Transformer模型的高分辨4k模型的理解力以及代码生成、图像以及音频生成等。 对长上下文场景&#xff0c;在解码阶段&#xff0c;缓存先前token的Key和Value&#…

SpringCloud Alibaba - Sentinel 高级玩法,修改 Sentinel-dashboard 源码,实现 push 模式

目录 一、规则持久化 1.1、什么是规则持久化 1.1.1、使用背景 1.1.2、规则管理的三种模式 a&#xff09;原始模式 b&#xff09;pull 模式 c&#xff09;push 模式 1.2、实现 push 模式 1.2.1、修改 order-service 服务&#xff0c;使其监听 Nacos 配置中心 1.2.2、修…

RocketMQ 5.0 新版版本新特性总结

1 架构变化 RocketMQ 5.0 架构上的变化主要是为了更好的走向云原生 RocketMQ 4.x 架构如下&#xff1a; Broker 向 Name Server 注册 Topic 路由信息&#xff0c;Producer 和 Consumer 则从 Name Server 获取路由信息&#xff0c;然后 Producer 根据路由信息向 Broker 发送消…

2023年中国石化行业节能减排发展措施分析:用精细化生产提高生产效率,降低能耗[图]

2022年&#xff0c;我国石油和化工行业克服诸多挑战取得了极其不易的经营业绩&#xff0c;行业生产基本稳定&#xff0c;营业收入和进出口总额增长较快&#xff0c;效益比上年略有下降但总额仍处高位。2022年&#xff0c;我国石油化工行业市场规模为191761.2亿元&#xff0c;同…

macbook电脑磁盘满了怎么删东西?

macbook是苹果公司的一款高性能笔记本电脑&#xff0c;受到很多用户的喜爱。但是&#xff0c;如果macbook的磁盘空间不足&#xff0c;可能会导致一些问题&#xff0c;比如无法开机、运行缓慢、应用崩溃等。那么&#xff0c;macbook磁盘满了无法开机怎么办&#xff0c;macbook磁…

Qt实现 图片处理器PictureEdit

目录 图片处理器PictureEdit1 创建工具栏2 打开图片3 显示图片4 灰度处理5 颜色反转6 马赛克 图片处理器PictureEdit 创建工程&#xff0c;添加资源文件 1 创建工具栏 widget.h中 #include <QWidget> #include<QPixmap> #include<QFileDialog> #include&l…