吴恩达2022机器学习专项课程C2W2:2.17 TensorFlow实现 2.18 训练细节

这里写目录标题

  • 本周任务
  • TensorFlow训练神经网络模型的简要过程
  • 训练模型的三个步骤
    • 1.自行训练逻辑回归模型
    • 2.TensorFlow训练神经网络模型
  • TensorFlow训练神经网络模型的代码含义
    • 1.定义模型
    • 2.指定损失函数和成本函数
    • 3.最小化成本函数
  • 总结
  • Quiz
    • Quiz1
    • Quiz2

本周任务

神经网络如何训练?上周的内容,我们没有关注每一层的最合适的w,b是如何计算出来的,只是直接拿了现成的合适的结果,这周要关注这些参数是如何计算出最优解的。

TensorFlow训练神经网络模型的简要过程

  • :如果给定一个训练集,包含图像 X 和其对应的真实标签 Y,你会如何训练这个神经网络的参数?
  • :第一步,使用Sequential构键一个前向传播的3层神经网络。第二步,指定BinaryCrossentropy(二元交叉熵)为编译模型需要的损失函数。第三步,调用fit函数训练模型。在这里插入图片描述

训练模型的三个步骤

1.自行训练逻辑回归模型

(1)定义模型:定义将输入特征 x 通过参数w和b计算输出的公式,即sigmoid函数。

(2)指定损失函数和成本函数:为了训练逻辑回归模型,需要定义损失函数和成本函数,损失函数(loss)衡量单个训练样本的表现,成本函数则是所有训练样本的平均损失(损失函数求和,然后除以训练样本数m)。

(3)最小化成本函数:使用梯度下降算法来更新参数w和b,以最小化成本函数。

在这里插入图片描述

2.TensorFlow训练神经网络模型

(1)定义模型:使用Sequential定义模型。

(2)指定损失函数和成本函数:编译模型时指定二元交叉熵损失函数,该函数对每个训练样本计算损失,整个训练集的平均损失就是神经网络的成本函数。

(3)最小化成本函数:调用fit来最小化神经网络的成本。

在这里插入图片描述

TensorFlow训练神经网络模型的代码含义

1.定义模型

Tensorflow指定了神经网络的整体架构,在已经每层参数w,b的情况下,TensorFlow能够计算出最终输出。
在这里插入图片描述

2.指定损失函数和成本函数

(1)分类问题:如果解决二分类问题,可以指定TensorFlow内置的损失函数BinaryCrossentropy(二元交叉熵),TensorFlow会自动处理损失函数的构建和最小化过程。

在这里插入图片描述
(2)回归问题:解决回归问题可以指定损失函数MeanSquaredError(平方误差)损失函数。

在这里插入图片描述
(3)如果自己构建成本函数,需要用到神经网络里的所有参数。

在这里插入图片描述

3.最小化成本函数

如果我们自己使用梯度下降来训练神经网络的参数,那么你将重复地对每一层 l 和每个单元 j 更新 w_lj,根据 w_lj 减去学习率 alpha 乘以成本函数 j 的参数导数,以及对参数 b 也是类似的更新。而TensorFlow可以我们完成所有这些工作。它在这个名为 fit 的函数中实现了反向传播。你只需要调用 model.fit,使用x,y 作为你的训练集,并设置100次迭代或100个周期。

在这里插入图片描述

总结

首先,介绍了TensorFlow训练神经网络的基本思路,并与逻辑回归模型的训练步骤进行了简要对比,强调了在神经网络训练中需要关注的关键步骤。然后,详细描述了TensorFlow训练神经网络的每个步骤的含义,强调了TensorFlow在简化神经网络训练过程中的重要性。

Quiz

Quiz1

哪种类型的任务中使用二元交叉熵损失函数(BinaryCrossentropy)?

A:BinaryCrossentropy()不应用于任何任务。
B:具有3个或更多类别(类别)的分类任务
C:二元分类(正好有2个分类)
D:回归任务(预测数字的任务)
请添加图片描述
正确答案C:二元交叉熵,我们也称之为逻辑损失,用于分类两个类别(两个类别)之间。

Quiz2

在这里插入图片描述
哪行代码用于更新网络参数以减少成本?

A:model = Sequential([…)
B:以上都不是-这段代码不会更新参数
C:model.fit(X, y, epochs=100)
D:model.compile(loss=BinaryCrossentropy()
在这里插入图片描述
正确答案C:模型训练的第三步是在数据上训练模型以最小化损失(和成本)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/16495.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

汇聚荣科技有限公司怎么样?

在众多企业中,汇聚荣科技有限公司以其独特的发展模式和市场定位引起了人们的关注。对于这个问题,答案并非简单的好与坏,而需要从多个维度进行深入分析。 一、公司背景与发展历程汇聚荣科技有限公司成立于何年何地,由谁创立&#x…

RDD的操作算子

创建RDD // 方式1: 读取外部数据集. sc.textFile("本地文件或者HDFS文件所在的路径地址") // textFile: 读取本地文件或者HDFS文件 // 方式2: 在程序中对一个集合进行并行化处理. // 写法1: sc.parallelize(Array(1,2,3,4,5,6,7,8),num) // 写法2&…

QML基本语法介绍

为什么使用QML 开发者效率 将前后端分离,QML和JavaScript语言主要用于前度UI的方法,后端有C++来完成绘制。将JavaScript和C++分开能够快速迭代开发; 跨平台移植性 基于Qt平台的统一抽象概念,现在可以更加容易和快速和将Qt移植到更多的平台上。 开发的开放 Qt是由Qt-Proje…

40岁的戴尔在AI时代翻红了

戴尔公司股价创历史新高,市值达1138亿美元,涨幅110%。戴尔向AI押注多年,收购企业转型,成为数据基础设施厂商。AI服务器销售增长,分析师看好戴尔未来发展。 5月24日美股收盘,很多人可能不太关注的戴尔公司股…

Matlab进阶绘图第57期—带填充纹理的横向柱状图

带填充纹理的横向柱状图是通过在原始横向柱状图的基础上添加不同的纹理得到的,可以很好地解决由于颜色区分不足而导致的对象识别困难问题。 由于Matlab中未提供纹理填充选项,因此需要大家自行设法解决。 本文使用Kesh Ikuma制作的hatchfill2工具&#…

别人不愿意教,那我来教你Simulink建模(二)【语法知识】【原创分享】

文章目录 前言节点和状态的区别?local 和非 local 的区别?事件的作用?Bus 总线?Memory 模块?caller用法?自己瞎练习的(我也不知道为啥会多出来.h文件)自己瞎练习的(这个没有多出来.h文件)autosar实例学习前言 继续更新去年的博文系列,请君切记,师父领进门修行在个…

echarts- 热力图, k线图,雷达图

热力图 热力图可以看成是一种矩形的散点图。 热力图的矩形受itemStyle的影响。 通常配合visualmap组件来根据值的大小做颜色的变化。 热力图主要通过颜色去表现数值的大小,必须要配合 visualMap 组件使用。 visualMap:视觉映射组件 let options {tooltip: {},xAx…

取代pip,Python依赖管理的终极武器:Poetry

大家好,使用python过程中,包管理是一个永恒的话题。从早期的setuptools到后来的pip,再到现在的Poetry,开发者们一直在寻找更高效、更稳定、更可依赖的包管理方案。今天,我们就来聊聊这个现代Python项目的管理神器——P…

【全开源】CMS内容管理系统源码(ThinkPHP+FastAdmin)

基于ThinkPHPFastAdmin的CMS内容管理系统,自定义内容模型、自定义单页、自定义表单、专题、统计报表、会员发布等 提供全部前后台无加密源代码和数据库私有化部署,UniAPP版本提供全部无加密UniAPP源码。 ​构建高效内容管理的基石 一、引言&#xff1a…

深入分析 Android Activity (六)

文章目录 深入分析 Android Activity (六)1. Activity 的权限管理1.1 在 Manifest 文件中声明权限1.2 运行时请求权限1.3 处理权限请求结果1.4 处理权限的最佳实践 2. Activity 的数据传递2.1 使用 Intent 传递数据2.2 使用 Bundle 传递复杂数据 3. Activity 的动画和过渡效果3…

Python 机器学习 基础 之 数据表示与特征工程 【分箱、离散化、线性模型与树 / 交互特征与多项式特征】的简单说明

Python 机器学习 基础 之 数据表示与特征工程 【分箱、离散化、线性模型与树 / 交互特征与多项式特征】的简单说明 目录 Python 机器学习 基础 之 数据表示与特征工程 【分箱、离散化、线性模型与树 / 交互特征与多项式特征】的简单说明 一、简单介绍 二、分箱、离散化、线性…

使用 Ollama框架 下载和使用 Llama3 AI大模型的完整指南

🏡作者主页:点击! 🤖AI大模型部署与应用专栏:点击! ⏰️创作时间:2024年5月24日20点59分 🀄️文章质量:96分 目录 💥Ollama介绍 主要特点 主要优点 应…

*Python中的None与null:深入解析与实用指南

Python中的None与null:深入解析与实用指南 在编程的世界里,None和null是两个经常出现的概念,它们代表了“无”或“空”的状态。然而,在Python和许多其他编程语言中,这两个术语有着不同的含义和用法。本文将深入解析Python中的None,并对比其与其他编程语言中的null,提供…

如何将Spring Security添加到一个新的Spring Boot应用程序

如何将Spring Security添加到一个新的Spring Boot应用程序 这篇文章是关于如何将Spring Security添加到一个新的Spring Boot应用程序的详细步骤及其效果的介绍。 起点 首先,我们有一个简单的Spring Boot应用程序,它仅依赖于Web组件,并包含…

【张量乘法】pytorch中的mul、dot、mm、matmul

张量的乘法是pytorch等神经网络开发框架中最常见、最基本的操作之一。 1,torch.mul 对应位置的元素相乘。mul即表示张量中对应位置元素的相乘,也是最容易理解的乘法。 import torch a torch.tensor([[1, 2], [3, 4]]) b torch.tensor([[5, 6], [7, …

如何在Spring中配置声明式事务?

在Spring中配置声明式事务,主要有两种方式:通过XML配置文件和使用注解。声明式事务让你能够将事务管理代码从业务逻辑代码中分离出来,通过声明的方式来管理事务,使得代码更加简洁,易于维护。下面我将分别展示这两种方式…

【应用层】域名系统DNS

目录 1、互联网的域名结构 2、域名服务器 域名系统 DNS (Domain Name System) 是互联网使用的命名系统,用来把便于人们使用的机器名字转换为 IP 地址,域名系统其实就是名字系统。 互联网的域名系统 DNS 被设计成为一个联机分布式数据库系统&#xff0c…

Dockerfile构建Vue开发环境

# 指定基础镜像 FROM ubuntu:20.04# apt-get更换国内源解决 RUN sed -i s/archive.ubuntu.com//mirrors.aliyun.com/g /etc/apt/sources.list RUN sed -i s/security.ubuntu.com//mirrors.aliyun.com/g /etc/apt/sources.list ## 添加新的APT源 # RUN echo "deb http://se…

Facebook的心灵之镜:探寻数字社交的灵魂深处

在当今数字化时代,社交媒体已经成为了人们生活的一部分,而Facebook作为其中的佼佼者,更是承载了数以亿计的用户情感和交流。然而,Facebook不仅仅是一个简单的社交平台,它更像是一面心灵之镜,反映着数字社交…

2024年京东618购物节,“雷蛇 猎魂光蛛V2 模拟光轴“机械键盘的购买体验: 京东售后很优秀, 雷蛇Razer品控让人担忧

[简介] 常用网名: 猪头三 出生日期: 1981.XX.XX QQ联系: 643439947 个人网站: 80x86汇编小站 https://www.x86asm.org 编程生涯: 2001年~至今[共22年] 职业生涯: 20年 开发语言: C/C、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python 开发工具: Visual Studio、D…