CS224W6.2——深度学习基础

CS224W6.2——深度学习基础

news/2025/4/27 8:36:56/文章来源:https://blog.csdn.net/weixin_46351593/article/details/134360671

在本文中，我们回顾了深度学习的概念和技术，这些概念和技术对理解图神经网络至关重要。从将机器学习表述为优化问题开始，介绍了目标函数、梯度下降、非线性和反向传播的概念。

文章目录

1. 大纲
2. 优化问题
- 2.1 举例损失函数
3. 如何优化目标函数？
4. 梯度下降
- 4.1 对于SGD的一些概念
5. 如何获得目标函数？
- 5.1 反向传播
- 5.2 非线性变换
- 5.3 MLP
6. 总结

1. 大纲

在这里插入图片描述

这篇我们主要讲第一部分深度学习的基础。

2. 优化问题

我们将机器学习问题、监督学习问题看作是优化问题：

在这里插入图片描述

我们需要学习这样一个映射函数：将输入 $x$ 映射为输出的预测标签 $y$ 。

将这样的函数学习表述为一个优化过程。

在这里插入图片描述

有两件重要的是：

通过优化参数 $\Theta$ ，最小化损失函数 $\mathcal{L}$ 。
损失函数用来测量真实值与预测值之间的差距。

2.1 举例损失函数

交叉熵损失函数：

在这里插入图片描述

讨论多分类问题：

比如5分类问题，表示5种颜色，我们用one-hot编码表示。

我们要在某种意义上对它进行建模，使用 $f (x)$ 这是将某个函数 $g (x)$ 经过 $S o f t ma x ()$ 函数，得到一个预测5分类的概率，这些概率之和为1。

现在要衡量这个预测的质量。

通过单点的交叉熵损失函数 $CE (y, f (x))$ 得到的值越小，就表示预测值与真实的one-hot值越接近。

然后将所有单点的损失相加就得到了总的损失： $\mathcal{L}=\sum_{(x,y)\in\mathcal{T}}\operatorname{CE}(y,f(x))$ ，这是所有训练样本的真实值与预测值之间的总差异。

而我们想要的就是找到一个合适的函数 $f (x)$ 去最小化真实值与预测值之间的总差异。

3. 如何优化目标函数？

在这里插入图片描述

经典的优化目标函数是通过梯度下降，所以梯度的概念很重要：

某个定点的梯度是一个方向，该方向是函数的最快增长速率。

现在，我们可以对损失函数进行“询问”，关于我的参数 $\Theta$ ，我应该朝着哪个方向？（梯度相反的方向）改变我的参数 $\Theta$ 使损失 $\mathcal{L}$ 减少最多。

4. 梯度下降

在这里插入图片描述

上面是最基础的梯度下降版本，重复更新模型参数，直至收敛。

最基础的梯度下降有一些问题，所以后续提出了随机梯度下降（SGD）：

在这里插入图片描述

传统的梯度下降每一轮迭代都需要计算所有点的梯度，计算量太大，而SGD只计算一部分。

4.1 对于SGD的一些概念

在这里插入图片描述

首先是batch_size的概念，它是我们评估梯度数据的子集，（不是在整个训练数据集上评估梯度——GD，而是在训练集的一小部分——SGD），batch_size的大小是每一批次数据点的数量，通常我们喜欢更大的batch_size，但更大的batch_size会使优化变慢。
其次是iteration的概念，SGD的一个迭代（iteration），是SGD的一个步骤，我们在给定的batch_size的数据点上评估梯度。迭代次数是：数据集大小/batch_size。
最后是epoch的概念，它是对数据集的全面遍历。

这种小批量训练的思想是深度学习的核心。

5. 如何获得目标函数？

对于简单的模型：

在这里插入图片描述

5.1 反向传播

在这里插入图片描述

反向传播的概念：使用链式法则，来传播中间步骤的梯度，最终获得关于模型参数损失的梯度。

举例：

在这里插入图片描述

在这里插入图片描述

5.2 非线性变换

目前为止只使用了简单的两层神经网络，而 $W_2W_1$ 可以表示为另一个矩阵，它依然可以表示为一层的线性变换。

在这里插入图片描述

这意味着，我们通过两侧的线性变换依然得到的是一个线性模型，没有获得更多的表达能力。

而如果我们引入非线性变换，实际上增加了模型的表示能力。这将我们引向多层感知机的概念（MLP）。

5.3 MLP

在这里插入图片描述

6. 总结

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/139418.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

MySQL on duplicate key update用法

MySQL on duplicate key update用法

基本使用方法 public static final String SQL_TQI_SINK "insert into " ConfigureContext.get(ConfigKeyConstants.MYSQL_TABLE_TQI) " \n" "(mile_km, mile_start_km, mile_start_m, is_out, tqi_alig_l, \n" "tqi_alig_r, tqi_surf_l…

阅读更多...

Redis系列-Redis性能优化与安全【9】

Redis系列-Redis性能优化与安全【9】

目录 Redis系列-Redis性能优化与安全【9】Redis性能优化策略Redis安全设置与防护措施Redis监控与诊断工具介绍七、Redis应用案例与实战八、Redis未来发展与趋势个人主页: 【⭐️个人主页】需要您的【💖 点赞关注】支持 💯 Redis系列-Redis性能优化与安…

阅读更多...

2023年第十六届山东省职业院校技能大赛高职组“信息安全管理与评估”赛项规程

2023年第十六届山东省职业院校技能大赛高职组“信息安全管理与评估”赛项规程

第十六届山东省职业院校技能大赛高职组“信息安全管理与评估”赛项规程一、赛项名称赛项名称：信息安全管理与评估英文名称：Information Security Management and Evaluation 赛项组别：高职组赛项归属：电子与信息大类二…

阅读更多...

运行npm install卡住不动的几种解决方案

运行npm install卡住不动的几种解决方案

在前端开发经常会遇到运行npm install 来安装工具包一直卡住不动，为此这里提供几种解决方案，供大家参考学习，不足之处还请指正。第一种方案、首先检查npm代理，是否已经使用国内镜像 // 执行以下命令查看是否为国内镜像 npm con…

阅读更多...

入门指南：Docker的基本命令

入门指南：Docker的基本命令

入门指南：Docker的基本命令 Docker是一个功能强大的容器化平台，可以帮助您轻松构建、打包和部署应用程序。要充分利用Docker，您需要了解一些基本命令。本文将介绍并示范Docker的一些最重要的基本命令，以帮助您快速上手。 1. doc…

阅读更多...

linux 查看进程及端口

linux 查看进程及端口

linux 查看进程及端口使用 ps 命令查看当前运行的进程命令： ps -aux | grep 进程名进程ID用户CPU占用率内存占用率命令1234user10.51.2/usr/bin/example15678user21.00.8/usr/bin/example2 使用 netstat 命令查看当前打开的端口和与之相关的进程命令&#…

阅读更多...

虚假内容检测，谣言检测，不实信息检测，事实核查；纯文本，多模态，多语言；数据集整理

虚假内容检测，谣言检测，不实信息检测，事实核查；纯文本，多模态，多语言；数据集整理

本博客系博主个人理解和整理所得，包含内容无法详尽，如有补充，欢迎讨论。这里只提供数据集相关介绍和来源出处，或者下载地址等，因版权原因不提供数据集所含的元数据。如有需要，请自行下载。 “Complete d…

阅读更多...

深度学习之基于Django+Tensorflow商品识别管理系统

深度学习之基于Django+Tensorflow商品识别管理系统

欢迎大家点赞、收藏、关注、评论啦 ，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四. 总结一项目简介项目简介本系统是一个基于DjangoTensorflow的商品识别管理系统。通过深度学习技术，实现商品的自动识别…

阅读更多...

arduino 简易智能花盆

arduino 简易智能花盆

编辑器：arduino IDE 主板：arduino uno 传感器： 0.96寸的OLED屏（四脚） 声音模块土壤温湿度模块 DS18B20温度模块（这里用到防水的） 光敏电阻模块（买成三脚的了只能显示高低&#x…

阅读更多...

AR导览小程序开发方案

AR导览小程序开发方案

一、背景介绍随着科技的不断发展，虚拟现实（VR）和增强现实（AR）技术逐渐被应用于各个领域。其中，AR导览小程序作为一种新兴的导览方式，以其独特的视觉体验和互动性受到了广泛的关注。AR导览小程…

阅读更多...

el-table实现展开当前行时收起上一行的功能

el-table实现展开当前行时收起上一行的功能

<el-tableref"tableRef":data"tableData":expand-row-keys"expandRowKeys":row-key"handleRowKey" // 必须指定 row-keyexpand-change"handleExpandChange" // 当用户对某一行展开或者关闭的时候会触发该事件> <…

阅读更多...

实验结果啊

实验结果啊

所提出的框架已应用于智利一家银行的两个信用评分数据集。本节的组织结构如下：第4.1节对实施的项目进行了说明。实验设置如所示第4.2节，包括用于基准测试的替代方法的说明。随后，第4.3节总结了主要结果，包括从这些实验中获得的主要…

阅读更多...

【算法专题】双指针—三数之和

【算法专题】双指针—三数之和

力扣题目链接：三数之和一、题目解析二、算法原理解法一：排序暴力枚举利用set去重代码就不写了，你们可以试着写一下解法二：排序双指针这题和上一篇文章的两数字和方法类似排序固定一个数a在这个数的后面区间&#xff0…

阅读更多...

《詩經别解》——國風·周南·雎鳩

《詩經别解》——國風·周南·雎鳩

一、关于古文的一个认识目前可以阅读的古文经典，大多是经历了几千年的传承。期间的武力战争、文化纷争、宗教侵袭、官僚介入及文人的私人恩怨与流派桎梏，印刷与制作技术，导致这些古文全部都已经面目全非。简单地说，你读到的都是…

阅读更多...

2022最新版-李宏毅机器学习深度学习课程-P46 自监督学习Self-supervised Learning（BERT）

2022最新版-李宏毅机器学习深度学习课程-P46 自监督学习Self-supervised Learning（BERT）

一、概述：自监督学习模型与芝麻街参数量 ELMO：94MBERT：340MGPT-2：1542MMegatron：8BT5：11BTuring NLG：17BGPT-3：175BSwitch Transformer：1.6T 二、Self-supervised Lear…

阅读更多...

算法--- 每日温度

算法--- 每日温度

题目给定一个整数数组 temperatures ，表示每天的温度，返回一个数组 answer ，其中 answer[i] 是指对于第 i 天，下一个更高温度出现在几天后。如果气温在这之后都不会升高，请在该位置用 0 来代替。示例 1: 输入: te…

阅读更多...

[HXPCTF 2021]includer‘s revenge

[HXPCTF 2021]includer‘s revenge

文章目录方法一前置知识Nginx 在后端 Fastcgi 响应过大产生临时文件竞争包含绕过include_once限制解题过程方法二前置知识Base64 Filter 宽松解析iconv filter 解题过程方法一 NginxFastCGI临时文件前置知识 Nginx 在后端 Fastcgi 响应过大产生临时文件 www-data用户在n…

阅读更多...

SharePoint 页面中插入自定义代码

SharePoint 页面中插入自定义代码

我们都知道 SharePoint 是对页面进行编辑的。对于一些有编程基础的人来说，可能需要对页面中插入代码，这样才能更好的对页面进行配置。但是在新版本的 SharePoint modern 页面来说，虽然我们可以插入 Embed 组件。但是 Embed 组件中是不允…

阅读更多...

【C++基础】类和对象（上）

【C++基础】类和对象（上）

C基础类和对象（上） 1.面向过程和面向对象初步认识2.类的引入3.类的定义4.类的访问限定符及封装4.1 访问限定符4.2 封装 5.类的作用域6.类的实例化7.类对象模型7.1 如何计算类对象的大小7.2 类对象的存储方式猜测7.3 结构体内存对齐规则 8.this指针8.1 t…

阅读更多...

Kubernetes实战(四)-部署docker harbor私有仓库

Kubernetes实战(四)-部署docker harbor私有仓库

1 Docker原生私有仓库Registry 1.1 原生私有仓库Registry概述 Docker的仓库主要分两类： 私有仓库公有仓库共有仓库只要在官方注册用户，登录即可使用。但对于仓库的使用，企业还是会有自己的专属镜像，所以私有库的搭建也是很有…

阅读更多...

最新文章