SGD随机梯度下降

一、补充概念:

  1. 目标函数(Objective Function):这个术语通常指的是整个优化问题中需要最小化(或最大化)的函数。在机器学习和优化中,目标函数可以包括损失函数以及正则化项等目标函数的最优化过程旨在找到使目标函数取得最小值或最大值的参数值。

  2. 损失函数(Loss Function):这个术语通常指的是在监督学习中用来衡量模型预测值与真实标签之间差异的函数。损失函数是目标函数的一部分,通常作为目标函数的组成部分出现。在训练过程中,损失函数的值被用来作为优化算法的目标,以便通过调整模型参数来最小化损失函数。

      3.损失函数:某些情况下为目标函数。

      4.梯度:梯度通常是指损失函数关于模型参数的偏导数

在机器学习和深度学习中,训练模型的目标是通过最小化损失函数来优化模型参数,而梯度是一种用于指导参数更新的重要工具。

二、SGD

SGD 是随机梯度下降(Stochastic Gradient Descent)的缩写。梯度下降是一种优化算法,用于最小化损失函数,通过迭代更新参数来逐步调整模型以最小化损失。在机器学习和深度学习中,梯度下降被广泛用于训练模型。

随机梯度下降梯度下降的一种变体,其基本思想是每次迭代时随机选择一个样本来计算梯度并更新参数,而不是使用整个训练集来计算梯度。相比于传统的批量梯度下降(Batch Gradient Descent),随机梯度下降的计算代价更低尤其在大规模数据集上更为高效

优点:随机梯度下降通常用于训练大规模数据集和深度神经网络,因为它能够以较低的计算成本和内存消耗实现模型的训练。

缺点:由于随机梯度下降对梯度的估计是基于单个样本的,因此可能会导致参数更新的不稳定性,需要采用一些技巧来调整学习率和控制收敛速度,如学习率衰减、动量等。

三、简单代码举例

当使用 PyTorch 进行随机梯度下降的实现时,可以通过 PyTorch 提供的优化器类 torch.optim.SGD 来实现。以下是一个简单的示例代码,展示了如何使用 PyTorch 来实现随机梯度下降算法:

import torch
import torch.nn as nn
import torch.optim as optim# 假设有一些训练数据
# 这里我们创建一个简单的线性回归问题
# 输入特征维度为 1,输出维度为 1
# 我们的目标是拟合一个简单的线性函数 y = 2x + 1# 构建训练数据
x_train = torch.tensor([[1.0], [2.0], [3.0], [4.0]])
y_train = torch.tensor([[3.0], [5.0], [7.0], [9.0]])# 构建一个简单的线性模型
model = nn.Linear(1, 1)# 定义损失函数,这里使用均方误差损失
criterion = nn.MSELoss()# 定义优化器,这里使用随机梯度下降
optimizer = optim.SGD(model.parameters(), lr=0.01)# 进行模型训练
num_epochs = 100
for epoch in range(num_epochs):# 前向传播outputs = model(x_train)# 计算损失loss = criterion(outputs, y_train)# 梯度清零optimizer.zero_grad()# 反向传播loss.backward()# 更新参数optimizer.step()if (epoch+1) % 10 == 0:print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')# 测试模型
x_test = torch.tensor([[5.0]])
predicted = model(x_test)
print(f'Predicted value for x = 5: {predicted.item():.4f}')

运行结果截图:

图1 运行结果

这个示例代码中,我们首先定义了训练数据 x_trainy_train,然后构建了一个简单的线性模型 model。接着定义了损失函数 criterion,这里使用均方误差损失。然后使用 torch.optim.SGD 定义了优化器 optimizer,学习率设置为 0.01。

在训练过程中,我们对模型进行多轮的迭代,每一轮中首先进行前向传播计算输出,然后计算损失,接着梯度清零,进行反向传播计算梯度,最后更新参数。最后我们对模型进行测试,对一个新的输入样本进行预测。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/797044.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

怎么转换图片格式jpg?分享几种转换的方法

我们都知道现在图片格式种类非常多,比较常用的有jpg、png、webp等,很多时候,我们在网上保存的照片不是jpg格式的,查看或者编辑起来就很麻烦,这时候你可能需要将图片转换成jpg格式,那怎么转换图片格式jpg呢?…

【CNN】ConvMixer探究ViT的Patch Embedding: Patches Are All You Need?

Patches Are All You Need? 探究Patch Embedding在ViT上的作用,CNN是否可用该操作提升性能? 论文链接:https://openreview.net/pdf?idTVHS5Y4dNvM 代码链接:https://github.com/tmp-iclr/convmixer 1、摘要 ViT的性能是由于T…

我的 256天 创作纪念日

创作纪念日 我与CSDN的初识耕耘后的收获有笑有泪的日常小小的成就我的憧憬 我与CSDN的初识 在大一上学期的C语言课程中,我首次接触到CSDN。那时,面对众多难以理解的题目,我不得不频繁搜索相关知识和题解,CSDN成了我的救星。这个经…

这几个小众SaaS知识库工具原来这么好用,强烈推荐!

时代的进步和科技的发展,让我们有了更多高效的工作工具。由于云计算和SaaS(Software as a Service)的普及,越来越多的知识库工具被广大用户所知和使用。今天,就让我来为你推荐几款小众但卓效独特的SaaS知识库工具。 首…

市场首款!华邦电子发布内置PQC算法的闪存产品

3月27日,全球领先的半导体内存解决方案供应商华邦电子股份有限公司推出TrustME Secure Flash W77Q系列的最新扩展,包括256Mb、512Mb和1Gb器件。 这些突破性的安全闪存设备是市场上首款针对后量子密码学(PQC)实施Leighton-Micali签…

FSP7罗德与施瓦茨FSP7频谱分析仪

181/2461/8938产品概述: 罗德与施瓦茨 FSP7 频谱分析仪以其创新的测量和大量标准功能而著称。FSP7 没有提供多种选项,而是标配了最先进的频谱分析仪所需的所有功能和接口。FSP 具有如此丰富的功能,以极具吸引力的性价比提供最先进的频谱分析…

windows下Msys2编译OpenOCD方法与总结

windows下Msys2编译OpenOCD方法与总结 参考博客: 编译的总体方法:https://blog.csdn.net/MicroMehhh/article/details/135721360lib-usb库问题的解决办法:https://github.com/espressif/openocd-esp32/issues/162编译方法参考: …

智过网:一建继续教育,操作指南与周期解析

随着社会的快速发展和技术的不断更新,建筑行业对从业人员的专业素质要求也在逐步提高。为了确保一级建造师的专业技能能够与时俱进,满足行业发展的需求,继续教育成为了必不可少的环节。本文将详细解析一建继续教育的操作流程及其周期安排&…

前端开发学习笔记 3 (Chrome浏览器调试工具、Emmet语法、CSS复合选择器、CSS元素选择模式、CSS背景)

文章目录 Chrome浏览器调试工具Emmet语法CSS复合选择器后代选择器子选择器并集选择器伪类选择器 CSS元素选择模式元素选择模式概述CSS块标签CSS行内标签CSS行内块标签CSS元素显示模式转换 CSS背景CSS背景颜色CSS背景图片CSS背景图片平铺CSS背景图片位置CSS背景图片固定CSS背景复…

解锁网络安全新境界:雷池WAF社区版让网站防护变得轻而易举!

网站运营者的救星:雷池WAF社区版 ️ 嘿朋友们!今天我超级激动要跟你们分享一个神器——雷池WAF社区版。这个宝贝对我们这帮网站运营者来说,简直就是保护伞! 智能语义分析技术:超级侦探上线 先说说为啥我这么稀饭它。雷…

10倍提效!用ChatGPT编写系统功能文档。。。

系统功能文档是一种描述软件系统功能和操作方式的文档。它让开发团队、测试人员、项目管理者、客户和最终用户对系统行为有清晰、全面的了解。 通过ChatGPT,我们能让编写系统功能文档的效率提升10倍以上。 ​《Leetcode算法刷题宝典》一位阿里P8大佬总结的刷题笔记…

TCP挥手中TIME_WAIT存在的原因

四次挥手的一般过程如图所示: 在客户端收到FIN结束报文的时候不是立刻进入CLOSED状态,而是进入TIME_WAIT状态,一般等2MLS后进入关闭状态。 原因: 1.可靠地终止 TCP 连接。 2.保证让迟来的 TCP报文段有足够的时间被识别并丢弃。 …

长文本大模型火爆国内AI市场,算力需求激增引领行业变革

近期,一款名为Kimi的大模型火爆国内AI市场,以其出色的长文本处理能力和广泛的应用前景吸引了众多关注。随着Kimi等长文本大模型的流行,算力需求持续增长,为AI行业带来了新的变革和机遇。 Kimi突破长文本处理极限,为复杂…

Leetcode-Hot 100题目分类

哈希 &#xff08;以空间换时间&#xff09; 1 两数之和 原始的暴力破解的方法&#xff1a; class Solution {public int[] twoSum(int[] nums, int target) {/** 暴力破解的方法 */int[] result new int[2];int length nums.length;for(int i 0;i<length;i){for(int j…

win10鼠标无限转圈圈是什么原因,win10系统鼠标无限转圈圈

win10鼠标无限转圈圈是什么原因?一般后台有程序在运行,鼠标出现圆圈转动则代表正在加载中,等待一会就好了。若如果转了好久的圈圈,程序没有响应,点击桌面也没有反应,则尝试打开任务管理器,将未响应或异常的程序强制结束掉。其实,出现这种情况,有可能是win10系统中的一…

【氮化镓】GaN SP-HEMT的栅极可靠性

概括总结&#xff1a; 本文研究了氮化镓&#xff08;GaN&#xff09;肖特基型p-栅高电子迁移率晶体管&#xff08;GaN SP-HEMT&#xff09;的栅极鲁棒性和可靠性&#xff0c;通过一种新的电路方法评估了在实际转换器中栅极电压&#xff08;VGS&#xff09;过冲波形的栅极电压应…

第四百四十二回 再谈flutter_launcher_icons包

文章目录 1. 概念介绍2. 使用方法3. 示例代码4. 经验与总结4.1 经验分享4.2 内容总结 我们在上一章回中介绍了"overlay_tooltip简介"相关的内容&#xff0c;本章回中将 再谈flutter_launcher_icons包.闲话休提&#xff0c;让我们一起Talk Flutter吧。 1. 概念介绍 …

dockerhub右键快速搜索脚本

Chrome 浏览器扩展的后台脚本&#xff0c;用于创建右键菜单项&#xff0c;并根据用户的操作在新的标签页中打开 Docker Hub 网站或者进行搜索。 // 创建右键菜单项&#xff0c;用于打开 Docker Hub 网站 chrome.contextMenus.create({id: search-home, // 菜单项的唯一标识符t…

吴恩达2022机器学习专项课程(一) 4.6 运行梯度下降第一周课程实验:线性回归的梯度下降算法

问题预览/关键词 更新梯度下降对模型拟合&#xff0c;等高线图&#xff0c;3d空间图的变化。什么是批量梯度下降。实验目标计算梯度运行梯度下降梯度下降迭代次数和成本函数的关系可视化模型预测在等高线图上的梯度下降学习率过大报错问题 笔记 1.模型拟合&#xff0c;等高线…

刷题之Leetcode283题(超级详细)

283.移动零 283. 移动零https://leetcode.cn/problems/move-zeroes/ 给定一个数组 nums&#xff0c;编写一个函数将所有 0 移动到数组的末尾&#xff0c;同时保持非零元素的相对顺序。 请注意 &#xff0c;必须在不复制数组的情况下原地对数组进行操作。 示例 1: 输入: nu…