晋中建设集团网站/苏州网站关键词优化推广

晋中建设集团网站,苏州网站关键词优化推广,适合在夜晚看的电影,不明原因肺炎最新消息第33集:PyTorch 入门-动态计算图的优势 摘要 PyTorch 是一个灵活且强大的深度学习框架,其核心特性是动态计算图机制。本集将带您探索 PyTorch 的张量操作、自动求导系统以及动态计算图的特点与优势,并通过实战案例演示如何使用 PyTorch 实现…

第33集:PyTorch 入门-动态计算图的优势


摘要

PyTorch 是一个灵活且强大的深度学习框架,其核心特性是动态计算图机制。本集将带您探索 PyTorch 的张量操作、自动求导系统以及动态计算图的特点与优势,并通过实战案例演示如何使用 PyTorch 实现线性回归和构建简单的图像分类模型。我们将重点突出 PyTorch 在研究与开发中的灵活性及其在 AI 大模型训练中的应用。
在这里插入图片描述


核心概念和知识点

1. 张量操作与自动求导

  • 张量(Tensor):类似于 NumPy 数组,但支持 GPU 加速。
  • 自动求导(Autograd):PyTorch 提供了自动微分功能,能够高效计算梯度,用于优化模型参数。

2. 动态计算图的特点与优势

  • 动态计算图:PyTorch 的计算图是在运行时动态构建的,支持即时调试和修改。
  • 灵活性:适合实验性研究,便于实现复杂的模型架构。
  • 直观性:代码执行过程清晰可见,易于理解。

3. 自定义模型与训练循环

  • 模型定义:通过继承 torch.nn.Module 自定义模型结构。
  • 训练循环:手动实现前向传播、损失计算和反向传播,提供更细粒度的控制。

4. AI 大模型相关性分析

PyTorch 是目前主流的 AI 大模型框架之一,广泛应用于 GPT、BERT 等模型的训练:

  • 分布式训练支持:通过 torch.distributed 模块实现多 GPU 和多节点训练。
  • 生态系统丰富:结合 Hugging Face Transformers 等库,可快速搭建和训练大模型。

实战案例

案例 1:使用 PyTorch 实现线性回归

背景

线性回归是最基础的机器学习任务之一,我们使用 PyTorch 实现一个简单的线性回归模型。

代码实现
import torch
import torch.nn as nn
import torch.optim as optim
import matplotlib.pyplot as plt# 数据生成
torch.manual_seed(42)
x = torch.linspace(-1, 1, 100).reshape(-1, 1)  # 输入特征
y = 3 * x + 2 + 0.2 * torch.randn(x.size())   # 带噪声的目标值# 定义模型
class LinearRegressionModel(nn.Module):def __init__(self):super().__init__()self.linear = nn.Linear(1, 1)  # 单输入单输出的线性层def forward(self, x):return self.linear(x)model = LinearRegressionModel()# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = optim.SGD(model.parameters(), lr=0.1)# 训练模型
epochs = 100
for epoch in range(epochs):# 前向传播y_pred = model(x)loss = criterion(y_pred, y)# 反向传播与优化optimizer.zero_grad()loss.backward()optimizer.step()if (epoch + 1) % 10 == 0:print(f"Epoch {epoch+1}/{epochs}, Loss: {loss.item():.4f}")# 可视化结果
predicted = model(x).detach().numpy()
plt.scatter(x.numpy(), y.numpy(), label="Original Data", alpha=0.6)
plt.plot(x.numpy(), predicted, 'r', label="Fitted Line")
plt.legend()
plt.title("Linear Regression with PyTorch")
plt.show()
输出结果
Epoch 10/100, Loss: 0.0431
...
Epoch 100/100, Loss: 0.0012
可视化

案例 2:构建一个简单的图像分类模型

背景

我们使用 CIFAR-10 数据集,构建一个简单的卷积神经网络(CNN)进行图像分类。

代码实现
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms# 数据加载与预处理
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)testset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=32, shuffle=False)# 定义 CNN 模型
class SimpleCNN(nn.Module):def __init__(self):super().__init__()self.conv1 = nn.Conv2d(3, 16, 3, padding=1)self.pool = nn.MaxPool2d(2, 2)self.fc1 = nn.Linear(16 * 16 * 16, 10)def forward(self, x):x = self.pool(torch.relu(self.conv1(x)))x = x.view(-1, 16 * 16 * 16)x = self.fc1(x)return xmodel = SimpleCNN()# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)# 训练模型
for epoch in range(5):  # 仅训练 5 个 epochrunning_loss = 0.0for i, data in enumerate(trainloader):inputs, labels = dataoptimizer.zero_grad()outputs = model(inputs)loss = criterion(outputs, labels)loss.backward()optimizer.step()running_loss += loss.item()if i % 100 == 99:  # 每 100 个 batch 打印一次损失print(f"[{epoch+1}, {i+1}] Loss: {running_loss / 100:.3f}")running_loss = 0.0print("Finished Training")# 测试模型
correct = 0
total = 0
with torch.no_grad():for data in testloader:images, labels = dataoutputs = model(images)_, predicted = torch.max(outputs, 1)total += labels.size(0)correct += (predicted == labels).sum().item()print(f"Accuracy on Test Set: {100 * correct / total:.2f}%")
输出结果
[1, 100] Loss: 2.123
...
Accuracy on Test Set: 55.25%

总结

PyTorch 的动态计算图机制使其成为深度学习研究与开发的理想工具。通过本集的学习,我们掌握了如何使用 PyTorch 实现线性回归和构建简单的图像分类模型,并了解了其在灵活性和实验性方面的优势。


扩展思考

1. PyTorch 在 AI 大模型训练中的应用

PyTorch 是训练 GPT、BERT 等大模型的核心工具之一。其动态计算图机制使得研究人员能够快速迭代模型架构,而分布式训练支持则确保了大模型的高效训练。

2. PyTorch Lightning 的简化功能

PyTorch Lightning 是一个高级接口,旨在简化 PyTorch 的使用。它隐藏了训练循环的复杂性,同时保留了底层灵活性,特别适合大规模实验和生产环境。


专栏链接:Python实战进阶
下期预告:No34 - 使用 Pandas 高效处理时间序列数据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/75532.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

23种设计模式-创建型模式-单例

文章目录 简介问题1. 确保一个类只有一个实例2. 为该实例提供全局访问点 解决方案示例重构前:重构后: 拓展volatile 在单例模式中的双重作用 总结 简介 单例是一种创建型设计模式,它可以确保一个类只有一个实例,同时为该实例提供…

python裁剪nc文件数据

问题描述: 若干个nc文件储存全球的1850-2014年月尺度的mrro数据(或其他数据),从1850-1到2014-12一共1980个月,要提取出最后35年1980.1~2014.12年也就是420个月的数据。 代码实现 def aaa(input_file,output_file,bianliang,start_index,en…

数据清洗:基于python抽取jsonl文件数据字段

基于python抽取目录下所有“jsonl”格式文件。遍历文件内某个字段进行抽取并合并。 import os import json import time from tqdm import tqdm # 需要先安装:pip install tqdmdef process_files():# 设置目录路径dir_path r"D:\daku\关键词识别\1623-00000…

C# .net ai Agent AI视觉应用 写代码 改作业 识别屏幕 标注等

C# net deepseek RAG AI开发 全流程 介绍_c# 向量处理 deepseek-CSDN博客 视觉多模态大模型 通义千问2.5-VL-72B AI大模型能看懂图 看懂了后能干啥呢 如看懂图 让Agent 写代码 ,改作业,识别屏幕 标注等等。。。 据说是目前最好的免费图片识别框架 通…

大模型应用开发之大模型工作流程

一:大模型的问答工作流程 1.1: 分词和向量化 如上图所示,我们如果让大模型去回答问题,首先我们会输入一些文字给到大模型,大模型本质上是个数学模型,它是理解不了人类的整句话的,所以它会把我们的对应的句…

12届蓝桥杯—货物摆放

货物摆放 题目描述 小蓝有一个超大的仓库,可以摆放很多货物。 现在,小蓝有 nn 箱货物要摆放在仓库,每箱货物都是规则的正方体。小蓝规定了长、宽、高三个互相垂直的方向,每箱货物的边都必须严格平行于长、宽、高。 小蓝希望所…

批量优化与压缩 PPT,减少 PPT 文件的大小

我们经常能够看到有些 PPT 文档明明没有多少内容,但是却占用了很大的空间,存储和传输非常的不方便,这时候通常是因为我们插入了一些图片/字体等资源文件,这些都可能会导致我们的 PPT 文档变得非常的庞大,今天就给大家介…

导游职业资格考试:从迷茫到清晰的备考指南

当你决定报考导游职业资格考试时,可能会感到有些迷茫,不知道从何处入手。别担心,这份备考指南将带你从迷茫走向清晰。​ 第一步,全面了解考试。导游职业资格考试分为笔试和面试。笔试的四个科目各有特点,《政策与法律…

【BFS】《BFS 攻克 FloodFill:填平图形世界的技术密码》

文章目录 前言例题一、 图像渲染二、 岛屿数量三、岛屿的最大面积四、被围绕的区域 结语 前言 什么是BFS? BFS(Breadth - First Search)算法,即广度优先搜索算法,是一种用于图或树结构的遍历算法。以下是其详细介绍&am…

Linux安装MySQL数据库并使用C语言进行数据库开发

目录 一、前言 二、安装VMware运行Ubuntu 1.安装VMware 2.使用VMware打开Ubuntu 三、配置VMware使用网卡 1.添加NAT网卡 四、Linux下安装MySQL数据库 五、安装MySQL开发库 六、演示代码 sql_connect.c sql_connect.h main.c中数据库相关代码 结尾 一、前言 由于最…

常见中间件漏洞之一 ----【Tomcat】

中间件Tomcat介绍: tomcat是⼀个开源⽽且免费的jsp服务器,默认端⼝ : 8080,属于轻量级应⽤服务器。它可以实现 JavaWeb程序的装载,是配置JSP(Java Server Page)和JAVA系统必备的⼀款环境。 在历史上也披露…

javaweb自用笔记:Mybatis

目录 mybatis 配置sql书写提示 JDBC 数据库连接池 lombok mybatis 只需要定义Mapper接口就好,不需要有实现类,因为框架底层会自动生成实现类 配置sql书写提示 JDBC 数据库连接池 lombok XML映射文件 动态SQL

比手动备份快 Iperius全自动加密备份,NAS/云盘/磁带机全兼容

IperiusBackupFull是一款专为服务器和工作站设计的备份解决方案,它同时也是一款针对Windows 7/8/10/11/Server系统的简洁且可靠的备份软件。该软件支持增量备份、数据同步以及驱动器镜像,确保能够实现完全的系统恢复。在备份存储方面,Iperius…

mapbox进阶,添加鹰眼图控件

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:mapbox 从入门到精通 文章目录 一、🍀前言1.1 ☘️mapboxgl.Map 地图对象1.2 ☘️mapboxgl.Map style属性1.3 ☘️mapboxgl-minimap 鹰眼控件二、🍀添加…

亮数据爬取API爬取亚马逊电商平台实战教程

前言 在当今数据驱动的商业环境中,企业需要快速、精准地获取互联网上的公开数据以支持市场分析、竞品调研和用户行为研究。然而,传统的手动网页爬取方式面临着诸多挑战:IP封锁、验证码干扰、网站结构频繁变更,以及高昂的运维成本…

“城市超级智能体”落地,联想智慧城市4.0“功到自然成”

作者 | 曾响铃 文 | 响铃说 交通摄像头捕捉到车流量数据,进入一套“自动化”的城市整体管理体系中,交通路况信息、天气变化情况以及城市大型活动安排等看似分散的数据被整合,根据预测的路况精准调控交通信号灯,让自动驾驶清扫车…

计算机复试面试

数据库 1.设计过程/设计步骤 1.需求分析:明确客户需求,确定系统边界,生成数据字典 2.概念结构设计:将用户需求抽象为概念模型,绘制e-r图 3.逻辑结构设计:将e-r图转化为dbms相符合的逻辑结构,db…

模型 拆屋效应

系列文章分享模型,了解更多👉 模型_思维模型目录。先过分后合理,易被接受。 1 拆屋效应的应用 1.1 高端手表销售案例 一、案例背景 在高端手表销售领域,销售人员面临顾客对价格敏感且购买决策谨慎的挑战。如何引导顾客接受较高…

Windows系统下Pycharm+Minianaconda3连接教程【成功】

0.引言 PycharmMinianaconda3开发组合的好处 优点类别具体优点描述环境管理便捷独立环境创建 环境复制与共享Miniconda3可创建多独立Python环境,支持不同版本与依赖,避免冲突。 能复制、分享环境配置,方便团队搭建相同开发环境。依赖管理高…

python每日十题(10)

在Python语言中,源文件的扩展名(后缀名)一般使用.py。 保留字,也称关键字,是指被编程语言内部定义并保留使用的标识符。Python 3.x有35个关键字,分别为:and,as,assert&am…