PyTorch实现二维卷积与边缘检测:从原理到实战

本文通过PyTorch实现二维互相关运算、自定义卷积层,并演示如何通过卷积核检测图像边缘。同时,我们将训练一个卷积核参数,使其能够从数据中学习边缘特征。


1. 二维互相关运算的实现

互相关运算(Cross-Correlation)是卷积操作的基础。以下代码实现了二维互相关运算:

import torch
from torch import nndef corr2d(x, k):h, w = k.shapey = torch.zeros((x.shape[0] - h + 1, x.shape[1] - w + 1))for i in range(y.shape[0]):for j in range(y.shape[1]):y[i, j] = (x[i:i+h, j:j+w] * k).sum()  # 逐元素相乘后求和return y

验证输出
输入矩阵和卷积核如下,输出结果为互相关运算后的张量:

x = torch.tensor([[0.0, 1.0, 2.0], [3.0, 4.0, 5.0], [6.0, 7.0, 8.0]])
k = torch.tensor([[0.0, 1.0], [2.0, 3.0]])
print(corr2d(x, k))

输出

tensor([[19., 25.],[37., 43.]])

2. 自定义二维卷积层

通过继承nn.Module实现一个自定义卷积层,包含可学习的权重和偏置:

class Conv2D(nn.Module):def __init__(self, kernel_size):super().__init__()self.weight = nn.Parameter(torch.rand(kernel_size))self.bias = nn.Parameter(torch.zeros(1))def forward(self, x):return corr2d(x, self.weight) + self.bias

3. 边缘检测应用

3.1 构造输入图像

创建一个6x8的矩阵,中间4列为黑色(值为0),两侧为白色(值为1):

x = torch.ones(6, 8)
x[:, 2:6] = 0
print(x)

输出

tensor([[1., 1., 0., 0., 0., 0., 1., 1.],[1., 1., 0., 0., 0., 0., 1., 1.],[1., 1., 0., 0., 0., 0., 1., 1.],[1., 1., 0., 0., 0., 0., 1., 1.],[1., 1., 0., 0., 0., 0., 1., 1.],[1., 1., 0., 0., 0., 0., 1., 1.]])

3.2 定义卷积核

使用卷积核[[1, -1]]检测垂直边缘:

k = torch.tensor([[1.0, -1.0]])
y = corr2d(x, k)
print(y)

输出

tensor([[ 0.,  1.,  0.,  0.,  0., -1.,  0.],[ 0.,  1.,  0.,  0.,  0., -1.,  0.],[ 0.,  1.,  0.,  0.,  0., -1.,  0.],[ 0.,  1.,  0.,  0.,  0., -1.,  0.],[ 0.,  1.,  0.,  0.,  0., -1.,  0.],[ 0.,  1.,  0.,  0.,  0., -1.,  0.]])
  • 结果解释
    输出中1表示从白到黑的边缘,-1表示从黑到白的边缘。

3.3 水平边缘检测

若将输入矩阵转置,原卷积核无法检测水平边缘:

print(corr2d(x.T, k))

输出:全零矩阵(无法检测到水平边缘)

tensor([[0., 0., 0., 0., 0.],[0., 0., 0., 0., 0.],...])

4. 学习卷积核参数

使用PyTorch内置的nn.Conv2d,通过梯度下降学习卷积核参数:

# 定义模型
conv2d = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=(1, 2), bias=False)# 调整输入输出形状
x = x.reshape((1, 1, 6, 8))  # (batch_size, channels, height, width)
y = y.reshape((1, 1, 6, 7))# 训练过程
for i in range(10):y_hat = conv2d(x)loss = (y_hat - y).pow(2)conv2d.zero_grad()loss.sum().backward()conv2d.weight.data[:] -= 3e-2 * conv2d.weight.grad  # 更新权重if (i+1) % 2 == 0:print(f'batch{i+1}, loss{loss.sum():.3f}')

输出

batch2, loss5.270
batch4, loss0.884
batch6, loss0.148
batch8, loss0.025
batch10, loss0.004

4.1 查看学习后的卷积核

训练后的权重接近理想值[1, -1]

print(conv2d.weight.data.reshape((1, 2)))

输出

tensor([[ 0.9883, -0.9878]])

5. 总结

  1. 互相关运算:通过逐窗口计算实现基础的卷积操作。

  2. 边缘检测:方向特定的卷积核可提取图像边缘特征。

  3. 参数学习:利用梯度下降可自动学习卷积核参数,无需手动设计。

完整代码已验证,读者可自行调整输入或卷积核探索更多效果。


提示:实际项目中建议使用PyTorch内置的高效卷积层(如nn.Conv2d),而非手动实现,以充分利用GPU加速。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/901116.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数字政府网络架构建设方案

数字政府网络架构建设方案 一、引言 随着信息技术的快速发展,数字政府建设已成为提升政府治理能力和服务水平的关键。网络架构作为数字政府的核心基础设施,对于保障数据安全、提高服务效率、促进信息共享具有重要意义。本方案旨在为数字政府网络架构建…

Python map函数介绍

在 Python 里,map() 是一个内置函数,其用途是将指定的函数应用于可迭代对象(像列表、元组等)的每个元素,最终返回一个新的迭代器。此迭代器所包含的元素是原可迭代对象中每个元素经过指定函数处理后的结果。map() 函数…

【服务器端表单字符验证】

文章目录 一、实验目的二、核心代码实现三、调试关键问题四、总结 一、实验目的 掌握JSP表单验证在服务器端的实现技术&#xff0c;实现对用户输入字符的非空及长度为5的验证&#xff0c;返回对应提示信息并优化用户交互。 二、核心代码实现 前端表单 <form action"…

dify windos,linux下载安装部署,提供百度云盘地址

dify下载安装 dify1.0.1 windos安装包百度云盘地址 通过网盘分享的文件&#xff1a;dify-1.0.1.zip 链接: 百度网盘 请输入提取码 提取码: 1234 dify安装包 linux安装包百度云盘地址 通过网盘分享的文件&#xff1a;dify-1.0.1.tar.gz 链接: 百度网盘 请输入提取码 提取码…

C++ Primer 5e 习题2.5: 指出如下字面量常量的类型

Exercise 2.5: Determine the type of each of the following literals. Explain the differences among the literals in each of the four examples: (a) ‘a’, L’a’, “a”, L"a" (b) 10, 10u, 10L, 10uL, 012, 0xC © 3.14, 3.14f, 3.14L (d) 10, 10u, 10…

CFS 调度器两种调度类型普通调度 和 组调度

在 Linux 的 CFS&#xff08;Completely Fair Scheduler&#xff09; 调度器中&#xff0c;确实存在两种调度类型&#xff1a;普通调度 和 组调度。这两种调度类型分别适用于不同的场景&#xff0c;并通过三个关键维度&#xff08;权重、抢占优先级、最大配额&#xff09;来影响…

AF3 ProteinDataset类的_get_masked_sequence方法解读

AlphaFold3 protein_dataset模块 ProteinDataset 类 _get_masked_sequence 方法属于作用是为需要预测的残基生成掩码。该掩码以二进制张量形式呈现,其中 1 代表需要预测的部分,0 代表其他部分。此方法会依据多个参数来选定要掩码的残基,这些参数包含 mask_whole_chains、mas…

【音视频】SDL渲染YUV格式像素

SDL视频显示的流程 实现流程 准备视频文件 准备一个格式为yuv420p&#xff0c;分辨率为320x240的yuv数据&#xff0c;并且将视频文件放入项目构建的目录下&#xff1a; 初始化SDL 初始化SDL的视频模块 //初始化 SDL if(SDL_Init(SDL_INIT_VIDEO)) {fprintf( stderr, "…

关于群晖安装tailscale后无法直链的问题

问题是我局域网的ipv6无法正确获取到ip, 通过命令可以看到ipv6没有ip tailscale netcheck C:\Users\Administrator>tailscale netcheck 2025/04/12 23:43:34 attempting to fetch a DERPMap from https://controlplane.tailscale.comReport:* Time: 2025-04-12T15:43:38.27…

[数据结构]Trie字典树

GPT的介绍 &#x1f9e0; 一句话总结&#xff1a; 字典树是一种专门用来存很多字符串的“超级前缀树”&#xff0c;查找某个字符串或前缀的时候&#xff0c;特别快&#xff01; ✍️ 举个生活例子&#xff08;类比&#xff09;&#xff1a; 你想做一个词典&#xff08;Dictio…

04-算法打卡-数组-二分查找-leetcode(69)-第四天

1 题目地址 69. x 的平方根 - 力扣&#xff08;LeetCode&#xff09;69. x 的平方根 - 给你一个非负整数 x &#xff0c;计算并返回 x 的 算术平方根 。由于返回类型是整数&#xff0c;结果只保留 整数部分 &#xff0c;小数部分将被 舍去 。注意&#xff1a;不允许使用任何内…

AI领域再突破,永洪科技荣获“2025人工智能+创新案例”奖

在2025年的今天&#xff0c;人工智能已从技术概念全面渗透至产业核心。中国作为全球AI技术应用的前沿阵地&#xff0c;正通过“人工智能”行动加速推进技术与实体经济深度融合。 这一背景下&#xff0c;永洪科技凭借其“国内某头部ICT人力资源板块GenAI项目”荣获“2025全国企业…

反序列化漏洞介绍与挖掘指南

目录 反序列化漏洞介绍与挖掘指南 一、漏洞核心原理与危害 二、漏洞成因与常见场景 1. 漏洞根源 2. 高危场景 三、漏洞挖掘方法论 1. 静态分析 2. 动态测试 3. 利用链构造 四、防御与修复策略 1. 代码层防护 2. 架构优化 3. 运维实践 五、工具与资源推荐 总结 反…

从零开始的C++编程 2(类和对象下)

目录 1.构造函数初始化列表 2.类型转换 3.static成员 4.友元 5.内部类 6.匿名对象 1.构造函数初始化列表 ①之前我们实现构造函数时&#xff0c;初始化成员变量主要使⽤函数体内赋值&#xff0c;构造函数初始化还有⼀种⽅式&#xff0c;就是初始化列表&#xff0c;初始化…

Profibus DP主站转ModbusTCP网关通讯秘籍

Profibus DP主站转ModbusTCP网关通讯秘籍 在现代工业自动化领域&#xff0c;不同设备间的数据通讯和系统集成至关重要。Profibus DP和Modbus TCP是两种广泛应用的工业通信协议&#xff0c;各有其独特的优势和适用场景。然而&#xff0c;由于历史原因或设备制造商的差异&#x…

【力扣hot100题】(092)最长回文串

有点难度&#xff0c;一开始想到的两种方法都不对&#xff0c;花了不少时间。 先说之前的方法&#xff1a; ① 遍历每个点&#xff0c;每个点向外扩张&#xff0c;如果左等于右就一直扩展直到不等。 这个方法可是可以&#xff0c;但我没有考虑到两个相同字母也是回文串的情况…

14 - VDMA彩条显示实验

文章目录 1 实验任务2 系统框图3 硬件设计4 软件设计 1 实验任务 本实验任务是PS端写彩条数据至DDR3内存中&#xff0c;然后通过PL端的VDMA IP核将彩条数据通过HDMI接口输出显示。 2 系统框图 本实验是用HDMI接口固定输出1080P的彩条图&#xff0c;所以&#xff1a; rgb2lc…

HarmonyOS-ArkUIV2装饰器-@Param:组件外部输入

上文我们了解了@Local装饰器 ,讲明了Local装饰器不允许外部传入值对其进行初始化。详见: HarmonyOS-ArkUI V2装饰器@Local装饰器:组件内部状态-CSDN博客。 但总有场景是需要外部组件传值过来,然后本组件接收这个值这种场景的。而且很多情况下,一个状态变量的作用范围会是…

Java从入门到“放弃”(精通)之旅——运算符③

&#x1f31f;Java从入门到“放弃”&#xff08;精通&#xff09;之旅&#x1f680;&#xff1a;运算符深度解析 引言&#xff1a;运算符的本质与价值 作为Java语言的核心组成部分&#xff0c;运算符是构建程序逻辑的基础元素。它们不仅仅是简单的数学符号&#xff0c;更是程…

【sgSpliter】自定义组件:可调整宽度、高度、折叠的分割线

sgSpliter.vue <template><!-- 注意&#xff1a;父组件position必须是relative、absolute或fixed&#xff0c;不建议直接在绑定:data后面用"{属性}"&#xff0c;建议单独在script中声明data&#xff0c;避免拖拽过程重复调用 --><div :class"$…