机器学习8-卷积和卷积核1

机器学习8-卷积和卷积核1

  • 卷积与图像去噪
    • 卷积的定义与性质
      • 定义
      • 性质
      • 卷积的原理
      • 卷积步骤
      • 卷积的示例与应用
      • 卷积的优缺点
        • 优点
        • 缺点
      • 总结
  • 高斯卷积核
      • 卷积核尺寸的设置
        • 依据任务类型
        • 考虑数据特性
        • 实验与调优
      • 高斯函数标准差的设置
        • 依据平滑需求
        • 结合卷积核尺寸
        • 实际应用场景
      • 总结
  • 图像噪声与中值滤波器
    • 高斯噪声
      • 定义
      • 概率分布
      • 产生原因
      • 对图像和信号的影响
      • 去除方法
    • 中值滤波

在这里插入图片描述

卷积与图像去噪

在这里插入图片描述

卷积的定义与性质

定义

卷积是数学中的一种运算,广泛应用于信号处理、图像处理和机器学习等领域。在机器学习中,卷积通常指卷积神经网络(CNN)中的卷积操作。

卷积操作可以表示为:
[ ( f ∗ g ) ( t ) = ∫ − ∞ ∞ f ( τ ) g ( t − τ ) d τ (f * g)(t) = \int_{-\infty}^{\infty} f(\tau) g(t - \tau) \, d\tau (fg)(t)=f(τ)g(tτ)dτ]
在离散情况下,卷积操作可以表示为:
[ ( f ∗ g ) [ n ] = ∑ m = − ∞ ∞ f [ m ] g [ n − m ] (f * g)[n] = \sum_{m=-\infty}^{\infty} f[m] g[n - m] (fg)[n]=m=f[m]g[nm]]

在CNN中,卷积操作通常是在二维图像上进行的,卷积核(或滤波器)在输入图像上滑动,计算局部区域的加权和。

性质

  1. 线性性:卷积是线性操作,满足叠加原理。
  2. 平移不变性:卷积操作对输入信号的平移是不变的。
  3. 交换性:卷积操作满足交换律,即 ( f ∗ g = g ∗ f f * g = g * f fg=gf)。
  4. 结合性:卷积操作满足结合律,即 ( ( f ∗ g ) ∗ h = f ∗ ( g ∗ h ) (f * g) * h = f * (g * h) (fg)h=f(gh))。

卷积的原理

在CNN中,卷积操作通过卷积核(filter)在输入数据(如图像)上滑动,计算局部区域的加权和。卷积核的参数通过训练过程学习得到。

卷积步骤

  1. 输入数据:通常是二维图像或多通道图像。

  2. 卷积核:一个小的矩阵,包含可学习的参数。
    边界填充
    在这里插入图片描述
    不考虑边界图像会变小,如果不想变小只能填充像素。
    在这里插入图片描述

拉伸 -镜像
在这里插入图片描述
0填充
在这里插入图片描述

  1. 滑动窗口:卷积核在输入数据上滑动,计算每个位置的加权和。

  2. 输出特征图:卷积操作的结果是一个新的特征图,反映了输入数据中某些特征的响应。

卷积的示例与应用

在这里插入图片描述

在这里插入图片描述
平滑
在这里插入图片描述

锐化
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

卷积在机器学习和深度学习中有广泛的应用,特别是在图像处理和计算机视觉领域。

  1. 图像分类:CNN通过卷积层提取图像的特征,用于分类任务。
  2. 目标检测:卷积操作用于检测图像中的目标物体。
  3. 图像分割:卷积操作用于将图像分割成不同的区域。
  4. 自然语言处理:卷积操作也可以应用于文本数据,提取局部特征。

卷积的优缺点

优点
  1. 局部感知:卷积操作只关注局部区域,减少了参数数量,降低了计算复杂度。
  2. 参数共享:卷积核在输入数据上共享参数,进一步减少了参数数量。
  3. 平移不变性:卷积操作对输入数据的平移是不变的,适合处理图像等数据。
  4. 层次化特征提取:通过多层卷积操作,可以提取从低级到高级的特征。
缺点
  1. 计算复杂度:虽然卷积操作减少了参数数量,但在大规模数据上仍然需要大量计算资源。
  2. 局部性限制:卷积操作只关注局部区域,可能忽略全局信息。
  3. 超参数选择:卷积核的大小、步长、填充等超参数需要仔细选择,影响模型性能。

总结

卷积是机器学习和深度学习中一种重要的操作,特别适用于处理图像等具有局部结构的数据。通过卷积操作,可以有效地提取数据的特征,降低模型的复杂度,提高模型的性能。然而,卷积操作也存在一些局限性,需要在实际应用中仔细权衡。

高斯卷积核

在这里插入图片描述
存在振铃问题

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

如何设置卷积核的尺寸和高斯函数的标准差?
方差的变化
在这里插入图片描述
方差越大,平滑效果明显

尺寸的变化

在这里插入图片描述

模板尺寸越大, 平滑效果越强

总结

  • 大方差或者大尺寸卷积核平滑能力强;
  • 小方差或者小尺寸卷积核平滑能力弱;
  • 经验法则:将卷积核的半窗宽度设置为3σ,最终卷积模板尺寸为2×3σ+1。
    例子:标准差设置成1,卷积模板宽度=231+1=7

在图像处理和深度学习领域,卷积核尺寸和高斯函数标准差的设置是比较关键的操作,以下分别介绍它们的设置方法:

卷积核尺寸的设置

依据任务类型
  • 边缘检测:通常会使用较小的卷积核,如 3x3 或 5x5。以 Sobel 算子为例,它使用 3x3 的卷积核来检测图像中的边缘信息。小尺寸的卷积核能够聚焦于局部像素的变化,从而更敏锐地捕捉边缘特征。
  • 特征提取:对于浅层网络,可能会使用较小的卷积核(如 3x3)来提取图像的基本特征,如纹理、颜色等;而在深层网络中,有时会使用较大的卷积核(如 7x7)来获取更全局的特征信息。例如,在 AlexNet 中,第一层卷积层使用了 11x11 的大卷积核来捕捉图像的宏观特征。
  • 图像分割:卷积核的尺寸选择会根据具体的分割任务和数据集特点而定。一般来说,较小的卷积核可以用于细化分割边界,而较大的卷积核可以用于融合不同区域的信息。
考虑数据特性
  • 图像分辨率:对于高分辨率的图像,可以适当使用较大的卷积核来减少计算量,同时避免丢失过多的细节信息;而对于低分辨率的图像,使用较小的卷积核可以更好地保留图像的细节。
  • 数据集大小:如果数据集较小,使用较小的卷积核可以减少模型的参数数量,降低过拟合的风险;如果数据集较大,可以尝试使用较大的卷积核来增加模型的表达能力。
实验与调优

通过多次实验,尝试不同的卷积核尺寸,并使用验证集评估模型的性能,选择性能最优的卷积核尺寸。可以采用网格搜索、随机搜索等方法来系统地探索不同的卷积核尺寸组合。

高斯函数标准差的设置

依据平滑需求
  • 轻微平滑:当只需要对图像进行轻微的平滑处理,去除一些高频噪声时,可以选择较小的标准差,如 0.5 - 1.0。较小的标准差会使高斯函数的分布更集中,卷积操作主要影响相邻的少数像素,对图像的整体结构影响较小。
  • 显著平滑:如果需要对图像进行更强烈的平滑处理,去除较大的噪声或模糊图像细节,可以选择较大的标准差,如 3.0 - 5.0 甚至更大。较大的标准差会使高斯函数的分布更广泛,卷积操作会影响更多的像素,从而达到更显著的平滑效果。
结合卷积核尺寸

高斯卷积核的尺寸和标准差通常是相互关联的。一般来说,卷积核的尺寸应该足够大,以覆盖高斯函数的主要部分。通常可以根据标准差来确定合适的卷积核尺寸,例如,当标准差为 σ 时,卷积核的尺寸可以选择为 (6σ + 1) x (6σ + 1) ,以确保高斯函数的大部分能量都被包含在卷积核内。

实际应用场景
  • 图像预处理:在图像预处理阶段,如去噪、图像增强等,标准差的选择要根据图像的噪声水平和具体的处理目标来确定。例如,对于包含椒盐噪声的图像,可以先使用较大的标准差进行平滑处理,然后再进行其他处理。
  • 特征提取:在提取图像特征时,标准差的选择会影响特征的提取效果。较小的标准差可以提取更精细的特征,而较大的标准差可以提取更宏观的特征。例如,在人脸检测中,可以使用不同标准差的高斯滤波器来提取不同尺度的人脸特征。

同样,也可以通过实验的方法,尝试不同的标准差取值,并根据实际应用的评估指标(如准确率、召回率等)来选择最优的标准差。

总结

去除图像中的“高频”成分(低通滤波器)
两个高斯卷积核卷积后得到的还是高斯卷积核

  • 使用多次小方差卷积核连续卷积,可以得到与大方差卷积核相同的结果
  • 使用标准差为σ的高斯核进行两次卷积与使用标准差σ√2 的高斯核进行一次卷积相同

可分离

  • 可分解为两个一维高斯的乘积
    在这里插入图片描述

1.用尺寸为/m×m的卷积核卷积一个尺寸为n×n的图像,其计算复杂度是多少?
在这里插入图片描述
小模板多次卷积比一个大模板一次卷积计算量低很多

图像噪声与中值滤波器

在这里插入图片描述

高斯噪声

在这里插入图片描述
高斯噪声是一种在信号处理、图像处理、通信等多个领域经常出现的噪声类型

定义

高斯噪声是指其概率密度函数服从高斯分布(也称为正态分布)的噪声。在实际应用中,许多自然噪声和测量噪声都近似服从高斯分布,因此高斯噪声是一种非常常见且重要的噪声模型。

概率分布

高斯分布的概率密度函数由均值(μ)和标准差(σ)两个参数完全确定,其数学表达式为:
[ f ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} f(x)=σ2π 1e2σ2(xμ)2]
其中, x x x 是随机变量的值, μ \mu μ 是分布的均值,它决定了分布的中心位置; σ \sigma σ 是标准差,它决定了分布的宽度,即噪声的分散程度。当 μ = 0 \mu = 0 μ=0 时,称为零均值高斯噪声。

产生原因

  • 电子设备内部的热噪声:电子元件中的电子由于热运动产生的随机噪声,这种噪声在各种电子设备中普遍存在,如放大器、传感器等。
  • 通信信道中的噪声:在信号传输过程中,信道中的各种干扰因素会引入高斯噪声,例如无线通信中的大气噪声、多径衰落等。
  • 测量误差:在数据采集和测量过程中,由于测量设备的精度限制和环境干扰,可能会产生高斯噪声。

对图像和信号的影响

  • 对图像的影响:高斯噪声会使图像变得模糊、粗糙,降低图像的清晰度和质量。在图像中,噪声表现为随机分布的灰度值变化,使得图像的细节信息被掩盖,影响图像的视觉效果和后续的处理(如边缘检测、特征提取等)。
  • 对信号的影响:在信号处理中,高斯噪声会干扰信号的真实值,使信号的幅度和相位发生随机变化,导致信号失真。这会影响信号的检测、识别和分析,降低系统的性能和可靠性。

去除方法

在这里插入图片描述

噪声的方差越大,卷积和的方差也要越大。但是此时也会带来副作用,会影响图像本身的显示。

  • 线性滤波:如均值滤波和高斯滤波。均值滤波是将每个像素的邻域内像素值取平均值作为该像素的新值,它可以在一定程度上平滑噪声,但会使图像边缘模糊。高斯滤波则是根据高斯函数对邻域像素进行加权平均,它在平滑噪声的同时能较好地保留图像的边缘信息。
  • 非线性滤波:如中值滤波。中值滤波是将邻域内像素值的中值作为该像素的新值,它对脉冲噪声和椒盐噪声有较好的抑制效果,同时也能在一定程度上去除高斯噪声,并且对图像边缘的保护能力较强。
  • 基于变换域的方法:如小波变换。小波变换可以将图像或信号分解到不同的尺度和频率子带中,通过对不同子带的系数进行处理,去除噪声分量,然后再进行重构得到去噪后的图像或信号。
  • 深度学习方法:近年来,深度学习在图像去噪领域取得了显著的成果。通过训练深度神经网络(如卷积神经网络),可以学习到高斯噪声的特征和图像的先验信息,从而实现高效的图像去噪。

中值滤波

对于椒盐噪声和脉冲噪声使用高斯卷积核去噪是很难去掉的。
在这里插入图片描述
中值滤波的原理示意图。
在这里插入图片描述

控制滤波的效果在这里插入图片描述
认识了三种类型的噪声,椒盐噪声、脉冲噪声及高斯噪声对于前两者建议使用中值滤波器对于高斯噪声可以使用高斯卷积核来进行去噪。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/895002.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SVN 提交与原有文件类型不一样的文件时的操作

SVN 提交与原有文件类型不一样的文件时的操作 背景 SVN 服务器上原本的文件是软链接类型的,但是我将它改成普通文件再上传。出现了以下提示: 解决过程 本来想着通过 svn rm 和 svn add 来解决,但是行不通。 最终解决方案 svn rm --keep-…

阿里云专有云网络架构学习

阿里云专有云网络架构 叶脊(spine-leaf)网络和传统三层网络拓扑对比 阿里云网络架构V3拓扑角色介绍推荐设备设备组网举例带外管理网络带外网和带内网对比设备介绍 安全网络设备介绍 参考 后续更新流量分析叶脊(spine-leaf)网络和传…

Deepseek本地部署指南:在linux服务器部署,在mac远程web-ui访问

1. 在Linux服务器上部署DeepSeek模型 要在 Linux 上通过 Ollama 安装和使用模型,您可以按照以下步骤进行操作: 步骤 1:安装 Ollama 安装 Ollama: 使用以下命令安装 Ollama: curl -sSfL https://ollama.com/download.…

3D数字化营销:重塑家居电商新生态

随着电商的蓬勃发展,网上订购家具已成为众多消费者的首选。然而,线上选购家具的诸多挑战,如风格不匹配、尺寸不合适、定制效果不如预期以及退换货不便等,一直困扰着消费者。为解决这些问题,家居行业急需一种全新的展示…

重塑“景区+商业”模式,打造特色文旅新体验

重塑“景区商业”模式,打造特色文旅新体验 近年来,旅游业蓬勃发展,旅游热潮不断升温,游客消费观念也随之升级。为顺应这一趋势,各大景区纷纷探索打造特色文旅项目,以期吸引更多游客。然而,“景…

在亚马逊云科技上云原生部署DeepSeek-R1模型(下)

在本系列的上篇中,我们介绍了如何通过Amazon Bedrock部署并测试使用了DeepSeek模型。在接下来的下篇中小李哥将继续介绍,如何利用亚马逊的AI模型训练平台SageMaker AI中的,Amazon Sagemaker JumpStart通过脚本轻松一键式部署DeepSeek预训练模…

Kubernetes是什么?为什么它是云原生的基石

从“手工时代”到“自动化工厂” 想象一下,你正在经营一家工厂。在传统模式下,每个工人(服务器)需要手动组装产品(应用),效率低下且容易出错。而Kubernetes(k8s)就像一个…

Transformer 详解:了解 GPT、BERT 和 T5 背后的模型

目录 什么是 Transformer? Transformer如何工作? Transformer 为何有用? 常见问题解答:机器学习中的 Transformer 在技​​术领域,突破通常来自于修复损坏的东西。制造第一架飞机的人研究过鸟类。莱特兄弟观察了秃鹫如何在气流中保持平衡,意识到稳定性比动力更重要。…

图片webp格式动图图片

这是一个webp动图1 这是一个webp动图2 webp 图像由gif 转换 3

【R语言】plyr包和dplyr包

一、plyr包 plyr扩展包主要是实现数据处理中的“分割-应用-组合”(split-apply-combine)策略。此策略是指将一个问题分割成更容易操作的部分,再对每一部分进行独立的操作,最后将各部分的操作结果组合起来。 plyr扩展包中的主要函…

【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析

一、引言与背景 在人工智能领域,大型语言模型(LLM)如DeepSeek以其卓越的自然语言理解和生成能力,推动了众多应用场景的发展。然而,大型模型的高昂计算和存储成本,以及潜在的数据隐私风险,限制了…

【AI】在Ubuntu中使用docker对DeepSeek的部署与使用

这篇文章前言是我基于部署好的deepseek-r1:8b模型跑出来的 关于部署DeepSeek的前言与介绍 在当今快速发展的技术环境中,有效地利用机器学习工具来解决问题变得越来越重要。今天,我将引入一个名为DeepSeek 的工具,它作为一种强大的搜索引擎&a…

TCP三次握手全方面详解

文章目录 (1) 三次握手各状态CLOSE状态SYN_SENT状态SYN_RECV状态ESTABLISHED状态 (2) 为什么握手时的seqnum是随机值,以及acknum的功能(3) 三次握手中的半连接队列(SYN队列)和全连接队列(ACCEPT队列)半连接队列全连接队…

数据结构与算法-递归

单路递归 二分查找 /*** 主函数:执行二分查找。* * param a 要搜索的数组(必须是已排序的)* param target 目标值* return 返回目标值在数组中的索引;如果未找到,则返回 -1*/ public static int binarySearch(int[] …

Termux安装ssh实现电脑ssh

Termux下载 点击下载 在 Termux 中安装并使用 SSH,按照以下步骤操作: 1. 更新软件包列表 pkg update && pkg upgrade2. 安装 OpenSSH pkg install openssh3. 设置 SSH 密码(必须,否则无法使用 SSH 服务器&#xff09…

深入理解 C++17 std::is_swappable

文章目录 深入理解 C17 std::is_swappable引言std::is_swappable 概述std::is_swappable 的工作原理std::is_swappable 的变体注意事项结论 深入理解 C17 std::is_swappable 引言 在 C 编程中,交换两个对象的值是一个常见的操作。为了确保代码的通用性和安全性&am…

51单片机之冯·诺依曼结构

一、概述 8051系列单片机将作为控制应用最基本的内容集成在一个硅片上,其内部结构如图4-1所示。作为单一芯片的计算机,它的内部结构与一台计算机的主机非常相似。其中微处理器相当于计算机中的CPU,由运算器和控制器两个部分构成;…

w~Transformer~合集5

我自己的原文哦~ https://blog.51cto.com/whaosoft/12406495 #transformer~x1 太可怕了都到6了 太强~~ DeepMind 表示,他们提出的算法蒸馏(AD)是首个通过对具有模仿损失的离线数据进行顺序建模以展示上下文强化学习的方法。同时基于观察…

c#对接deepseek 聊天AI接口

注意:不是免费 对接文档:对话补全 | DeepSeek API Docs 注册地址:DeepSeek 申请key 在线请求示例 apifox deepseek - deepseek

23.PPT:校摄影社团-摄影比赛作品【5】

目录 NO12345​ NO6 NO7/8/9/10​ 单元格背景填充表格背景填充文本框背景填充幻灯片背景格式设置添加考生文件夹下的版式 NO12345 插入幻灯片和放入图片☞快速:插入→相册→新建相册→文件→图片版式→相框形状→调整边框宽度左下角背景图片:视图→…