以图像识别为例,关于卷积神经网络(CNN)的直观解释

大家读完觉得有意义记得关注和点赞!!!

作者以图像识别为例,用图文而非数学公式的方式解释了卷积神经网络的工作原理, 适合初学者和外行扫盲。

目录

1 卷积神经网络(CNN)

1.1 应用场景

1.2 起源:LeNet, 1990s

1.3 现代架构

2 CNN:直观解释

2.1 输入:图像(像素值组成的矩阵)

2.2 第一步:卷积运算

2.2.2 动图直观解释

2.2.2 特征图/卷积特征参数

2.3 第二步:非线性(Non Linearity / ReLU)运算

2.4 第三步:降采样

2.4.1 原理:直观解释

2.4.2 小结:卷积层 + ReLU + 降采样层

2.5 第四步:全连接层:基于特征分类

2.6 第五步:反向传播:形成闭环

3 CNN 完整架构和工作流

4 案例:CNN 学习识别字符 8

4.1 多层特征

4.2 学习字符 8

5 其他 CNN 架构

6 总结

参考资料


1 卷积神经网络(CNN)

1.1 应用场景

卷积神经网络(ConvNets 或 CNN)是一类神经网络(a category of Neural Networks), 在图像识别和分类等领域已经证明非常有效。CNN 已经成功用于 人脸识别、物体和交通标志识别,机器人视觉,自动驾驶等等。下面看两个具体例子。

图 1 是给一个图片,自动识别其中的内容并生成一句描述,

图 1:图像识别和自动生成描述。cs.stanford.edu

图 2 则是 CNN 用于识别日常人和物,

图 2:图像识别。来自 paper pdf

此外,CNN 在一些自然语言处理任务(如句子分类)中也展现出很不错的效果。 因此,CNN 在机器学习领域将是一个非常重要的工具。不过,新手学习起来经常比较受挫。 本文试图拿 CNN for image processing 为例,向大家直观解释一下 CNN 是如何工作的。

  • 想了解 neural networks 可戳 this short tutorial on Multi Layer Perceptrons,不了解也没关系。
  • Multi Layer Perceptrons(多层感知器/多层感知机)在本文中将称为 “Fully Connected Layers”。

1.2 起源:LeNet, 1990s

LeNet 由 Yann LeCun 在 1988 提出,是最早推动深度学习领域发展的卷积神经网络之一。 后来经过多次改进,直到 LeNet5 [3]。 当时 LeNet 架构主要用于字符识别, 例如读取邮政编码、数字等。

1.3 现代架构

近年来提出了几种新的架构,都是对 LeNet 的改进,它们都继承了 LeNet 的主要概念。 因此如果对 LeNet 比较了解,理解现代架构将容易很多。 下图展示了这类架构是如何学习识别图像的:

图 3:基于卷积神经网络识别图像。image credit

  • 图中的卷积神经网络在架构上与早期 LeNet 差不多,它对输入图像进行分类(LeNet 主要用于字符识别);
  • 这个例子中会分成四类:dog, cat, boat, bird,所有概率的总和是 100%(后文会解释);
  • 从图中可以明显看出,在 boat 图像作为输入时,该网络最终的分类结果中,boat 的概率最高(0.94)。

根据上图,我们可以看到现代 CNN 主要有四种操作

  1. 卷积(Convolution)
  2. 非线性(Non Linearity,ReLU))
  3. 池化或降采样(Pooling or Sub Sampling)
  4. 分类/全连接层(Classification, Fully Connected Layer)

这几个功能是所有卷积神经网络的基本模块。下面我们尝试从直观上来理解每个操作的含义。

2 CNN:直观解释

2.1 输入:图像(像素值组成的矩阵)

每个图像(image)本质上就是一个由像素值(pixel values)组成的矩阵:

图 4:每个图像都是一个像素值组成的矩阵。[6]

Channel(通道)是一个传统术语,指图像的某一部分数据。 例如,

  • 数码相机拍出的图像通常有三个通道 —— red/green/blue —— 可以想象成从下往上依次堆叠的 3 个二维矩阵(每种颜色一个),每个像素值都在 0 到 255 范围内。
  • grayscale(灰度)图像只有一个通道。

简单起见,本文将只考虑灰度图像。 这意味着我们将有一个表示图像的二维矩阵,其中中每个像素的值范围从 0 到 255 —— 0 表示黑色,255 表示白色。

2.2 第一步:卷积运算

CNN(卷积神经网络)的名字来源于“卷积”运算,

  • 卷积的主要目的从输入图像中提取特征
  • 通过一个小矩阵(称为 filter)对输入矩阵进行运算,来学习图像特征(image features);
  • filter 保留了像素之间的空间关系(spatial relationship between pixels)。

这里不深入探讨卷积的数学细节,只尝试了解它如何处理图像。

2.2.2 动图直观解释

每个图像都是像素值组成的矩阵。考虑一个 5x5 的图像,其像素值只有 0 和 1(灰度图像的像素值范围为 0 到 255,这里我们进一步简化,像素值只有 0 和 1):

然后引入一个 3x3 矩阵作为 filter,

那么,用 5x5 和 3x3 矩阵来计算卷积的过程就如下面的动图所示,

图 5:卷积的计算。计算得到的结果矩阵称为 Convolved Feature or Feature Map(卷积特征,或特征图)。[7]

计算过程:

  1. 在 5x5 的输入矩阵上,覆盖一个 3x3 矩阵,
  2. 对当前 3x3 覆盖的部分,分别与 3x3 矩阵按像素相乘,然后把 9 个值加起来得到一个整数,
  3. 按这种方式,以一个像素为单位依次滑动和计算,最后就得到一个输出矩阵(右边)。

用 CNN 术语来说,

  1. 3x3 矩阵叫做 filter(滤波器),或 kernel、feature detector 等
  2. 滑动的粒度(这里是一个像素)叫做 stride(步长)
  3. 最后得到的矩阵叫 Convolved Feature(卷积特征)或 feature map(特征图);

显然,对于同一个图像,用的卷积矩阵(filter matrix)不同,得到的特征图(feature maps)也就不同。 或者说不同的 filter 可以检测不同的特征。例如对于下面这张图片,

我们可以根据目的(边缘检测、锐化、模糊化等)的不同,选用不同的 filter,得到的效果如下 [8],

下面是另一个例子,用动图展示两个不同的 filter 计算卷积得到的 feature map,

图 6:卷积运算。Source [9]

这里需要再提醒一下,image 和 filter 都只是一个数值矩阵(numeric matrix)。

2.2.2 特征图/卷积特征参数

实际上,CNN 在训练过程中自行学习(learn)这些 filter 的值 (尽管我们仍然需要在训练时指定某些参数,例如过 filter 数量、filter size、网络架构等)。 filter 数量越多,提取的图像特征就越多,训练出来的网络在识别未见过的图像时效果就越好。

Feature Map(Convolved Feature)的大小由三个参数 [4] 控制,在训练之前确定:

  1. 深度(depth):将要用来做卷积运算的 filter 数量

    在下图所示的网络中,我们使用三个不同的 filter 对原始图像执行卷积,从而生成三个不同的特征图。 可以将这三个特征图视为三个自下向上堆叠(stacking)在一起的二维矩阵, 这也是为什么成它为特征图的“深度”

    图 7:特征图的深度

  2. 步长(stride):在输入矩阵上滑动滤波器(filter)矩阵的像素数

    • 步长为 1 就是一次将 filter 移动一个像素,步长为 2 就是一次滑动 2 个像素。
    • 步长越大,得到的特征图越小
  3. 零值填充(Zero-padding):有时需要在图像边界用零填充,这样就可以对输入图像的边界像素应用 filter。

    • zero-padding 会使生成的特征图稍大一些;
    • 使用了 zero-padding 称为 wide convolution,不使用的称为 narrow convolution [14]。

2.3 第二步:非线性(Non Linearity / ReLU)运算

每次卷积运算之后,还会跟着一个称为 ReLU(Rectified Linear Unit,修正线性单元)的运算。 这是一个非线性运算,输入输出公式为,

图 8:ReLU 公式与效果(负值置为零)

ReLU 是一个像素级别的操作将特征图中所有负值置为零。 ReLU 的目的是在 CNN 中引入非线性,因为真实世界中的大部分数据都是非线性的, 我们希望 CNN 能与现实更加匹配。

卷积是一种线性运算 —— 逐像素做矩阵乘法和加法,因此我们通过引入像 ReLU 这样的非线性函数来解释(account for)非线性。

下图可以清楚地看到 ReLU 操作之后的效果,

图 9:真实特征图执行 ReLU 操作之后的效果。Source [10]

  • 左边的特征图是卷积运算之后得到的;
  • 右边是接着做了 ReLU 运算(负数全部置零)之后的效果。也称为“修正之后的”特征图

除了 ReLU,还可以使用 tanh 或 sigmoid 等非线性函数,不过在大部分场景下,ReLU 的性能都更好。

2.4 第三步:降采样

Spatial Pooling,又称为降采样、下采样(subsampling、downsampling),

  • 目的是在降低 feature map 维度的同时,保留尽量多的重要信息。
  • 有不同的类型:Max/Average/Sum 等。

2.4.1 原理:直观解释

图 10 是对一个卷积 + ReLU 之后得到的特征图执行 2x2 降采样

图 10: Max Pooling. Source [4]

  • 首先定义一个 spatial neighborhood (2x2 窗口),
  • 然后执行降采样函数,这里用的是 Max 函数,也就是取其中最大的那个值作为结果,
  • 注意这里滑动窗口的步长是 2,也就是降采样矩阵的尺寸;

最终把 4x4 特征图降维到了 2x2

下图是对三个卷积结果(rectified feature map)依次执行降采样,

图 11:对三个维度的特征图执行降采样。

Average Pooling 和 sum 类似,只不过取的是平均值和累加和。 实际中,Max Pooling 效果更好一些。下面是一个效果对比:

图 12:Max/Sum 降采样函数效果对比。Source [10]

Pooling 的作用是主动降低输入表示(input representation)的空间大小(spatial size) [4],

  1. 使输入表示(特征维度)更小且更易于管理;
  2. 减少网络参数和计算量,避免过度拟合(overfitting)[4];
  3. 使网络能容忍输入图像中较小的变换、扭曲和平移:小扭曲不会改变降采样的输出 —— 因为我们采用相邻区域内的最大值/平均值;
  4. 使我们能获得一个几乎跟输入分辨率无关的特征表示(确切的术语是 “equivariant representation”): 这一点非常重要,因有了这种能力,那无论一个目标是在图像中什么位置,我们都能把它检测出来 [18,19]。

2.4.2 小结:卷积层 + ReLU + 降采样层

至此,我们已经了解了卷积、ReLU 和降采样的工作原理,它们是构成任何 CNN 的基本构建块。 如图 13 所示,

图 13:两个基本处理单元构成的 CNN

  • 卷积层 + ReLU + 降采样层构成一个基本处理单元
  • 图中级联了两个这样的处理单元。

这些层联合在一起,从图像中提取有用特征、引入非线性、减少特征维度,同时在使特征在某种程度上做到缩放和平移不变 [18]。 降采样之后的输出就可以对图像分类了,具体的分类过程由称为全连接层的模块来完成。

2.5 第四步:全连接层:基于特征分类

全连接层(Fully Connected Layer)是一种传统的多层感知器(Multi Layer Perceptron), 在输出层使用 softmax() 函数(也可以使用 SVM 等其他分类器,但本文中使用 softmax)。 术语“全连接”表示上一层中的每个神经元都连接到下一层中的每个神经元

想了解多层感知器,可参考这篇文章。

卷积层和降采样层的输出表示了输入图像的 high-level 特征。 全连接层的目的是基于这些特征,对输入图像进行分类

例如,假设我们的图像分类有四种可能,如下图所示(图中省略了全连接层中节点之间的连接),

图 14:全连接层

除了分类的作用,加一个全连接层(通常)还是一种低成本的学习这些特性的非线性组合的方式 (learning non-linear combinations of these features)。 卷积层和降采样层的输出对于分类来说可能已经很好了,但组合二者能达到更好的性能 [11]。

全连接层 output 的所有可能性加起来是 100%,这是由 softmax activation function 保证的: softmax 接收任何实值向量输入,将其中的元素归一化到 [0,1] 之间,并且总和等于 1。

2.6 第五步:反向传播:形成闭环

分类结果(各种可能性的概率)出来之后,再 使用反向传播(backpropagation)算法计算所有概率的误差梯度, 并使用梯度下降算法更新所有滤波器值/权重和参数值,以最小化输出误差。

然后就又可以从头开始了,有了这种反馈,下一次的迭代会更加准确。

3 CNN 完整架构和工作流

卷积层 + 降采样层充当输入图像的特征提取器(Feature Extractors), 而全连接层充当分类器(classifier)。

下图中,由于输入图像是 boat,因此 Boat 类的目标概率为 1,其他三个类的目标概率为 0,即

  1. Input Image = Boat
  2. Target Vector = [0, 0, 1, 0]

图 15: Training the CNN

卷积网络的训练过程大致如下:

  1. 随机值初始化所有 filter 和参数/权重。
  2. 将训练图像作为输入,经过 forward propagation 步骤(卷积、 ReLU 和降采样以及全连接层中的前向传播),计算出每个类别的输出概率

    • 假设上面的 boat 图像的输出概率是 [0.2, 0.4, 0.1, 0.3]
    • 由于第一个训练示例的权重是随机分配的,因此输出概率也是随机的。
  3. 计算输出层的总误差(所有 4 个类的总和)

    • Total Error = ∑  ½ (target probability – output probability) ²
  4. 使用反向传播计算网络中所有权重的误差梯度,并使用梯度下降算法 更新所有滤波器值/权重和参数值,以最小化输出误差。

    • 权重根据它们对总误差的贡献按比例调整。
    • 当再次输入相同的图像时,输出概率可能就是 [0.1, 0.1, 0.7, 0.1],更接近目标向量 [0, 0, 1, 0], 这意味着网络已经学会通过调整其权重/过滤器来正确分类该特定图像,从而减少输出误差。
    • 过滤器数量、过滤器大小、网络架构等参数在步骤 1 之前都已固定,并且在训练过程中不会更改——只有过滤器矩阵和连接权重的值会更新。
  5. 对训练集中的所有图像重复步骤 2-4。

以上就是训练 CNN 的步骤,结束之后 CNN 的所有权重和参数都已经过优化,能够正确地对训练集中的图像进行分类。

当一个新的(没见过的)图像被输入到 CNN 中时,网络将通过 forward propagation 计算输出每个类别的概率。 如果训练集足够大,网络将大概率将新图像分类到正确的类别中。

以上步骤已经过简化,以避免过多数学细节,让读者对训练过程有个直觉上的理解。 想了解进一步有关细节,可参考 [4,12]。

上面的例子中使用了两组卷积层和降采样层。实际上可以在单个 CNN 中重复任意层。 另外,每个卷积层之后不是必须要跟着一个降采样层。如图 16 所示,

图 16:多层 CNN 及每层的效果。Source [4]

4 案例:CNN 学习识别字符 8

4.1 多层特征

一般来说,卷积步骤越多,网络能学到的特征就可以越复杂。 例如,在图像分类中,CNN 可能会

  • 在第一层学习从原始像素检测物体边缘,然后
  • 基于边缘检测判断第二层中的简单形状,然后
  • 使用这些形状来检测更高级别的特征,例如面部形状 [14]。

下图是用 Convolutional Deep Belief Network 学习到的特征,

图 17:Convolutional Deep Belief Network 学习特征: 第一层检测边缘;第二次检测形状;第三张检测人脸。 Source [21]

这里只是一个简单的例子,现实中的卷积滤波器可能会检测到对人类无意义的物体。

4.2 学习字符 8

Adam Harley 在 MNIST 手写数字数据库 [13] 上训练卷积神经网络,创造了惊人的可视化效果。

下面看一个 CNN 网络如何处理输入字符 “8”。输入图像包含 1024 像素(32x32),

图 18: Visualizing a CNN trained on handwritten digits. 注意 ReLU 没画出来。 Source [13]

  1. 第一层卷积:由 6 个独立的 5×5(步长 1)滤波器与输入图像卷积,产生深度为 6 的特征图。
  2. 第一层降采样:分别对 1 中的六个特征图进行 2×2 Max 降采样(步长为 2)。 注意由于用的是 Max,因此 2x2 网格中的最大值(最亮的像素)的像素进入了降采样结果层。

    图 19:卷积 + 降采样。Source [13]

  3. 第二层卷积:对 2 的结果进行 5x5 卷积(步长 1);
  4. 第二层降采样:对 3 的结果进行降采样
  5. 第一层全连接:120 neurons;
  6. 第二层全连接:100 neurons;
  7. 第三层全连接:10 neurons,分别代表 0-9 这 10 个字符作为输出 —— 也称为 Output layer

    注意到 output 层中 node 8 最亮,这表示分类结果中 8 的概率最大。

    图 20: Visualizing the Filly Connected Layers. Source [13]

5 其他 CNN 架构

上世纪 90 年代初期就出现卷积神经网络了,本文介绍的 LeNet 只是其中一种,

  1. LeNet (1990s): 本文介绍的就是这个;
  2. 1990s to 2012: In the years from late 1990s to early 2010s convolutional neural network were in incubation. As more and more data and computing power became available, tasks that convolutional neural networks could tackle became more and more interesting.
  3. AlexNet (2012) – In 2012, Alex Krizhevsky (and others) released AlexNet which was a deeper and much wider version of the LeNet and won by a large margin the difficult ImageNet Large Scale Visual Recognition Challenge (ILSVRC) in 2012. It was a significant breakthrough with respect to the previous approaches and the current widespread application of CNNs can be attributed to this work.
  4. ZF Net (2013) – The ILSVRC 2013 winner was a Convolutional Network from Matthew Zeiler and Rob Fergus. It became known as the ZFNet (short for Zeiler & Fergus Net). It was an improvement on AlexNet by tweaking the architecture hyperparameters.
  5. GoogLeNet (2014) – The ILSVRC 2014 winner was a Convolutional Network from Szegedy et al. from Google. Its main contribution was the development of an Inception Module that dramatically reduced the number of parameters in the network (4M, compared to AlexNet with 60M).
  6. VGGNet (2014) – The runner-up in ILSVRC 2014 was the network that became known as the VGGNet. Its main contribution was in showing that the depth of the network (number of layers) is a critical component for good performance.
  7. ResNets (2015) Residual Network developed by Kaiming He (and others), winner of ILSVRC 2015. 目前最好的 CNN 模型(as of May 2016)。
  8. DenseNet (August 2016) – Recently published by Gao Huang (and others), the Densely Connected Convolutional Network  has each layer directly connected to every other layer in a feed-forward fashion. The DenseNet has been shown to obtain significant improvements over previous state-of-the-art architectures on five highly competitive object recognition benchmark tasks. Check out the Torch implementation here.

6 总结

本文试图用尽量简单的术语来解释卷积神经网络(CNN)背后的主要概念, 希望能让读者对其工作原理有一些直观理解。

参考资料

  1. karpathy/neuraltalk2: Efficient Image Captioning code in Torch, Examples
  2. Shaoqing Ren, et al, “Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks”, 2015, arXiv:1506.01497 
  3. Neural Network Architectures, Eugenio Culurciello’s blog
  4. CS231n Convolutional Neural Networks for Visual Recognition, Stanford
  5. Clarifai / Technology
  6. Machine Learning is Fun! Part 3: Deep Learning and Convolutional Neural Networks
  7. Feature extraction using convolution, Stanford
  8. Wikipedia article on Kernel (image processing) 
  9. Deep Learning Methods for Vision, CVPR 2012 Tutorial 
  10. Neural Networks by Rob Fergus, Machine Learning Summer School 2015
  11. What do the fully connected layers do in CNNs? 
  12. Convolutional Neural Networks, Andrew Gibiansky 
  13. A. W. Harley, “An Interactive Node-Link Visualization of Convolutional Neural Networks,” in ISVC, pages 867-877, 2015 (link). Demo
  14. Understanding Convolutional Neural Networks for NLP
  15. Backpropagation in Convolutional Neural Networks
  16. A Beginner’s Guide To Understanding Convolutional Neural Networks
  17. Vincent Dumoulin, et al, “A guide to convolution arithmetic for deep learning”, 2015, arXiv:1603.07285
  18. What is the difference between deep learning and usual machine learning?
  19. How is a convolutional neural network able to learn invariant features?
  20. A Taxonomy of Deep Convolutional Neural Nets for Computer Vision
  21. Honglak Lee, et al, “Convolutional Deep Belief Networks for Scalable Unsupervised Learning of Hierarchical Representations” (link)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/65080.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vim 的基础使用

目录 一:vim 介绍二:vim 特点三:vim 配置四:vim 使用1、vim 语法格式2、vim 普通模式(1)保存退出(2)光标跳转(3)文本删除(4)文本查找&…

HP 电脑开机黑屏 | 故障判断 | BIOS 恢复 | BIOS 升级

注:本文为 “HP 电脑开机黑屏 | 故障判断 | BIOS 恢复 | BIOS 升级” 相关文章合辑。 引文图片 csdn 转储异常,重传。 篇 1:Smart-Baby 回复中给出故障现象判断参考 篇 2、篇3 :HP 官方 BIOS 恢复、升级教程 开机黑屏&#xff0c…

JAVA:利用 Redis 实现每周热评的技术指南

1、简述 在现代应用中,尤其是社交媒体和内容平台,展示热门评论是常见的功能。我们可以通过 Redis 的高性能和丰富的数据结构,轻松实现每周热评功能。本文将详细介绍如何利用 Redis 实现每周热评,并列出完整的实现代码。 2、需求分…

VSCode下配置Blazor环境 断点调试Blazor项目

VSCode下使用Blazor的环境配置和插件推荐 Blazor是一种用于构建交互式Web UI的.NET框架,它可以让你使用C#、Razor和HTML进行Web开发,而不需要JavaScript。在这篇文章中,我们将介绍如何在VSCode中配置Blazor环境,并推荐一些有用的…

《Rust权威指南》学习笔记(一)

基本介绍 1.Rust使用场景 :需要运行速度、需要内存安全、更好的利用多处理器。程序员无法在安全的Rust代码中执行任何非法的内存操作。相对于C#等带有垃圾回收机制的语言来讲,Rust遵循了零开销抽象(Zero-Cost Abstraction)规则&a…

STM32-笔记26-WWDG窗口看门狗

一、简介 窗口看门狗用于监测单片机程序运行时效是否精准,主要检测软件异常,一般用于需要精准检测程序运行时间的场合。 窗口看门狗的本质是一个能产生系统复位信号和提前唤醒中断的6位计数器(有的地方说7位。其实都无所谓&#xff0…

机组的概述

计算机系统组成 硬件系统和软件系统 计算机硬件 1.冯诺依曼机基本思想 特点 1.采用“存储程序”工作方式 2.硬件系统由运算器,存储器,控制器,输入输出设备组成 3.指令和数据存在存储器中,形式无区别 4.指令和数据用二进制代…

TypyScript从入门到精通

TypyScript从入门到精通 TypyScript 是什么?增加了什么环境搭建二、为何需要 TypeScript三、编译 TypeScript四、类型声明五、类型推断基本类型六、类型总览JavaScript 中的数据类型TypeScript 中的数据类型1. 上述所有 JavaScript 类型2. 六个新类型:3.…

Tableau数据可视化与仪表盘搭建-安装教程

下载 tableau.com/zh-cn/support/releases 滚动到最下方的下载 在下载的同时 我们点击登录,去注册一个tableau的账号 下面点击我们下载好的tableau安装程序 不要自定义安装,会有路径问题 点击试用14天 点击激活 激活学生 tableau.com/zh-cn/academic…

Scala_【4】流程控制

第四章 分支控制if-else单分支双分支多分支返回值嵌套分支 For循环控制包含边界不包含边界循环守卫循环步长嵌套循环循环返回值 While循环Break友情链接 分支控制if-else 单分支 双分支 多分支 返回值 嵌套分支 For循环控制 Scala也为for循环这一常见的控制结构提供了非常多的…

Backend - C# 的日志 NLog日志

目录 一、注入依赖和使用 logger 二、配置记录文件 1.安装插件 NLog 2.创建 nlog.config 配置文件 3. Programs配置日志信息 4. 设置 appsettings.json 的 LogLevel 5. 日志设定文件和日志级别的优先级 (1)常见的日志级别优先级 (2&…

ESP32自动下载电路分享

下面是一个ESP32系列或者ESP8266等电路的一个自动下载电路 在ESP32等模块需要烧写程序的时候,需要通过将EN引脚更改为低电平并将IO0引脚设置为低电平来切换到烧写模式。 有时候也会采用先将IO接到一个按键上,按住按键拉低IO0的同时重新上电的方式进入烧写…

1-markdown转网页样式页面 --[制作网页模板] 【测试代码下载】

markdown转网页 将Markdown转换为带有样式的网页页面通常涉及以下几个步骤:首先,需要使用Markdown解析器将Markdown文本转换为HTML;其次,应用CSS样式来美化HTML内容。此外,还可以加入JavaScript以增加交互性。下面我将…

Eplan 项目结构(高层代号、安装地点、位置代号)

Eplan中的项目结构分为3个层次: (1)功能面结构。指明这个系统的功能,有什么用途。在EPlan中,指的就是"高层代号()"。 一般指的是线体。 (2)位置面结构。指明该…

《Armv8-A virtualization》学习笔记

1.MAIR 的全称是 Memory Attribute Indirection Register。它是ARM架构中的一种寄存器,用于定义内存的属性,并提供一种间接访问内存属性的机制。MAIR寄存器包含多个字段,这些字段指示不同类型内存的属性,例如是否可以缓存、是否为…

如何使用OBS Studio录制屏幕?

可以进入官网或github进行下载: https://obsproject.com/download 安装包解压后进入bin 进入64-bit 选择obs 64 进入OBS Studio后在来源内右键,选择添加 选择添加显示器采集即可录取整个屏幕,窗口采集可选择窗口进行录制 选择对应显示器即配置…

9.类的定义与使用

类的定义构造函数(__init__)实例变量类变量方法(实例方法)类方法(classmethod)静态方法(staticmethod)属性装饰器(property)私有属性与方法继承多态方法重写super()函数类的文档字符串类的属性和方法访问控制 1.类的定义: 如int,list,tuple等等都是类,还可以通过class方法自己…

【文献精读笔记】Explainability for Large Language Models: A Survey (大语言模型的可解释性综述)(三)

****非斜体正文为原文献内容(也包含笔者的补充),灰色块中是对文章细节的进一步详细解释! 3.2 全局解释(Global Explanation) 与旨在解释模型个体预测的局部解释不同,全局解释提供了对语言模型…

学习随笔:word2vec在win11 vs2022下编译、测试运行

word2vec 官网word2vec的本质是在自然语言词条数据集与计算机浮点数据集之间建立双射关系。word2vec建立的数据集最厉害的一点是,将自然语言词条数据集内部的推理过程,映射到了计算机浮点数据集内部的数值运算。我个人感觉理解这个数据映射方式是理解AI大…

搭建nginx文件服务器

方法一:通过docker方式搭建 1、创建一个nginx配置文件/etc/nginx/nginx.conf user nginx; worker_processes 1;error_log /var/log/nginx/error.log warn; pid /var/run/nginx.pid;events {worker_connections 1024; }http {include mime.types;default_typ…