【人工智能】深度学习:神经网络模型

【人工智能】深度学习:神经网络模型

神经网络基础知识

BP神经网络的概念

单个神经元的结构

CNN模型汇总

LeNet5 模型

AlexNet 模型

VGG模型

Inception Net(GoogleNet)模型

ResNet (残差网络)

RNN模型(循环神经网络)

为什么需要RNN

RNN结构

LSTM(长短期记忆网络)模型

LSTM结构

GRU模型

GRU结构

计算重置门rtr_trt​和候选状态h~t\tilde{h}_th~t​

计算更新门ztz_tzt​和当前状态hth_tht​


🎈边走、边悟🎈迟早会好

神经网络基础知识

神经网络(Neural Network)是一种模拟人脑神经元连接方式的计算模型。其基本组成部分是神经元(Neurons),通过加权连接和激活函数构成复杂的网络结构。神经网络广泛应用于模式识别、分类和回归等领域。

BP神经网络的概念

BP神经网络(Backpropagation Neural Network)是多层前馈神经网络的训练算法,通过误差反向传播调整网络权重以最小化输出误差。它主要包括以下步骤:

  1. 前向传播:输入数据通过网络传播,生成预测输出。
  2. 计算误差:预测输出与真实输出之间的差异。
  3. 反向传播:误差反向传播,通过梯度下降法调整网络权重。

单个神经元的结构

单个神经元的基本结构包括:

  • 输入(Input):接收多个输入信号。
  • 权重(Weights):每个输入信号乘以对应的权重。
  • 加权和(Weighted Sum):所有加权输入信号的和。
  • 激活函数(Activation Function):将加权和映射到输出信号。常用的激活函数包括Sigmoid、ReLU、Tanh等。

公式表示为: y=f(∑i=1nwixi+b)y = f\left( \sum_{i=1}^{n} w_i x_i + b \right)y=f(∑i=1n​wi​xi​+b) 其中,fff是激活函数,wiw_iwi​是权重,xix_ixi​是输入,bbb是偏置项。

CNN模型汇总

卷积神经网络(CNN)是一种专门处理图像数据的神经网络,具有卷积层、池化层和全连接层等结构。常见的CNN模型有LeNet5、AlexNet、VGG、Inception Net(GoogleNet)和ResNet。

LeNet5 模型

LeNet5是最早的卷积神经网络之一,由Yann LeCun等人在1998年提出,用于手写数字识别。其结构包括:

  • 输入层:28x28的灰度图像
  • 卷积层C1:6个5x5的卷积核,输出6个24x24的特征图
  • 池化层S2:平均池化层,输出6个12x12的特征图
  • 卷积层C3:16个5x5的卷积核,输出16个8x8的特征图
  • 池化层S4:平均池化层,输出16个4x4的特征图
  • 卷积层C5:120个5x5的卷积核,输出120个1x1的特征图
  • 全连接层F6:84个神经元
  • 输出层:10个神经元(对应10个类别)

AlexNet 模型

AlexNet由Alex Krizhevsky等人在2012年提出,标志着深度学习在图像识别领域的突破。其结构包括:

  • 卷积层1:96个11x11的卷积核,步长为4,输出96个55x55的特征图
  • 池化层1:最大池化层,输出96个27x27的特征图
  • 卷积层2:256个5x5的卷积核,步长为1,输出256个27x27的特征图
  • 池化层2:最大池化层,输出256个13x13的特征图
  • 卷积层3:384个3x3的卷积核,步长为1,输出384个13x13的特征图
  • 卷积层4:384个3x3的卷积核,步长为1,输出384个13x13的特征图
  • 卷积层5:256个3x3的卷积核,步长为1,输出256个13x13的特征图
  • 池化层5:最大池化层,输出256个6x6的特征图
  • 全连接层:4096个神经元
  • 输出层:1000个神经元(对应1000个类别)

VGG模型

VGGNet由Simonyan和Zisserman在2014年提出,其特点是使用非常小的卷积核(3x3)和较深的网络结构。常见的VGG模型包括VGG16和VGG19,分别包含16和19个卷积层和全连接层。其结构包括:

  • 卷积层1-2:64个3x3的卷积核,步长为1,输出64个224x224的特征图
  • 池化层1:最大池化层,输出64个112x112的特征图
  • 卷积层3-4:128个3x3的卷积核,步长为1,输出128个112x112的特征图
  • 池化层2:最大池化层,输出128个56x56的特征图
  • 卷积层5-7:256个3x3的卷积核,步长为1,输出256个56x56的特征图
  • 池化层3:最大池化层,输出256个28x28的特征图
  • 卷积层8-12:512个3x3的卷积核,步长为1,输出512个28x28的特征图
  • 池化层4:最大池化层,输出512个14x14的特征图
  • 卷积层13-17:512个3x3的卷积核,步长为1,输出512个14x14的特征图
  • 池化层5:最大池化层,输出512个7x7的特征图
  • 全连接层:4096个神经元
  • 输出层:1000个神经元(对应1000个类别)

Inception Net(GoogleNet)模型

Inception Net由Google提出,主要特点是Inception模块,能够在同一层上并行进行不同尺寸卷积和池化操作。其结构包括:

  • 卷积层1:64个7x7的卷积核,步长为2,输出64个112x112的特征图
  • 池化层1:最大池化层,输出64个56x56的特征图
  • 卷积层2:192个3x3的卷积核,步长为1,输出192个56x56的特征图
  • 池化层2:最大池化层,输出192个28x28的特征图
  • Inception模块:多个Inception模块组合,不同尺寸的卷积核和池化层并行
  • 全连接层:辅助分类器和主分类器
  • 输出层:1000个神经元(对应1000个类别)

ResNet (残差网络)

ResNet由微软研究院提出,主要特点是引入残差连接,解决深度网络中的梯度消失和退化问题。其结构包括:

  • 卷积层1:64个7x7的卷积核,步长为2,输出64个112x112的特征图
  • 池化层1:最大池化层,输出64个56x56的特征图
  • 残差模块:多个残差模块,每个模块包含多个卷积层和一个直接的残差连接
  • 全连接层:1000个神经元
  • 输出层:1000个神经元(对应1000个类别)

RNN模型(循环神经网络)

RNN是一种用于处理序列数据的神经网络,其特点是具有循环连接,能够保留序列信息。RNN在时间序列预测、自然语言处理等领域有广泛应用。

为什么需要RNN

传统神经网络在处理序列数据时无法保留之前的信息,而RNN通过循环连接,能够保留并利用序列中的上下文信息,使得其在处理时间序列数据时更为有效。

RNN结构

RNN的基本结构包括:

  • 输入层:接收序列数据的每个时间步
  • 隐藏层:通过循环连接保留前一个时间步的信息
  • 输出层:输出每个时间步的结果

公式表示为: ht=f(Wihxt+Whhht−1+bh)h_t = f(W_{ih}x_t + W_{hh}h_{t-1} + b_h)ht​=f(Wih​xt​+Whh​ht−1​+bh​) yt=g(Whoht+bo)y_t = g(W_{ho}h_t + b_o)yt​=g(Who​ht​+bo​) 其中,fff是隐藏层的激活函数,ggg是输出层的激活函数,WWW和bbb分别是权重和偏置项。

LSTM(长短期记忆网络)模型

LSTM是一种改进的RNN,能够有效解决长期依赖问题。其通过引入记忆单元和门控机制,控制信息的保留和遗忘。

LSTM结构

LSTM的基本结构包括:

  • 遗忘门(Forget Gate):决定是否丢弃上一时间步的记忆
  • 输入门(Input Gate):决定是否接受当前时间步的输入
  • 记忆单元(Memory Cell):保留重要信息
  • 输出门(Output Gate):决定输出哪些信息

公式表示为: ft=σ(Wf⋅[ht−1,xt]+bf)f_t = \sigma(W_f \cdot [h_{t-1}, x_t] + b_f)ft​=σ(Wf​⋅[ht−1​,xt​]+bf​) it=σ(Wi⋅[ht−1,xt]+bi)i_t = \sigma(W_i \cdot [h_{t-1}, x_t] + b_i)it​=σ(Wi​⋅[ht−1​,xt​]+bi​) C~t=tanh⁡(WC⋅[ht−1,xt]+bC)\tilde{C}_t = \tanh(W_C \cdot [h_{t-1}, x_t] + b_C)C~t​=tanh(WC​⋅[ht−1​,xt​]+bC​) Ct=ft⋅Ct−1+it⋅C~tC_t = f_t \cdot C_{t-1} + i_t \cdot \tilde{C}_tCt​=ft​⋅Ct−1​+it​⋅C~t​ ot=σ(Wo⋅[ht−1,xt]+bo)o_t = \sigma(W_o \cdot [h_{t-1}, x_t] + b_o)ot​=σ(Wo​⋅[ht−1​,xt​]+bo​) ht=ot⋅tanh⁡(Ct)h_t = o_t \cdot \tanh(C_t)ht​=ot​⋅tanh(Ct​)

GRU模型

GRU(Gated Recurrent Unit)是一种简化的LSTM模型,减少了计算复杂度,保留了LSTM的长短期记忆能力。

GRU结构

GRU的基本结构包括:

  • 重置门(Reset Gate):控制如何合并新输入和前一个时间步的记忆
  • 更新门(Update Gate):控制如何更新当前时间步的状态

公式表示为: rt=σ(Wr⋅[ht−1,xt]+br)r_t = \sigma(W_r \cdot [h_{t-1}, x_t] + b_r)rt​=σ(Wr​⋅[ht−1​,xt​]+br​) zt=σ(Wz⋅[ht−1,xt]+bz)z_t = \sigma(W_z \cdot [h_{t-1}, x_t] + b_z)zt​=σ(Wz​⋅[ht−1​,xt​]+bz​) h~t=tanh⁡(Wh⋅[rt⋅ht−1,xt]+bh)\tilde{h}_t = \tanh(W_h \cdot [r_t \cdot h_{t-1}, x_t] + b_h)h~t​=tanh(Wh​⋅[rt​⋅ht−1​,xt​]+bh​) ht=(1−zt)⋅ht−1+zt⋅h~th_t = (1 - z_t) \cdot h_{t-1} + z_t \cdot \tilde{h}_tht​=(1−zt​)⋅ht−1​+zt​⋅h~t​

计算重置门rtr_trt​和候选状态h~t\tilde{h}_th~t​

重置门rtr_trt​控制前一个时间步的隐藏状态如何影响当前时间步的候选状态: rt=σ(Wr⋅[ht−1,xt]+br)r_t = \sigma(W_r \cdot [h_{t-1}, x_t] + b_r)rt​=σ(Wr​⋅[ht−1​,xt​]+br​) 候选状态h~t\tilde{h}_th~t​是当前时间步的潜在新信息: h~t=tanh⁡(Wh⋅[rt⋅ht−1,xt]+bh)\tilde{h}_t = \tanh(W_h \cdot [r_t \cdot h_{t-1}, x_t] + b_h)h~t​=tanh(Wh​⋅[rt​⋅ht−1​,xt​]+bh​)

计算更新门ztz_tzt​和当前状态hth_tht​

更新门ztz_tzt​决定当前时间步的隐藏状态如何更新: zt=σ(Wz⋅[ht−1,xt]+bz)z_t = \sigma(W_z \cdot [h_{t-1}, x_t] + b_z)zt​=σ(Wz​⋅[ht−1​,xt​]+bz​) 当前时间步的隐藏状态hth_tht​通过前一个隐藏状态和当前候选状态的加权和计算: ht=(1−zt)⋅ht−1+zt⋅h~th_t = (1 - z_t) \cdot h_{t-1} + z_t \cdot \tilde{h}_tht​=(1−zt​)⋅ht−1​+zt​⋅h~t​

这些模型和概念构成了神经网络在图像识别、自然语言处理等领域的基础和核心技术。

 🌟感谢支持 听忆.-CSDN博客

🎈众口难调🎈从心就好

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/43685.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

css实现渐进中嵌套渐进的方法

这是我们想要的实现效果: 思路: 1.有一个底色的背景渐变 2.需要几个小的块级元素做绝对定位通过渐变filter模糊来实现 注意:这里的采用的定位方法,所以在内部的元素一律要使用绝对定位,否则会出现层级的问题&…

ctfshow-web入门-文件上传(web164、web165)图片二次渲染绕过

web164 和 web165 的利用点都是二次渲染,一个是 png,一个是 jpg 目录 1、web164 2、web165 二次渲染: 网站服务器会对上传的图片进行二次处理,对文件内容进行替换更新,根据原有图片生成一个新的图片,这样…

【Linux】进程优先级 + 环境变量

前言 在了解进程状态之后,本章我们将来学习一下进程优先级,还有环境变量等。。 目录 1.进程优先级1.1 为什么要有优先级? 2.进程的其他概念2.1 竞争性与独立性2.2 并行与并发2.3 进程间优先级的体现:2.3.1 O(1) 调度算法&#xf…

数字高压表0-30kv

最近在制作数字高压表,自己DIY玩玩,有没有朋友一起研究看看

SpringCloud--常用组件和服务中心

常用组件 Euroke和nacos 区别 负载均衡 负载均衡策略有哪些 自定义负载均衡策略

【Red Hat 4.6---详细安装Oracle 19c】---静默方式安装

🔻 一、安装前规划 规划项:(本环境) 描述:操作系统版本Red Hat Enterprise Linux Server release 4.6 (Santiago)主机名langtest数据库版本 Oracle 19c IP规划10.10.10.164服务器空间要求根据实际要求数据库名/实例名orcl数据库块大小oracle建库一般设置数据库块大…

物业系统自主研发接口测试框架

1、自主研发框架整体设计 1.1、什么是测试框架? 在了解什么是自动化测试框架之前,先了解一下什么叫框架?框架是整个或部分系统的可重用设计,表现为一组抽象构件及构件实例间交互的方法;另一种定义认为,框架是可被应用开发者定制的应用骨架…

Redis 主从复制,集群与高可用

虽然Redis可以实现单机的数据持久化,但无论是RDB也好或者AOF也好,都解决不了单点宕机问题,即一旦单台 redis服务器本身出现系统故障、硬件故障等问题后,就会直接造成数据的丢失 此外,单机的性能也是有极限的,因此需要使用另外的技…

捷配生产笔记-细间距芯片的表面处理工艺:OSP与沉金工艺的重要性

在现代电子制造领域,随着技术的进步,电子设备变得越来越小型化和高性能化。细间距芯片作为实现这一目标的关键组件,其制造工艺要求极为严格。在这些要求中,表面处理工艺尤为关键,因为它直接影响到芯片的焊接质量和长期…

实验7 数据查询(2)

一、实验目的 学习SQL语言的定义、操纵功能熟悉通过SQL语言对数据库进行查询操作,包括单表查询、多表查询、嵌套查询、集合查询 二、实验软件 MySQL三、实验内容和要求 给定四个关联表,其定义和数据加载如下: 学生表 Student create tab…

Cesium中实现图层组

图层组 某天领导找我,说业务中可能存在多个影像服务为一个图层组,并且需要同时加载和同时在图层列表中上下移动的需求。 例如一些专题地图,包含所有学校、医院、公交站等图层,而这些图层都是单独发布的。 在 Cesium 中确实存在…

前端与嵌入式开发通信之QWebChannel(Qt)

前端与嵌入式开发通信之QWebChannel 最近开发中需要用到和c开发的操作台进行通信的的需求,就找到了这个技术,记录一下 首先需要安装导入 qwebchannel npm i qwebchannel import { QWebChannel } from "qwebchannel"; 初始化qwebchannel并封…

myeclipse开发ssm框架项目图书管理系统 mysql数据库web计算机毕业设计项目

摘 要 随着计算机的广泛应用,其逐步成为现代化的标志。图书馆的信息量也会越来越大,因此需要对图书信息、借书信息、还书信息等进行管理,及时了解各个环节中信息的变更,要对因此而产生的单据进行及时的处理,为了提高高…

智充科技营收增速放缓:经营成本飙升,应收账款大幅增长

《港湾商业观察》黄懿 6月10日, XCHG Limited 智能充电有限公司(下称:智充科技)在美国证监会(SEC)更新招股书,拟在美国纳斯达克上市,其股票代码为“XCH”。北京智充科技有限公司为其国内运营主体(下称“北京智充科技”…

Linux-shell编程入门基础

文章目录 前言Shell编程bash特性shell作用域变量环境变量$特殊变量$特殊状态变量 $特殊符号(很重要)其他内置shell命令shell语法的子串截取统计 指令执行时间练习shell特殊扩展变量父子shell的理解内置和外置命令区别 数值计算双括号(())运算letexprexpr模式匹配 bcawk中括号 s…

数据结构(Java):Stack相关OJ习题

1、括号匹配问题 . - 力扣(LeetCode) 1.1 思路分析 根据栈的先进后出原则,我们可以这样解决问题: 遍历字符串,遇见左括号就将左括号push入栈;遇见右括号就pop出栈,将出栈的元素和该右括号比较…

最简单的vue3组件之间传值

localStorage 是 HTML5 引入的一个 Web Storage API 的一部分,它允许网页在用户的浏览器上存储数据。localStorage 提供了一种持久化的本地存储方案,数据不会因为浏览器关闭而丢失,除非用户或脚本显式地删除它们。 localStorage 是一种非常实…

批量提取网页表格内容至excel文件

问题背景 将网页的表格内容(5237个股票信息)复制粘贴到excel文件中 网址:A股上市公司名单-A股上市公司名录-A股上市公司大全-商业计划书-可研报告-中商产业研究院数据库-中商情报网 实现代码 # 导入包 import pandas as pd import time# 创…

超越传统:3D生物打印如何利用扩散创造奇迹?

超越传统:3D生物打印如何利用扩散创造奇迹? 组织工程和再生医学领域迫切需要能够模拟人体组织结构和功能的体外模型和组织替代物。然而,传统的体外模型和组织替代物往往难以满足高度特异性、复杂性和功能性的要求。3D生物打印技术应运而生&a…

Base64文件流查看下载PDF方法-CSDN

问题描述 数票通等接口返回的PDF类型发票是以Base64文件流的方式返回的&#xff0c;无法直接查看预览PDF发票&#xff0c; 处理方法 使用第三方在线工具&#xff1a;https://www.jyshare.com/front-end/61/ 在Html代码框中粘贴如下代码 <embed type"application/pd…