神经网络知识点整理

目录

​一、深度学习基础与流程

二、神经网络基础组件

三、卷积神经网络(CNN)​编辑

四、循环神经网络(RNN)与LSTM

五、优化技巧与调参

六、应用场景与前沿​编辑

七、总结与展望​编辑


一、深度学习基础与流程
  1. 机器学习流程

    • 数据获取:收集结构化或非结构化数据(如CIFAR-10数据集,含5万张32x32训练图像、10类标签)。

    • 特征工程

      • 文本数据:分词、词袋模型(BOW)、N-Gram。

      • 图像数据:标准化(均值/方差)、边缘检测(传统方法如Sobel算子)。

    • 模型构建:选择算法(如线性回归、K近邻、神经网络),定义损失函数与优化目标。

    • 评估与应用:划分训练集、验证集、测试集,使用交叉验证调参,部署模型至实际场景。

  2. 特征工程核心作用

    • 数据特征决定模型上限:例如图像分类中,边缘特征(传统方法)或深度特征(卷积网络)的提取。

    • 预处理技术

      • 标准化:$X_{norm} = \frac{X-\mu}{\sigma}$

      • 缺失值处理:删除或填充(均值/中位数)。

    • 特征表示

      • 文本:TF-IDF向量、词嵌入(Word2Vec)。

      • 图像:像素矩阵、颜色通道分离(RGB)。


二、神经网络基础组件
  1. 线性函数与得分计算

    • 公式

      $f(x,W)=Wx+b \quad $(输入x \in \mathbb{R}^d,权重 W \in \mathbb{R}^{k \times d}
    • 示例:CIFAR-10分类任务中,输入为3072维(32x32x3),输出10类得分,权重矩阵大小为 10×307210×3072。

  2. 损失函数(Loss Function)

    • 多类SVM损失(Hinge Loss)

      $L_i = \sum_{j \neq y_i} \max(0, s_j - s_{y_i} + 1)$
    • 计算示例:若真实类别得分$s_{y_i} = 3.2$,其他类别得分 $s_j = 5.1, -1.7$,则损失为$\max(0, 5.1 - 3.2 + 1) + \max(0, -1.7 - 3.2 + 1) = 2.9$
    • 交叉熵损失(Softmax)

      $Li=-\log\left(\frac{e^{s_{y_i}}}{\sum_j e^{s_j}}\right)$
    • 输出概率化:Softmax将得分转换为概率分布(归一化指数函数)。
  3. 梯度下降与反向传播

    • 梯度下降类型

      类型公式特点
      批量梯度下降$\theta_j := \theta_j - \alpha\frac{1}{m}\sum_{i=1}^m(h_0(x^{(i)}) - y^{(i)}x_j^{(i)})$全局最优但计算量大
      随机梯度下降$\theta_j := \theta_j + \alpha(y^{(i)} - h_\theta(x^{(i)}))x_j^{(i)}$高效但噪声大
      小批量梯度下降$\theta_j := \theta_j - \alpha\frac{1}{B}\sum_{k=1}^B(h_\theta(x^{(k)}) - y^{(k)}x_j^{(k)})$平衡效率与稳定性(B=32/64)
    • 反向传播

      • 链式法则:逐层计算梯度,例如Sigmoid激活函数的导数为 $\frac{\partial z}{\partial x} = \sigma(x)(1-\sigma(x))$

      • 计算图分解:将复杂运算拆分为加法门、乘法门、MAX门等基本单元,分别计算局部梯度。


三、卷积神经网络(CNN)
  1. 核心操作与组件

    • 卷积层

      • 功能:提取局部特征,参数共享减少计算量。

      • 输出尺寸计算

        $H_{out} = \frac{H_{in} - F + 2P}{S} + 1$(F: 卷积核尺寸, P: 填充, S: 步长)
      • 示例:输入32x32x3,使用10个5x5x3卷积核(步长1,填充2),输出32x32x10。

    • 池化层

      • 最大池化:取窗口内最大值,减少特征图尺寸(如2x2池化,步长2,尺寸减半)。

      • 平均池化:取窗口内平均值,保留整体信息。

    • 激活函数

      类型公式特点
      ReLU$f(x) = max(0,x)$缓解梯度消失,计算高效
      Sigmoid$f(x) = \frac{1}{1+e^{-x}}$输出概率(0~1),易饱和
  2. 经典网络架构

    • AlexNet

      • 结构:5卷积层 + 3全连接层。

      • 创新点:首次使用ReLU、Dropout、GPU加速训练。

      • 参数示例:第一层卷积核11x11,步长4,输出55x55x96。

    • VGGNet

      • 核心思想:堆叠3x3小卷积核(参数量更少,非线性更强)。

      • 感受野计算:3层3x3卷积等效于1层7x7卷积,参数量减少33%。

    • ResNet

      • 残差块:解决深层网络退化问题,公式 $H(x) = F(x) + x$

      • 优势:允许训练数百层网络,ImageNet Top-5错误率降至3.57%。

  3. CNN优势

    • 参数共享:同一卷积核在整张图像滑动,显著降低参数量。

    • 平移不变性:特征检测不受位置影响。

    • 层次化特征

      • 浅层:边缘、纹理(如Gabor滤波器效应)。

      • 深层:语义信息(如物体部件、类别)。


四、循环神经网络(RNN)与LSTM
  1. RNN基础

    • 结构:隐藏状态 ℎ𝑡ht​ 传递时序信息。

      $h_t = \sigma(W_hh_{t-1} + W_xx_t + b)$
    • 应用场景:文本生成、时间序列预测、机器翻译。

    • 缺陷:梯度消失/爆炸,难以捕捉长期依赖。

  2. 长短期记忆网络(LSTM)

    • 核心门控机制

      门类型公式功能
      遗忘门$f_t = \sigma(W_f[h_{t-1},x_t] + b_f)$决定丢弃哪些历史信息
      输入门$i_t = \sigma(W_i[h_{t-1},x_t] + b_i)$更新细胞状态的新信息
      输出门$o_{t}=\sigma\left(W_{o}\left[h_{t-1}, x_{t}\right]+b_{o}\right)$控制当前隐藏状态的输出
    • 细胞状态更新

      $C_{t}=f_{t} \odot C_{t-1}+i_{t} \odot \tanh \left(W_{C}\left[h_{t-1}, x_{t}\right]+b_{C}\right)$
    • 优势:通过细胞状态长期记忆关键信息,缓解梯度消失。


五、优化技巧与调参
  1. 数据预处理

    • 标准化:零均值化(X -= np.mean(X, axis=0))和归一化(X /= np.std(X, axis=0))。

    • 数据增强

      • 图像:旋转、裁剪、加噪声。

      • 文本:同义词替换、随机删除。

  2. 参数初始化

    • Xavier初始化:适应激活函数,保持输入输出方差一致。

      $W\sim\mathcal{N}\left(0,\sqrt{\frac{2}{n_{in}+n_{out}}}\right)$
    • He初始化:专为ReLU设计,方差为$\frac{2}{n_{in}}$

  3. 正则化技术

    • Dropout:训练时随机丢弃神经元(如丢弃率0.5),减少过拟合。

    • L2正则化:惩罚大权重,损失函数添加 $\lambda\sum W_{ij}^{2}$

    • 早停法:监控验证集损失,连续多次未改善则终止训练。

  4. 超参数选择

    • 学习率:初始值常设为0.001,配合学习率衰减(如每10轮减半)。

    • 批量大小:权衡内存与梯度稳定性(常用32/64/128)。


六、应用场景与前沿
  1. 计算机视觉

    • 图像分类:ResNet在ImageNet上Top-5错误率低于5%。

    • 目标检测:Faster R-CNN(两阶段)、YOLO(单阶段实时检测)。

    • 图像生成:GAN生成逼真图像,StyleGAN实现可控生成。

  2. 自然语言处理

    • 机器翻译:Transformer模型(如BERT、GPT-3)取代RNN。

    • 情感分析:LSTM捕捉上下文依赖,BERT微调实现高精度。

  3. 跨领域应用

    • 医疗影像:CNN辅助诊断肺结节、视网膜病变。

    • 自动驾驶:CNN处理实时路况,LSTM预测车辆轨迹。


七、总结与展望
  1. 当前挑战

    • 计算资源需求:大模型训练依赖高性能GPU/TPU集群。

    • 可解释性:黑箱模型决策过程难以解释(如医疗领域)。

  2. 未来方向

    • 轻量化模型:MobileNet、EfficientNet提升移动端部署效率。

    • 自监督学习:利用无标注数据预训练(对比学习、掩码语言模型)。

    • 多模态融合:联合处理图像、文本、语音(如CLIP、DALL-E)。

通过持续优化模型架构与训练策略,神经网络将继续推动人工智能在复杂任务中的突破,赋能工业、医疗、交通等领域的智能化升级。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/74787.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【sql优化】where 1=1

文章目录 where 11问题描述错误实现正确实现性能对比测试 where 11 问题描述 在动态 SQL 拼接场景中,开发者常使用 WHERE 11 简化条件拼接逻辑(避免处理首个条件的 AND)。理论上,数据库优化器会忽略 11,但字符串拼接…

车载以太网网络测试 -24【SOME/IP概述】

目录 1 摘要2 车载SOME/IP 概述2.1发展背景以及应用2.1.1车载 SOME/IP 背景2.1.2 车载 SOME/IP 应用场景 2.3 什么是SOME/IP2.3.1 SOME/IP定义2.3.2 SOME/IP在协议栈中的位置 3 SOA是什么4 SOME/IP主要功能5 SOME/IP标准 1 摘要 本文主要介绍SOME/IP的背景以及在车载行业的发展…

vue3中,route4,获取当前页面路由的问题

首先应用场景如下: 在main.js里面,引入的是路由的配置文件,如下: import {router} from /router; app.use(router); 路由配置文件router.js如下: import { createRouter, createWebHistory } from vue-router; imp…

ip改变导致的数据库连接不上

前言 需要用到路由器,所以先把家里的路由器给拆了先用着。新的路由器到了之后,更换上新的路由器之后,调用到服务会有报错,记录一下更换路由器之后ip重新分配服务可能会报的错. 进一步可以看到有关网路在服务当中的影响。 正文 …

Chrome 开发环境快速屏蔽 CORS 跨域限制!

Chrome 开发环境快速屏蔽 CORS 跨域限制【详细教程】 ❓ 为什么需要临时屏蔽 CORS? 在前后端开发过程中,我们经常会遇到 跨域请求被浏览器拦截 的问题。例如,你在 http://localhost:3000 调用 https://api.example.com 时,可能会…

【力扣hot100题】(009)和为K的子数组

还是太菜了(我),写了半天滑动窗口,然后看了答案又写了半天时间超限…… 总之就是记录每前n个子串的和,然后使用hash存储和为某个值出现的次数,每次求得新和就看看是否存在前面新和-k的字符,有的…

使用 rsync 进行服务器文件同步与优化

使用 Rsync 工具在两台 Linux 服务器之间同步文件 Rsync 是一种高效的文件同步工具,它可以在本地或远程服务器之间同步文件和目录。Rsync 通过仅传输文件的变化部分来减少数据传输量,因此特别适合用于定期备份或同步大量数据。本文将详细介绍如何将 A 服…

卷积神经网络 - 微步卷积、空洞卷积

一、微步卷积 微步卷积(Fractionally Strided Convolution),通常也称为转置卷积(Transposed Convolution)或反卷积(Deconvolution),是深度学习(尤其是卷积神经网络&…

详解java体系实用知识总结

0.java技术能力框架 基础模块应用模块综合模块技术岗位与面试流程常用工具集系统架构设计计算机基础常用框架微服务架构jvm原理缓存容器化多线程队列云计算(阿里云/aws)设计模式数据库数据结构与算法 1.常用设计模式与应用场景 工厂模式:s…

设计模式之创建型5种

设计模式 为什么设计模式是23种创建型 对象创建为什么设计模式是23种 设计模式之所以被归纳为23种,而非其他数量,源于GoF(Gang of Four)在1994年的系统性总结和分类。这一数量的确定并非偶然,而是基于以下核心原因: 他们遵循“大三律”(Rule of Three),即只有经过三个…

Oracle 23ai Vector Search 系列之2 ONNX(Open Neural Network Exchange)

文章目录 Oracle 23ai Vector Search 系列之2 ONNX(Open Neural Network Exchange)ONNX基本概念ONNX(Open Neural Network Exchange)ONNX Runtime ONNX Runtime 在Oracle数据库中的集成参考 Oracle 23ai Vector Search 系列之2 ONNX(Open Neural Network Exchange) 我们在看【…

统一语言学习范式

摘要 现有的预训练模型通常针对特定类别的问题。迄今为止,关于何种架构和预训练设置应为最佳似乎仍未达成共识。本文提出了一个统一的框架,用于预训练在多种数据集和设置中普遍有效的模型。我们首先将架构原型与预训练目标这两个常被混为一谈的概念进行…

Flutter项目升级到指定版本的详细步骤指南

一、升级前的准备工作 备份项目 使用Git提交当前所有修改:git commit -am "Pre-upgrade backup"或直接复制项目文件夹 查看当前环境信息 flutter --version flutter doctor二、升级Flutter SDK到指定版本 方法1:通过版本管理工具升级&#x…

22、web前端开发之html5(三)

六. 离线存储与缓存 在网络环境不稳定或需要优化资源加载速度的场景下,离线存储与缓存技术显得尤为重要。HTML5引入了多种离线存储和缓存机制,帮助开发者提升用户体验。本节将详细介绍Application Cache、localStorage、sessionStorage以及IndexedDB等技…

用HTML和CSS生成炫光动画卡片

这个效果结合了渐变、旋转和悬浮效果的炫酷动画示例&#xff0c;使用HTML和CSS实现。 一、效果 二、实现 代码如下&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport&quo…

【嵌入式学习2】数组

目录 ## 数组概念 ## 数组使用 ## 数组初始化 ## 数组名 ## 数组长度 ## 数组相关题目 1、找最大值 2、逆置 ## 数组和指针 指针加整数的含义 ## 指针数组 ## 数组名做函数参数 ## 函数参数传递数组 1、在函数内部 2. 在函数外部 ## 多维数组 使用下标访问 #…

C++中的判断与循环

一.if判断语句 1.程序中的判断&#xff1a; if (要执行的判断&#xff0c;最后的返回值要是bool型的数据) {如果为真&#xff0c;要执行的代码段; } #include"iostream" using namespace std;int main() {int ans;cin >> ans;if (ans > 1000) {cout <…

前端开发中生成网站的favicon.ico文件的软件推荐及使用方法

日常网站开发中&#xff0c;我们经常需要生成网站的favicon.ico文件&#xff0c;今天我在这里来推荐几个编辑.ico(也可将图片格式转化为.ico)图片&#xff0c;而且免费的那软件&#xff1a; GIMP&#xff1a;一个功能强大的开源图像编辑软件&#xff0c;支持多种文件格式&#…

浅谈WebSocket-FLV

FLV是一种视频数据封装格式&#xff0c;这种封装被标准通信协议HTTP-FLV和RTMP协议应用。 而WebSocket-FLV是一种非标的FLV封装数据从后端发送到前端的一种方式。 在WebSocket的url请求中&#xff0c;包含了需要请求设备的视频相关信息&#xff0c;在视频数据到达时&#xff0c…

基于ADMM无穷范数检测算法的MIMO通信系统信号检测MATLAB仿真,对比ML,MMSE,ZF以及LAMA

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1 ADMM算法 4.2 最大似然ML检测算法 4.3 最小均方误差&#xff08;MMSE&#xff09;检测算法 4.4 迫零&#xff08;ZF&#xff09;检测算法 4.5 OCD_MMSE 检测算法 4.6 LAMA检测算法 …