【神经网络与深度学习】深度神经网络(DNN)

概述

深度神经网络(Deep Neural Networks,DNN)是一种由多个隐藏层组成的神经网络模型。每个隐藏层由多个神经元组成,这些神经元通过权重和激活函数进行信息传递和计算。

深度神经网络通过多层的非线性变换,可以学习到更加抽象和复杂的特征表示。每一层都可以将输入数据转化为更高级的表示,从而更好地捕捉数据的特征和模式。通过不断叠加隐藏层,网络可以逐渐学习到更多的抽象特征,提高模型的表达能力。

深度神经网络在诸多领域中取得了重大突破和成功应用,如图像识别、语音识别、自然语言处理等。它能够处理大规模的数据,并具有强大的表示学习能力,能够自动提取和学习数据中的关键特征,从而实现更高水平的模式识别和预测能力。

然而,深度神经网络的训练也面临一些挑战,如梯度消失或梯度爆炸问题以及过拟合等。为了克服这些问题,出现了一些改进的深度神经网络结构和训练技巧,如卷积神经网络(CNN)、循环神经网络(RNN)、残差网络(ResNet)等。这些创新不断推动着深度神经网络的发展,并在各种领域中发挥着重要作用。

结构

神经网络层

首先通过图片来观察神经网络层的结构,第一张图是浅层神经网络,包括一个输入层,一个隐藏层和一个输出层。

  • 输入层:它所包含的神经元的个数等于单个实例所包含的特征数。只负责输入数据,没有激活函数。
  • 隐藏层:作用是提取特征,必须包含激活函数。
  • 输出层:它所包含的神经元的数目与标签的类别数有关,主要负责输出模型的预测值,它可以包含激活函数。

在这里插入图片描述

下图为深度神经网络,分为一个输出层,多个隐藏层和一个输出层。

在这里插入图片描述

神经元

神经元作为神经网络中最基本的单位,也有其独特的结构,如图所示,其中

  • x为输入,每一个连接上都有一个权重w,中间的节点为人工神经元节点;
  • δ是一个非线性变换,称为激活函数,目的是为了使人工神经元具有表示非线性关系的能力;
  • 参数b称之为偏置;output为人工神经元的输出。

在这里插入图片描述
公式如下:

在这里插入图片描述

激活函数

激活函数是神经网络中的一种非线性函数,作用于神经元的输入信号,将其转换为神经元的输出。激活函数在神经网络中起到了引入非线性变换的作用,增加了网络的表达能力。

激活函数的主要特点如下:

  • 非线性变换:激活函数对输入进行非线性变换,使得神经网络能够学习和表示非线性关系。如果没有激活函数,多个线性层堆叠起来的神经网络仍然只能表示线性关系。

  • 可微性:激活函数通常要求在大部分输入范围内是可导的,这是因为梯度下降等优化算法通常依赖于梯度的计算。可导的激活函数使得梯度可以传递并更新网络参数。

  • 非饱和性:一些激活函数具有非饱和性,即在输入较大或较小的情况下,能够保持较大的梯度,避免梯度消失问题。这有助于更好地传递误差信号和加速网络的收敛速度。

  • 映射范围:激活函数可以将输入信号映射到一定的输出范围内,如Sigmoid函数将输入映射到 (0, 1) 的范围内,而ReLU函数将负值映射为零。这有助于对输出进行限制或规范化。

常见的激活函数包括:

  1. Sigmoid函数:将输入映射到 (0, 1) 的范围内,具有平滑的非线性特性。
    在这里插入图片描述

  2. ReLU函数:在输入大于零时输出等于输入,小于零时输出为零,具有简单和高效的计算方式。
    在这里插入图片描述

  3. Tanh函数:将输入映射到 (-1, 1) 的范围内,形状与Sigmoid函数类似但对称。
    在这里插入图片描述

  4. Leaky ReLU函数:在输入小于零时引入一个小的斜率,避免了ReLU函数的部分问题。

  5. Softmax函数:用于多分类问题,在输出层将输入转化为概率分布。

三种激活函数的比较:
在这里插入图片描述

损失函数

损失函数是一个数学函数,用于衡量预测值与真实值之间的误差。它可以帮助我们确定模型的预测结果是否准确,并且可以用来评估模型的性能。

损失函数是深度学习中的一个关键因素,它可以帮助我们评估模型的性能并且用于调整模型的参数。选择合适的损失函数能够提高模型的性能,并有助于解决复杂的问题。

常见的损失函数:
在这里插入图片描述

内容来自视频:
深度神经网络的结构

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/734121.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Smart PLC模拟量采集和低通滤波器组合应用

SMART PLC模拟量采集功能块"S_ITR"算法公式和详细代码请参考下面文章: 1、模拟量采集功能块"S_ITR" https://rxxw-control.blog.csdn.net/article/details/121347697https://rxxw-control.blog.csdn.net/article/details/1213476972、线性转换…

ARM-v7 程序计数器PC的相关指令与应用

1. 前言 如图1所示,R14是连接寄存器(Link Register),在汇编指令中通常也写为LR,用于存储函数调用和异常等的返回信息,复位时,默认值为0xFFFFFFFF; 图1 Core register R15是程序计数…

vscode 配置 c 语言 问题解决

1.VS code调试时显示Unable to start debugging.The value of miDebuggerPath is invalid。 解决方法: VS code调试时显示Unable to start debugging.The value of miDebuggerPath is invalid_unable to start debugging. the value of midebugger-CSDN博客 2.VSCode运行C终端…

分类算法(Classification algorithms)

逻辑回归(logical regression): 逻辑回归这个名字听上去好像应该是回归算法的,但其实这个名字只是在历史上取名有点区别,但实际上它是一个完全属于是分类算法的。 我们为什么要学习它呢?在用我们的线性回归时会遇到一…

前端框架的发展历史介绍

前端框架的发展历史是Web技术进步的一个重要方面。从最初的简单HTML页面到现在的复杂单页应用程序(SPA),前端框架和库的发展极大地推动了Web应用程序的构建方式。以下是一些关键的前端框架和库,以及它们的发布年份、创建者和主要特…

java-ssm-jsp的问卷调查系统的设计与实现

java-ssm-jsp的问卷调查系统的设计与实现 获取源码——》公主号:计算机专业毕设大全

第十五章垃圾回收相关算法

第十五章垃圾回收相关算法 文章目录 第十五章垃圾回收相关算法1. 垃圾标记阶段的算法之引用计数算法1.1 垃圾标记阶段:对象存货判断1.2 方式一:引用计数算法循环引用 1.3 小结 2. 垃圾标记阶段的算法之可达性分析算法2.1 方式二:可达性分析&a…

Qt 定时器事件

文章目录 1 定时器事件1.1 界面布局1.2 关联信号槽1.3 重写timerEvent1.4 实现槽函数 启动定时器 2 定时器类 项目完整的源代码 QT中使用定时器,有两种方式: 定时器类:QTimer定时器事件:QEvent::Timer,对应的子类是QTi…

HttpURLConnection详解及使用

HttpURLConnection 请求响应流程 设置连接参数的方法 setAllowUserInteractionsetDoInputsetDoOutputsetIfModifiedSincesetUseCachessetDefaultAllowUserInteractionsetDefaultUseCaches 发送URL请求 建立实际连接之后,就是发送请求,把请求参数传到…

docker-swarm集群搭建

目录 一、docker swarm介绍 二、部署docker 三、搭建集群 3.1 工作模式 3.2 将当前主机作为leader 3.3 将第二个节点slave1加入到worker 3.4 将第三个节点slave2也加入到worker 3.5 将第四个节点(slave3)加入到manager 四、总结 一、docker swarm介绍 Docker Swarm…

java中{ }对变量可用scope的限制

改变变量定义位置可解决 y定义在{}内,属于局部变量,只能再在{}其中有效使用,因此第二个输出报错。 将int y6放在main()后,{}前可解决

浅析开源内存数据库Fastdb

介绍: Fastdb是免费开源内存数据库,其优秀的性能,和简洁的C代码,让我学习使用过程中收益颇多,但是国内中文相关研究的文章相当稀少,外文我查询相当不便。有兴趣的朋友可以通过以下网站访问:Mai…

《vtk9 book》 官方web版 第3章 - 计算机图形基础 (3 / 6)

3.8 演员几何 我们已经看到了光照属性如何控制演员的外观,以及相机如何结合变换矩阵将演员投影到图像平面上。剩下的是定义演员的几何形状,以及如何将其定位在世界坐标系中。 建模 计算机图形学研究中的一个重要主题是建模或表示物体的几何形状。…

一劳永逸的方法解决:LNK1168无法打开 xxx.exe 进行写入 报错问题

这种错误的产生原因: 运行程序退出不是按正常流退出,是按窗口右上角的 “X” 来关闭程序,但是后台的xxx.exe控制台程序还在运行;修改程序的代码后再运行,就会报LNK1168的错误; 报错示例: 解决方…

文本生成视频:从 Write-a-video到 Sora

2024年2月15日,OpenAI 推出了其最新的文本生成视频模型——Sora。Sora 能够根据用户的指令生成一分钟长度的高质量视频内容。这一创新的发布迅速在社会各界引发了广泛关注与深入讨论。本文将围绕本实验室发表于SIGGRAPH AISA 的 Write-a-video和 Sora 展开&#xff…

8核16G服务器多少钱?2024年腾讯云8核16G轻量服务器性能测评

腾讯云8核16G轻量服务器CPU性能如何?18M带宽支持多少人在线?轻量应用服务器具有100%CPU性能,18M带宽下载速度2304KB/秒,折合2.25M/s,系统盘为270GB SSD盘,月流量3500GB,折合每天116.6GB流量&…

真实案例分享:MOS管电源开关电路,遇到上电冲击电流超标

做硬件,堆经验。 分享一个案例:MOS管电源开关电路,遇到上电冲击电流超标,怎么解决的呢? 下面是正文部分。 —— 正文 —— 最近有一颗用了挺久的MOSFET发了停产通知,供应链部门找到我们研发部门&#xff0c…

Pycharm与Anaconda安装

网址: Pycharm:https://www.jetbrains.com/pycharm/ Anaconda:https://www.anaconda.com/download/ 官网下载速度太慢可以选择到清华源下载:https://repo.anaconda.com/archive/ 一:Anaconda安装 安装: …

Building Systems with the ChatGPT API

Building Systems with the ChatGPT API 本文是 https://www.deeplearning.ai/short-courses/building-systems-with-chatgpt/ 这门课程的学习笔记。 文章目录 Building Systems with the ChatGPT APIWhat you’ll learn in this course Language Models, the Chat Format and…

【C++ vector 类】

1. 标准库中的vector类 vector 类 的介绍: 注意: 1. vector是表示可变大小数组的序列容器。 2. 就像数组一样,vector 也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是…