《Python深度学习》阅读笔记

以下是《Python深度学习》一书中学习过程中记录的一些重要的专属名词和概念:

一、概念

  1. 深度学习(Deep Learning):指使用多层神经网络进行机器学习的技术。
  2. 神经网络(Neural Network):一种模仿生物神经网络工作原理的机器学习模型。
  3. 前向传播(Forward Propagation):在神经网络中,输入数据从输入层通过隐藏层,最终到达输出层的过程。
  4. 反向传播(Backpropagation):在神经网络中,根据输出层的错误来调整网络中权重的过程。
  5. 激活函数(Activation Function):用于引入非线性特性到神经网络中的函数,如ReLU、Sigmoid和Tanh等。
  6. 批量标准化(Batch Normalization):一种加速神经网络训练的方法,通过对每一批数据进行归一化处理来改善网络的性能。
  7. 损失函数(Loss Function):用于衡量模型预测结果与真实结果之间的差距。
  8. 优化器(Optimizer):用于调整模型中的权重和偏置,以最小化损失函数。
  9. 学习率(Learning Rate):优化器在调整权重和偏置时的步长。
  10. Dropout(Dropout):一种正则化技术,通过随机忽略部分神经元来防止过拟合。
  11. 过拟合(Overfitting):模型在训练数据上表现很好,但在测试数据上表现不佳的现象。
  12. 欠拟合(Underfitting):模型在训练数据和测试数据上都表现不佳的现象。
  13. 卷积神经网络(Convolutional Neural Network,CNN):一种专门用于处理图像数据的神经网络。
  14. 循环神经网络(Recurrent Neural Network,RNN):一种能够处理序列数据的神经网络,如文本和时间序列数据。
  15. 长短期记忆网络(Long Short-Term Memory,LSTM):一种特殊的循环神经网络,用于处理需要理解序列中长距离依赖关系的问题。
  16. 转化器(Transformer):一种基于自注意力机制的深度学习模型,被广泛应用于自然语言处理任务。
  17. 自注意力机制(Self-Attention Mechanism):一种让神经网络关注输入序列中不同位置的信息,从而更好地理解序列数据的技术。
  18. 验证集(Validation Set):从原始数据中划分出来的一组数据,用于调整模型的超参数和防止过拟合。
  19. 测试集(Test Set):从原始数据中划分出来的一组数据,用于评估模型的性能。
  20. 梯度消失问题(Vanishing Gradient Problem):在深度神经网络中,梯度在反向传播过程中会逐渐变小,导致网络中的早期层无法从训练过程中学习到有用的信息。
  21. 梯度爆炸问题(Exploding Gradient Problem):与梯度消失问题相反,梯度在反向传播过程中可能会变得非常大,导致模型训练不稳定甚至崩溃。
  22. 特征工程(Feature Engineering):通过对数据进行预处理、转换和特征选择等操作,提高机器学习模型性能的过程。
  23. 迁移学习(Transfer Learning):利用在大规模数据集上预训练的模型来帮助解决类似问题的技术。
  24. Keras:一个高级神经网络API,支持多种深度学习框架,包括TensorFlow、CNTK和Theano等。
  25. TensorFlow:一个流行的深度学习框架,由Google开发并维护。
  26. PyTorch:另一个流行的深度学习框架,由Facebook AI Research开发并维护。
  27. Keract:Keras的CPU和GPU张量操作库,提供更高效的张量操作功能。
  28. Jupyter Notebook:一个Web应用程序,允许创建和共享包含实时代码、注释和输出在内的文档。
  29. Colab:Google开发的免费Jupyter notebook服务,提供GPU加速功能。
  30. Docker:一个开源容器化平台,允许打包、分发和运行应用程序及其依赖项。
  31. TensorBoard:TensorFlow的可视化工具,用于监视训练过程、可视化和理解模型。
  32. ONNX:开放神经网络交换格式,用于表示深度学习模型。它支持多种深度学习框架的模型转换,包括TensorFlow、PyTorch和其他框架。
  33. NVIDIA GPU:专为深度学习应用设计的图形处理器,提供强大的计算能力和高内存带宽。
  34. TPU(Tensor Processing Unit):Google专为机器学习任务设计的处理器,具有高吞吐量、低延迟和节能等特性。
  35. GPU Cloud Provider:提供GPU云服务以支持深度学习应用的云服务提供商,如Google Cloud、Amazon Web Services(AWS)和Microsoft Azure等。
  36. OpenAI API:OpenAI是一家提供人工智能模型的机构,其API允许用户通过简单的接口访问其强大的深度学习模型。
  37. GPT(Generative Pre-trained Transformer):一种基于Transformer模型的自回归语言模型,被用于生成文本和回答自然语言问题。
  38. BERT(Bidirectional Encoder Representations from Transformers):一种基于Transformer模型的预训练语言模型,被用于理解自然语言文本的含义和上下文。
  39. Transformer模型:一种基于自注意力机制的深度学习模型,被广泛应用于自然语言处理任务。
  40. 自动编码器(Autoencoder):一种神经网络架构,用于将输入数据编码成低维空间表示,然后再从低维空间表示还原成原始数据。
  41. 生成对抗网络(Generative Adversarial Networks,GAN):一种神经网络架构,由一个生成器网络和一个判别器网络组成,通过竞争来提高双方的生成和判别能力。
  42. 变分自编码器(Variational Autoencoder,VAE):一种结合了潜变量模型的神经网络架构,用于生成数据和重构数据。
  43. 强化学习(Reinforcement Learning):一种通过与环境的交互来学习最优行为的机器学习方法。
  44. Q-Learning:一种用于解决强化学习问题的算法,通过学习动作的价值来选择最优动作。
  45. TensorFlow Serving:TensorFlow的模型部署框架,用于将训练好的模型转换成服务部署到生产环境。
  46. TensorFlow Lite:TensorFlow的移动端和嵌入式设备支持框架,用于在这些设备上运行TensorFlow模型。
  47. TensorFlow.js:TensorFlow的JavaScript库,用于在浏览器和Node.js环境中运行TensorFlow模型。
  48. TensorBoardX:使用TensorFlow 1.x API的TensorBoard替代方案,支持Keras 2.x和PyTorch。
  49. ONNX Runtime:ONNX的模型运行时,支持在多种设备上运行ONNX格式的模型。

二、详解

2.1 深度学习

在这里插入图片描述

深度学习是机器学习的一个分支领域:它是从数据中学习表示的一种新方法,强调从连续的层中学习,这些层对应于越来越有意义的表示。

深度学习之“深度”并不是说这种方法能够获取更深层次的理解,而是指一系列连续的表示层。数据模型所包含的层数被称为该模型的深度( depth)。

2.2 神经网络

在深度学习中,这些分层表示是通过叫作神经网络( neural network)的模型学习得到的。
神经网络的结构是逐层堆叠。“神经网络”这一术语来自于神经生物学,然而,虽然深度学习的
一些核心概念是从人们对大脑(特别是视觉皮层)的理解中汲取部分灵感而形成的,但深度学
习模型并不是大脑模型。没有证据表明大脑的学习机制与现代深度学习模型的学习机制相同。
你可能读过一些科普文章,这些文章宣称深度学习的工作原理与大脑相似或者是在模拟大脑,
但事实并非如此。对于这一领域的新人来说,如果认为深度学习与神经生物学存在任何关系,
那将使人困惑,只会起到反作用。

2.3 前向传播

在这里插入图片描述

我们为图中的“输入节点”(输入 x、目标 y_true、 w 和 b)赋值。我们将这些值传入图中
所有节点,从上到下,直到 loss_val。这就是前向传播过程

2.4 反向传播

在这里插入图片描述

下面我们“反过来”看这张图。对于图中从 A 到 B 的每条边,我们都画一条从 B 到 A 的反向边,
并提出问题:如果 A 发生变化,那么 B 会怎么变?也就是说, grad(B, A) 是多少?我们在每
条反向边上标出这个值。这个反向图表示的是反向传播过程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/749521.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot打造企业级进销存储系统 第五讲

package com.java1234.repository;import com.java1234.entity.Menu; import org.springframework.data.jpa.repository.JpaRepository; import org.springframework.data.jpa.repository.Query;import java.util.List;/*** 菜单Repository接口*/ public interface MenuReposit…

第二百零五回

文章目录 概念介绍响应方法滑动事件点击事件 经验总结 我们在上一章回中介绍了如何给ListView添加分隔线,本章回中将介绍ListView响应事件相关的知识.闲话休提,让我们一起Talk Flutter吧。 概念介绍 我们在这里说的ListView响应事件主要分两种类型,一种…

【深度学习模型移植】用torch普通算子组合替代torch.einsum方法

首先不得不佩服大模型的强大之处,在算法移植过程中遇到einsum算子在ONNX中不支持,因此需要使用普通算子替代。参考TensorRT - 使用torch普通算子组合替代torch.einsum爱因斯坦求和约定算子的一般性方法。可以写出简单的替换方法,但是该方法会…

【Flask开发实战】项目介绍-防火墙规则查询系统

一、前言 硬件防火墙为常备主用网络安全设备,主要通过网络访问控制方式实现安全防护。 不同厂家防火墙的网络访问控制功能均采用同样的模式操作:防火墙配置若干条防火墙规则,当IP包到来,防火墙根据包的五元组属性(协…

突破编程_前端_JS编程实例(工具栏组件)

1 开发目标 工具栏组件旨在模拟常见的桌面软件工具栏,所以比较适用于 electron 的开发,该组件包含工具栏按钮、工具栏分割条和工具栏容器三个主要角色,并提供一系列接口和功能,以满足用户在不同场景下的需求: 点击工具…

【MatLab】之:Simulink安装

一、内容简介 本文介绍如何在 MatLab 中安装 Simulink 仿真工具包。 二、所需原材料 MatLab R2020b(教学使用) 三、安装步骤 1. 点击菜单中的“附加功能”,进入附加功能管理器: 2. 在左侧的“按类别筛选”下选择Using Simulin…

Linux网络编程: IP协议详解

一、TCP/IP五层模型 物理层(Physical Layer):物理层是最底层,负责传输比特流(bitstream)以及物理介质的传输方式。它定义了如何在物理媒介上传输原始的比特流,例如通过电缆、光纤或无线传输等。…

购票小程序有哪些功能

​通过小程序购买电子票,然后在使用时,出示电子票二维码,由商家进行验证/核销。通过小程序购票和核销,使得整个流程非常顺利,免去了线下购票的繁琐,而且还容易遗失。下面我们就来具体看一下小程序如何进行购…

Postman进行Websocket接口测试

Postman进行Websocket接口测试 前言下载地址使用1、new一个一个WebSocket Request2、填写内容和需要请求头携带的参数3、表示成功 网页请求101表示握手成功 前言 有些较低版本postman不支持websocket接口测试,如果根据此文未找到创建websocket接口测试的目录&#…

面向对象(C# )

面向对象(C# ) 文章目录 面向对象(C# )ref 和 out传值调用和引用调用ref 和 out 的使用ref 和 out 的区别 结构体垃圾回收GC封装成员属性索引器静态成员静态类静态构造函数拓展方法运算符重载内部类和分布类 继承里氏替换继承中的…

Qt 鼠标滚轮示例

1.声明 void wheelEvent(QWheelEvent *event) override;2.实现&#xff08;方便复制、测试起见用静态变量&#xff09; #include <mutex> void MainWindow::wheelEvent(QWheelEvent *event) {static QLabel *label new QLabel("Zoom Level: 100%", this);st…

elementUi中表格超出一行省略,鼠标放入显示完整提示

一、想要的效果 二、代码&#xff0c;加入show-overflow-tooltip即可 <el-table-column min-width"220" prop"content" show-overflow-tooltip> </el-table-column>

PCB设计中的MARKER

今天在给板子布局的时候发现了一个这样的东西&#xff0c;名叫MARKER&#xff0c;查了一下这个东西分享一下&#xff1a; 目录 MARKER是什么样的&#xff1f; MARKER的用途&#xff1a; MARKER是必须的吗&#xff1f; MARKER是什么样的&#xff1f; 他在PCB中是这样的&…

web 课程

文章目录 格式图片超链接书签链接表格例子横跨束跨 格式 <br /> <br/> #换行图片 <img> 标签是用于在网页中嵌入图像的 HTML 标签&#xff0c;它有一些属性可以用来控制图像的加载、显示和交互。以下是对 <img> 标签常用属性的详细介绍&#xff1a;…

MySQL基础架构

文章目录 MySQL基础架构一、连接器 - 建立连接&#xff0c;权限认证二、查缓存 - 提高效率三、分析器 - 做什么四、优化器 - 怎么做五、执行器 - 执行语句六、存储引擎1、存储引擎的概述2、存储引擎的对比3、存储引擎的命令4、存储引擎的选择 MySQL基础架构 大体来说&#xff…

旅游管理系统 |基于springboot框架+ Mysql+Java+Tomcat的旅游管理系统设计与实现(可运行源码+数据库+设计文档)

推荐阅读100套最新项目 最新ssmjava项目文档视频演示可运行源码分享 最新jspjava项目文档视频演示可运行源码分享 最新Spring Boot项目文档视频演示可运行源码分享 目录 前台功能效果图 管理员功能登录前台功能效果图 系统功能设计 数据库E-R图设计 lunwen参考 摘要 研究…

Transformer面试题总结101道

在本文中&#xff0c;我们将回答一系列关于Transformer的问题&#xff0c;涵盖了从基础概念到高级应用的多个方面。无论您是准备面试、学习深度学习&#xff0c;还是对自然语言处理技术感兴趣&#xff0c;都希望本文能为您提供有益的启示和知识。 注&#xff0c;本文的面试题借…

idea中database的一些用法

1、查看表结构 方法1&#xff0c;右键&#xff0c;选这个 方法2 双击表后&#xff0c;看到数据&#xff0c;点DDL 方法3 写SQL时&#xff0c;把鼠标放在表名上&#xff0c;可以快速查看表结构 2、表生成对应的实体类 表中右键&#xff0c;选择这2个&#xff0c;选择生成的路…

FPGA和ASIC

前言 大家好&#xff0c;我是jiantaoyab&#xff0c;这是我所总结作为学习的笔记第16篇,在本篇文章给大家介绍FPGA和ASIC。 一个四核i7的CPU的晶体管中有20亿的晶体管&#xff0c;需要链接起20亿的晶体管可不是一件容易的事情&#xff0c;所以设计一个CPU需要用年来算&#x…

【代码随想录】【回溯算法】补day24:组合问题以及组合的优化

回溯算法&#xff1a;递归函数里面嵌套着for循环 给定两个整数 n 和 k&#xff0c;返回 1 … n 中所有可能的 k 个数的组合。 示例: 输入: n 4, k 2 输出: [ [2,4], [3,4], [2,3], [1,2], [1,3], [1,4], ] 包含组合问题和组合问题的剪枝优化 class solution:def combine(se…