【深度学习基础】

【深度学习基础】

news/2025/7/3 13:06:50/文章来源:https://blog.csdn.net/weixin_44021553/article/details/137240448

打基础日常记录

CNN基础知识
- 1. 感知机
- 2. DNN 深度神经网络（全连接神经网络）
- - DNN 与感知机的区别
  - DNN特点，全连接神经网络
  - DNN前向传播和反向传播
- 3. CNN结构【提取特征+分类】
- 4. CNN应用于文本
RNN基础
- 1. RNN的本质
词向量模型word2Vec
- 1. 自然语言处理需要解决的问题
- 2. 如何解决上述问题
- 3. 词向量是什么（训练成词向量）
- 4. 神经网络做什么？
- 5. 模型如何去训练词向量
- 6. 构建训练数据
- 7. 浩大的语料库中，

CNN基础知识

1. 感知机

单层感知机就是一个二分类器，接收输入向量，输出分类结果，先进行线性加权，再进行激活函数的非线性转换，就相当于是一个小模型，里面的权重w和b是模型的参数
参考1

参考2
在这里插入图片描述

2. DNN 深度神经网络（全连接神经网络）

在这里插入图片描述

DNN 与感知机的区别

在这里插入图片描述

DNN特点，全连接神经网络

在这里插入图片描述

DNN前向传播和反向传播

在这里插入图片描述

3. CNN结构【提取特征+分类】

3.1 CNN特有的卷积层，
3.2 卷积层自带卷积核和relu激活函数，
3.3 CNN特有的池化层（池化层没有激活函数）
在这里插入图片描述

4. CNN应用于文本

在这里插入图片描述

RNN基础

1. RNN的本质

常用在NLP中，应为NLP是处理语句的，语句之间有先后顺序，RNN可以在预测中加入先后顺序的信息
在这里插入图片描述
–分割线–

–分割线–

–分割线–

在这里插入图片描述

词向量模型word2Vec

把单词转换成向量，也就是一个一个的数值，计算机知道这些数值的含义，人类不需要理解

1. 自然语言处理需要解决的问题

单词之间应该有先后的顺序，而不是用词频；
意思相近的单词在空间中的表示也应该相近；

2. 如何解决上述问题

把单词变成向量，计算两个向量之间的相似度；（解决问题2）

3. 词向量是什么（训练成词向量）

词向量就是在规定的维度内，通常是50-300维度，把单词变成数值，计算机可以认识
在这里插入图片描述

4. 神经网络做什么？

输入两个单词，预测第三个单词

5. 模型如何去训练词向量

先有一个词向量库（随机初始化的），Look up embedding, 从中查找到输入词的向量，词向量输入到网络中，预测下一个词向量是什么，通过loss更新网络的权重参数以及词向量库

词训练数据库，是任何正常说话的逻辑数据都可以当成训练数据

6. 构建训练数据

在这里插入图片描述

在这里插入图片描述

7. 浩大的语料库中，

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/800774.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Selenium与Metamask钱包及DApp交互及验证码破解汇总

Selenium与Metamask钱包及DApp交互及验证码破解汇总

1.LavaMoat报错： selenium.common.exceptions.WebDriverException: Message: unknown error: Runtime.callFunctionOn threw exception: Error: LavaMoat...`报错原因：根本原因是Metamask为了用户钱包安全，而将LavaMoat 设置为了全局不可用。报错解析文章链接： https:/…

阅读更多...

城市定量分析学习资料大数据 gis 空间句法 Python

城市定量分析学习资料大数据 gis 空间句法 Python

城市定量分析学习资料大数据 gis 空间句法 Python

阅读更多...

Ubuntu 20.04.06 PCL C++学习记录（十六）

Ubuntu 20.04.06 PCL C++学习记录（十六）

[TOC]PCL中点云分割模块的学习学习背景参考书籍：《点云库PCL从入门到精通》以及官方代码PCL官方代码链接,，PCL版本为1.10.0，CMake版本为3.16 学习内容用一组点云数据做简单的平面的分割源代码及所用函数源代码 #include<iostr…

阅读更多...

IP地址到底有什么用

IP地址到底有什么用

IP地址在计算机网络中的作用至关重要，它不仅是设备在网络中的唯一标识，更是实现网络通信、网络管理和安全的关键要素。下面，我们将从多个方面详细阐述IP地址的作用。首先，IP地址作为设备的唯一标识，为网络通信提供了…

阅读更多...

JavaScript - 你做过字符串反转吗

JavaScript - 你做过字符串反转吗

难度级别：初级及以上提问概率：65% 例如有一个字符串本来是“abcde”，那么现在希望可以将其反转，最终的值是“edcba”，该如何做呢？第一种是将字符串转为数组，利用数组的reverse方法实现元素反转，然后再将数组转为字符串，代码如下 …

阅读更多...

面试必问！鸿蒙开发中的FA模型和Stage模型是什么？他们分别有什么区别？

面试必问！鸿蒙开发中的FA模型和Stage模型是什么？他们分别有什么区别？

鸿蒙OS（HarmonyOS） 是面向全场景的分布式操作系统，它通过创新的应用模型，为开发者提供了强大的应用开发框架。在HarmonyOS的发展过程中，FA模型（Feature Ability）和Stage模型是两种重要的应用模…

阅读更多...

常规的k8s的监控指标

常规的k8s的监控指标

常规的监控指标 1、集群维度集群状态集群节点数节点状态（正常、不可达、未知）节点的资源使用率（CPU、内存、IO等）2、应用维度应用响应时间应用的错误率应用的请求量 3、系统和集群组件维度 API服务器状态控制器状态etcd状态常用的 Prometheus Operator 指标常用监控…

阅读更多...

静电场概述

静电场概述

什么是静电场静电场是由特殊的电荷引起场。这个特殊的电荷指：相对于观察者静止、且电量不随时间改变的电荷。库仑定律指在无限大的真空中，当两个静止的小带电体之间的距离远远大于本身的几何尺寸时，该两带电体之间的作用力。如图所示…

阅读更多...

二分查找 -- 力扣（LeetCode）第704题

二分查找 -- 力扣（LeetCode）第704题

题目 https://leetcode.cn/problems/binary-search/description/ 给定一个 n 个元素有序的（升序）整型数组 nums 和一个目标值 target ，写一个函数搜索 nums 中的 target，如果目标值存在返回下标，否则返回 -1。示例…

阅读更多...

如何在微信小程序中使用less来编写css

如何在微信小程序中使用less来编写css

在微信小程序中使用 Less 需要一些额外的配置步骤,因为小程序本身不支持直接引用 Less 文件。我们可以借助 Webpack 进行构建,使用一些 loader 来编译 Less 文件。以下是具体步骤: 初始化项目使用微信开发者工具新建一个小程序项目,或在已有项目的基础上操作。安装依赖使…

阅读更多...

JavaScript代码小挑战

JavaScript代码小挑战

题目如下： 朱莉娅和凯特正在做一项关于狗的研究。于是，她们分别询问了 5 位狗主人他们的狗的年龄，并将数据存储到一个数组中（每人一个数组）。目前，她们只想知道一只狗是成年狗还是小狗。如果狗的年龄至少为…

阅读更多...

SpringBoot集成Skywalking链路追踪

SpringBoot集成Skywalking链路追踪

安装skywaling 参考：Centos7搭建 SkyWalking 单机版-CSDN博客下载Agents https://archive.apache.org/dist/skywalking/java-agent/9.0.0/apache-skywalking-java-agent-9.0.0.tgz 1. 在IDEA中使用skywalking agent 在VM options中填入如下信息 -javaagent后是…

阅读更多...

Scaling Laws 又失灵了？谷歌新研究：扩散模型不是越大越好

Scaling Laws 又失灵了？谷歌新研究：扩散模型不是越大越好

近年来，模型规模呈现出愈来愈大的趋势，越来越多的人相信“力大砖飞”。 OpenAI 虽然没有公布Sora的训练细节，但在Sora的技术报告中提到了： Our largest model, Sora, is capable of generating a minute of high fidelity video.…

阅读更多...

[RK-Linux] RK3399启动流程详解

[RK-Linux] RK3399启动流程详解

一、SoC启动流程 1.1 BootROM介绍在嵌入式系统中，SoC（System on Chip）制造商通常会在芯片内部集成一段固化的启动代码，这段代码被称为BootROM，它负责系统的最初级启动程序。 1.1.1 初始化硬件当SoC上电时，首先由BootROM接管系统，其首要任务是初始化硬件环境。这包…

阅读更多...

AI技术创业机会之金融科技

AI技术创业机会之金融科技

金融科技服务（FinTech）领域正经历着一场由人工智能（AI）技术引领的深刻变革，为创业者提供了无数创新与颠覆传统金融服务模式的机会。以下详述了金融科技服务中AI技术的具体创业机会及其细节与内容，以期为有志于涉足此领域的创业者提供全面的洞察与参考。一、智能投顾与财…

阅读更多...

Dify开源大语言模型(LLM) 应用开发平台如何使用Docker部署与远程访问

Dify开源大语言模型(LLM) 应用开发平台如何使用Docker部署与远程访问

文章目录 1. Docker部署Dify2. 本地访问Dify3. Ubuntu安装Cpolar4. 配置公网地址5. 远程访问6. 固定Cpolar公网地址7. 固定地址访问本文主要介绍如何在Linux Ubuntu系统以Docker的方式快速部署Dify,并结合cpolar内网穿透工具实现公网远程访问本地Dify！ Dify 是一款…

阅读更多...

spring01：IOC（控制反转）

spring01：IOC（控制反转）

spring01：IOC（控制反转） 文章目录 spring01：IOC（控制反转）前言：一、IOC：inversion of control（控制反转）控制：控制对象的创建！&#x…

阅读更多...

西安交通大学《数据库理论与技术》课程实验+期末考试资料全通关

西安交通大学《数据库理论与技术》课程实验+期末考试资料全通关

课程概况首先请确认一下课程情况：数据库理论与技术是西安交通大学开设的秋季研究生选修课程，授课教师为侯迪老师。本文涉及的所有资料下载链接：链接: https://pan.baidu.com/s/1oB9I6SSaWejZwmM6NfTFpg 提取码: hrww 本课程有五次当堂小…

阅读更多...

如何在Linux中找到正在运行的Java应用的JAR文件

如何在Linux中找到正在运行的Java应用的JAR文件

当你在Linux服务器上工作时，可能需要找到某个正在运行的Java应用的JAR文件位置。这对于诊断问题、更新应用或理解部署结构非常有用。以下是一个步骤详细的指南，帮助你找到这些信息。 1. 确定Java进程首先，你需要确定正在运行的Java应用的进…

阅读更多...

IDEA中修改git的作者、邮箱名称

IDEA中修改git的作者、邮箱名称

目录一、查看当前git信息 1、查看git作者名称如下图： 2、查看git邮箱信息二、修改git信息 1、修改git作者名称如下图： 2、修改git邮箱名称一、查看当前git信息 1、查看git作者名称在git控制台或者 Terminal 输入 git config user.name …

阅读更多...

最新文章