深度学习的模型有几类,能干嘛用?

1、基础模型

(1)卷积神经网络

**卷积:**卷积的本质是通过矩阵运算9的方式将输入数据进行空间上的滤波,有效地提取数据中的局
部特征,从而实现特征数据更高程度的抽象表示。
在这里插入图片描述
**池化:**可以理解成“压缩”,用来降低卷积层Q输出的特征维度,减少网络参数和计算量。

在这里插入图片描述
CNN通过多个卷积层和池化层Q对输入图像进行多次特征提取和降采样,最终得到全局特征表示,再通过全连接层Q进行分类。
优点:
参数数量小,训练时间短。
缺点:
不适用于序列数据Q,无法处理时序信息。
CNN的实际应用(更适合图像任务):
图像分类、图像检索、目标检测、人脸识别、文本分类、语音识别

(2)循环神经网络 RNN

在这里插入图片描述
RNN是将CNN进行了改造,简单来说就是把上一次的输出混合下一次的输入再做一次计算,每次计算都对上一次的计算结果有一定的依赖。
优点:
解决了输入数据是连续的序列问题(例如“我喜欢人工智能”每个字之间有时序关系,也有逻辑关
系)。
缺点:
梯度消失Q或梯度爆炸、训川练速度较慢,计算量较大、复杂序列数据支持得不够好
RNN的实际应用(更适合NLPQ任务):
机器翻译、语音识别、图片描述、时间序列分析等任务。

(3)长短期记忆网络 LSTM(long short-term memory)(基于RNN的扩展)

在这里插入图片描述
LSTM是RNN的一种变体,通过“门”结构引入“选择性遗忘Q“机制,解决RNN的这一弊端。
优点:
解决了传统RNN中存在的梯度消失和梯度爆炸问题,从而更好地处理长序列数据。
缺点
因为LSTM是RNN的一种变体,因此缺点方面,仍然是RNN的那些缺点。
LSTM的实际应用(更适合NLP任务):
文本情感分析、语音识别、机器翻译、序列预测、图像分析、语音生成、时间序列分析。

2、高级模型和技术

(1)生成对抗网络 GAN(Generative Adversarial Networks)

在这里插入图片描述
优点:
生成能力强、不需要显式监督
缺点:
训练过程复杂、数据要求高
GAN的实际应用:
图像生成、图像修复“、风格迁移、去掉图像遮挡、年龄转移、语音合成“等。

(2)Transformer:

2017年,Google发表论文《Attention is all you need)》Q,成为Transformer开山之作。通过引入自注意力机制、多头自注意力机制°、前馈神经网络和位置编码等技术,Transformer实现了高效的并行计算和强大的表示能力。

在这里插入图片描述
自此,Transformer架构一路开挂,形成了一个枝繁叶茂的大家族,在文本分类、命名实体识别Q、
情感分析、问答系统、机器翻译、语音识别、图像分类Q等领域都取得了显著的成果。

3、大型预训练语言模型(Large Language Model)(通常基于Transformer架构)

近年来,BERT、GPT4、LLaMa等一大批优秀大模型纷纷亮相,开启了大模型新时代的新篇章。
前不久,谷歌多模态大模型RGemini Ultra也重磅发布,如今大模型不能说是热点,而要说是沸点
了。
在这里插入图片描述
对于技术人员来说,无论是从原理还是从使用上,大模型都注定成为“兵家必争之地”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/813539.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

09 Php学习:超级全局变量

超级全局变量 PHP中预定义了几个超级全局变量(superglobals) ,这意味着它们在一个脚本的全部作用域中都可用。 PHP 超级全局变量列表: $GLOBALS$_SERVER$_REQUEST$_POST$_GET$_FILES$_ENV$_COOKIE$_SESSION $GLOBALS $GLOBALS 是 PHP 中的…

实现优雅的并行程序的策略:

前言: 实现优雅且高效的并行程序确实是并行编程中的一大挑战。在设计并行程序时,确保程序的正确性和性能是主要考虑的两个方面。以下是几个关键策略,可帮助在保证程序正确性的前提下优雅地实现并行程序: 实现优雅的并行程序的策略如下:第一、精心设计任务分解: 并行程序…

【MYSQL】字符串存储类型该怎么选:mysql中char、varchar、text的区别

文章目录 一. 简述二. 各自特点 参考官网:mysql-string-type-syntax 一. 简述 char长度固定: 即每条数据占用等长字节空间;适合用在身份证号码、手机号码等定。varchar可变长度:可以设置最大长度;适合用在长度可变的属…

2024-04-09(CSS移动Web+JS进阶)

1.平面转换 作用:为元素增加动态效果,一般和过度配合使用 定义:改变盒子在平面内的形态(位移、旋转、缩放、倾斜) transfrom属性中有许多方法支持对盒子进行各种变换。 2.空间变换 XYZ三条轴线构成立体空间&#…

Spring源码复习之BeanDefinition理解

文章目录 一. 基本描述二. 源码分析三. BeanDefinition重要实现类1. GenericBeanDefinition2. RootBeanDefinition3. ChildBeanDefinition4. AnnotatedGenericBeanDefinition5. ConfigurationClassBeanDefinition6. ScannedGenericBeanDefinition四. 最佳实践五. 常见问题

算法打卡day39|动态规划篇07| Leetcode 70. 爬楼梯(进阶版)、322. 零钱兑换、279.完全平方数

算法题 Leetcode 70. 爬楼梯&#xff08;进阶版&#xff09; 题目&#xff1a; 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。 每次你可以爬至多m (1 < m < n)个台阶。你有多少种不同的方法可以爬到楼顶呢&#xff1f; 注意&#xff1a;给定 n 是一个正整数。 输入描述…

全新4.0版本圈子社交论坛系统 ,可打包小程序,于TP6+uni-app 全开源 可打包小程序app uniapp前端+全开源+独立版

简述 首先 圈子系统的核心是基于共同的兴趣或爱好将用户聚集在一起&#xff0c;这种设计使得用户能够迅速找到与自己有共同话题和兴趣的人。 其次 圈子系统提供了丰富的社交功能&#xff0c;如发帖、建圈子、发活动等&#xff0c;并且支持小程序授权登录、H5和APP等多种形式…

dfs板子

递归实现排列 留着明早省赛之前看 #include<iostream> using namespace std; int arr[10010]; int brr[10010]; int n,k; void dfs(int num){if(num > n){for(int i 1;i < n;i){cout << arr[i] << " ";}cout << endl;return;}for(in…

C# winform实现搜索读取已安装的路径

最近在开发winform窗体应用简单的桌面插件,需求是要点击按钮,就可打开相应程序软件但问题在于每个人电脑上的软件安装路径不同所以涉及到读取路径的的问题. 这位兄台写的播客解决了我的问题,甚是不错. ↓↓↓ 解决方案

二、计算机网络物理层基础知识

一、物理层 物理层接口特性&#xff1a;解决如何在连接各种计算机传输媒体上的传输数据比特流&#xff0c;而不是指具体的传输媒体 物理层的主要任务 &#xff1a;确定与传输媒体接口有关的一些特性>定义标准 1、机械特性&#xff1a;定义物理连接的特性&#xff0c;规定物理…

golang kafka sarama源码分析

一些理论 1.topic支持多分区&#xff0c;每个分区只能被组内的一个消费者消费&#xff0c;一个消费者可能消费多个分区的数据&#xff1b; 2.消费者组重平衡的分区策略&#xff0c;是由消费者自己决定的&#xff0c;具体是从消费者组中选一个作为leader进行分区方案分配&#…

人员抽烟AI检测算法原理介绍及实际场景应用

抽烟检测AI算法是一种基于计算机视觉和深度学习技术的先进工具&#xff0c;旨在准确识别并监测个体是否抽烟。该算法通过训练大量图像数据&#xff0c;使模型能够识别出抽烟行为的关键特征&#xff0c;如烟雾、手部动作和口部形态等。 在原理上&#xff0c;抽烟检测AI算法主要…

【Linux系列】Linux判断架构信息

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

K8s: 裸机初始化Kubernetes集群环境

环境准备 这里要先准备 linux 环境&#xff0c;提供一下几种方案1 &#xff09;在云产品上购买一台裸机2 &#xff09;选择一台刚安装好的 linux 服务器3 &#xff09;选择虚拟机安装 linux这里&#xff0c;我选择linux的环境为 centos 在安装了 centos 的裸机上进行搭建 1 &…

【QT入门】 Qt自定义控件与样式设计之QPushButton实现鼠标悬浮按钮弹出对话框

往期回顾&#xff1a; 【QT入门】 Qt自定义控件与样式设计之qss选择器-CSDN博客 【QT入门】 Qt自定义控件与样式设计之QLineEdit的qss使用-CSDN博客 【QT入门】Qt自定义控件与样式设计之QPushButton常用qss-CSDN博客 【QT入门】 Qt自定义控件与样式设计之QPushButton实现鼠标悬…

scipy.signal.cwt 与 pywt.cwt 使用记录

scipy.signal.cwt 该代码中widths以及freq计算公式来源于scipy.signal.morlet2函数官方案例 from scipy.signal import morlet, morlet2 from scipy import signal import matplotlib.pyplot as pltsignal_length 2000 fs 1000# 生成信号数据 time np.arange(0, signal_leng…

黄仁勋揭秘EIOFS(未来成功早期指标)英伟达成为最伟大AI企业的核心奥义

黄仁勋揭秘EIOFS(未来成功早期指标&#xff09;英伟达成为最伟大AI企业的核心奥义 原创 AI 吴厂长 AI 吴厂长 2024-04-02 00:12 上海 黄仁勋&#xff1a;你应该寻找未来成功的早期指标&#xff0c;而且越早越好。 原因是你想尽早看到自己正走在正确的方向上。 有个短语叫EIO…

Go语言中工作负载类型对并发的影响

在实际工作开发中我们需要根据工作负载是CPU密集型还是I/O密集型,使用不同的方式来解决问题。下面我们先来看这些概念,然后再讨论其影响。 在程序执行时,工作负载的执行时间会受以下因素限制: CPU的速度--例如,运行归并排序算法。工作负载被称为CPU密集型。I/O速度--例如…

Ubuntu 点击图标窗口最小化

本文所使用的 Ubuntu 系统版本是 Ubuntu 22.04 ! 用过 Ubuntu 系统的都知道&#xff0c;点击任务栏上的图标&#xff0c;它只能打开应用&#xff0c;而不能最小化应用。我希望点击图标能让窗口最小化这种效果&#xff0c;那该如何做呢&#xff1f; # 打开终端&#xff0c;输入如…

Docker-Compose配置文件docker-compose.yml详解

一份标准的docker-compose.yml文件应该包含version、services、networks三大部分&#xff0c;其中最关键的就是services和networks两个部分。 Compose和Docker兼容性&#xff1a; Compose 文件格式有3个版本,分别为1, 2.x 和 3.x 目前主流的为 3.x 其支持 docker 1.13.0 及其以…