AI模型简介

深度学习模型种类繁多，可以根据任务类型和应用场景进行分类。以下是主要模型类型的详细介绍，每种模型包含了其特点、功能、代表性模型，以及常见应用。

分类模型是深度学习中最基本也是最广泛应用的模型类型，其目标是将输入数据分类到预定义的类别中。

多层感知机（MLP）
- 适合处理简单分类问题，例如低维特征数据分类、手写数字识别。
- 示例：LeNet-300-100。
卷积神经网络（CNN）
- 主要用于图像分类任务，通过卷积层提取空间特征。
- 示例：
  - AlexNet：首次使用深度学习实现 ImageNet 分类冠军。
  - VGG：通过深层网络实现特征提取。
  - ResNet：引入残差连接，解决梯度消失问题。
  - EfficientNet：优化网络结构与参数分布，性能优异。
循环神经网络（RNN）
- 处理序列数据的经典网络，可用于文本分类。
- 示例：LSTM（长短期记忆网络）、GRU。
Transformer
- 近年来流行的分类模型，适合处理序列和图像任务。
- 示例：
  - BERT：文本分类与自然语言理解任务。
  - Vision Transformer (ViT)：用于图像分类，基于 Transformer 架构。

回归模型用于预测连续值的输出，是分类任务的延伸。

线性回归
- 最简单的回归模型，用于描述线性关系。
- 示例：普通最小二乘线性回归。
深度回归模型
- 使用神经网络对非线性关系建模。
- 示例：
  - 用 CNN 或 RNN 预测复杂的时间序列（如股票价格）。
  - 用 Transformer 模型进行多变量时序预测。
自动编码器（AutoEncoder）
- 可以作为回归模型，用于生成条件数据。
- 示例：VAE（变分自编码器）。

目标检测模型的任务是识别图像中所有目标的位置和类别，输出边界框和分类信息。

单阶段检测器
- 直接从图像中检测目标，速度快。
- 示例：
  - YOLO（You Only Look Once）：实时目标检测算法。
  - SSD（Single Shot MultiBox Detector）：支持多尺度检测。
两阶段检测器
- 先生成候选框，再进行分类，精度较高。
- 示例：
  - Faster R-CNN：两阶段检测的经典算法。
  - Mask R-CNN：同时支持实例分割。
基于 Transformer 的检测模型
- 结合 Transformer 的特性，性能优异。
- 示例：DETR（Detection Transformer）。

分割模型在图像中对每个像素进行分类，可实现精细化的目标识别。

语义分割模型
- 对整张图像的每个像素进行分类。
- 示例：
  - U-Net：专为医学影像分割设计。
  - DeepLab：支持多尺度语义分割。
实例分割模型
- 分割每个目标并区分不同实例。
- 示例：
  - Mask R-CNN：将目标检测扩展到实例分割。
  - PointRend：用于高精度实例分割。
全景分割模型
- 同时完成语义分割和实例分割。
- 示例：Panoptic FPN。

序列生成模型用于生成连续的数据序列，通常基于输入的上下文进行生成。

语言生成模型
- 示例：
  - GPT（Generative Pre-trained Transformer）：OpenAI 开发的文本生成模型。
  - BERT：用于补全句子或生成摘要。
图像生成模型
- 示例：
  - GAN（生成对抗网络）：用于图像生成。
  - VQ-VAE（向量量化自动编码器）：基于自监督学习的生成模型。
序列到序列模型（Seq2Seq）
- 用于翻译、摘要生成等任务。
- 示例：LSTM-based Seq2Seq、Transformer。

强化学习通过与环境交互来优化策略，最终实现某种目标。

经典强化学习算法
- 示例：Q-learning、SARSA。
深度强化学习模型
- 示例：
  - DQN（深度 Q 网络）。
  - PPO（Proximal Policy Optimization）。
多智能体强化学习
- 适用于多主体交互场景。
- 示例：MADDPG（多智能体深度确定性策略梯度）。