文章目录
- 图像多模态大模型
- 语音识别模型
- 文本 Embedding 模型
- 审查模型
- 编程大模型
OpenAI 模型列表
https://platform.openai.com/docs/models/overview
你也可以在这里查看,可以调用的模型:
https://platform.openai.com/account/rate-limits
图像多模态大模型
- 图像多模态大模型:最新版为DALL·E (达利) v2, 是DALL E模型的第二版训练版,能够根据描述生成图像;
- DALL·E 模型为基于GPT-3开发的模型,总共包含120亿个参数,不难看出 DALL·E 对图像的理解能力 源于大语言模型;
- OpenAI将大语 言模型的理解能力“复制”到视觉领域的核心方法:将图像视作一种一种语言,将其转化为Token,并和文本Token-起进行训练;
多模态大模型,都是基于语言类 进行开发