Open AI API可以应用到任何的业务场景。
文本生成 创造助理 嵌入数据 语音转化 图片生成 图片输入
1. 核心概念
1.1 Text generation models
OpenAI 的文本生成模型(通常被称为generative pre-trained transformers 模型简称:GPT),有GPT-4和GPT-3.5,已经被训练成为理解自然语言的大模型。GPT-4模型可以将它的输出再一次作为它的输入。这些输入也被称为“提示词”。设计提示词本质上是如何“开发”一个模型(像GPT-4),通常是提供相应任务的指令或示例,成功完成指定任务。GPT-4 可以完成各种各样的任务,包括输出内容、生成代码、摘要、对话、写作等等。
1.2 Assistants
助手也指实体。例如利用OpenAI API开发出来的大语言模型GPT-4(实体),拥有能为用户完成各种任务的能力。这些助手是通过一些用户输入的指令(提示词),灌入到模型中,然后得到输出结果。助手内部通常有一些可调用的工具,从而能够完成更复杂的任务。如执行代码或加载文件内容。
1.3 Embeddings
嵌入是对一块数据(如文本)进行向量化表示,以便更好地保留其内容和/或含义的各个方面。在某些情况下相似的数据块通常比不相关的数据更能紧密的嵌入其中。OpenAI提供文本嵌入模型,将文本字符串作为输入,并输出嵌入式向量。嵌入式的作用很大,在搜索、聚类、推荐、异常检测、分类等方面都有很好表现。
1.4 Tokens
生成文本和处理嵌入式模型的文本块叫做令牌。令牌以常见的字符串进行表示。例如:字符串’tokenization’分解成’token’和’ization‘,而比较短且常见的词如 ‘the’ 则被分解成1个令牌。请注意:典型的一个句子都用空格来开头。一般而言,一个令牌大约占4个字符或0.75个英文单词。
注意:1个文本生成模型的提示词和其相应的输出,两块合在一起不能超过模型规定的最大长度。对于嵌入式模型也是如此