【使用ChatGPT的API之前】OpenAI API提供的可用模型

文章目录

  • 一. ChatGPT基本概念
  • 二. OpenAI API提供的可用模型
    • 1. InstructGPT
    • 2. ChatGPT
    • 3. GPT-4
  • 三. 在OpenAI Playground中使用GPT模型-ing

在使用GPT-4和ChatGPT的API集成到Python应用程序之前,我们先了解ChatGPT的基本概念,与OpenAI API提供的可用模型。

 

一. ChatGPT基本概念

提示词(prompt)不仅适用于OpenAI API,而且是所有LLM的入口点

简单地说,提示词就是用户发送给模型的输入文本,用于指导模型执行特定任务。对于GPT-4和ChatGPT背后的模型,提示词具有聊天格式,输入消息和输出消息存储在列表中。

 

标记(token)是词或词的一部分

据粗略估计,100个标记大约相当于75个英语单词。对OpenAI模型的请求是根据所使用的标记数量来定价的,也就是说,调用API的成本取决于输入文本和输出文本的长度。

在这里插入图片描述

 

二. OpenAI API提供的可用模型

OpenAI提供了多个专为不同任务设计的模型,每个模型都有自己的功能和定价。

通过OpenAI API,你可以使用OpenAI开发的多个模型。这些模型可通过API作为服务使用,这意味着OpenAI在远程服务器上运行模型,开发人员只需向其发送查询请求即可。

需要注意的是,这些模型是专有的,你不能根据自己的需求直接修改模型的代码。但是正如后文所述,你可以通过OpenAI API在特定数据上微调其中的一些模型。

 

1. InstructGPT

这个模型系列可以处理许多单轮文本补全任务。

  • text-ada-001模型只能处理简单的文本补全任务,但它也是GPT-3系列中速度最快、价格最便宜的模型。
  • text-babbage-001模型和text-curie-001模型稍微强大一些,但也更昂贵。
  • text-davinci-003模型可以出色地执行所有文本补全任务,但它也是GPT-3系列中最昂贵的。

 

2. ChatGPT

ChatGPT背后的模型是gpt-3.5-turbo,其聊天格式旨在进行多轮对话。

当然它也可用于没有对话的单轮任务。

  • 在单轮任务中,gpt-3.5-turbo的性能与text-davinci-003相当。由于gpt-3.5-turbo的价格只有text-davinci-003的十分之一,而且两者性能相当,因此建议默认使用它来进行单轮任务。
  • gpt-3.5-turbo模型的上下文窗口大小约为4000个标记,这意味着它可以接收约4000个标记作为输入。

OpenAI还提供了另一个模型,名为gpt-3.5-turbo-16k。它具有与标准的gpt-3.5-turbo模型相同的功能,但上下文窗口大小是后者的4倍。

 

3. GPT-4

这是迄今为止OpenAI发布的最大的模型。由于在广泛的文本和图像多模态语料库上进行了训练,因此它精通许多领域。GPT-4能够准确地遵循复杂的自然语言指令并解决难题。它可用于聊天任务和单轮任务,并具有相当高的准确性。

OpenAI提供了两个GPT-4模型:

  • gpt-4的上下文窗口大小为8192个标记,
  • gpt-4-32k的上下文窗口大小为32768个标记。32768个标记大约相当于24576个英语单词,即大约40页的上下文。

开发人员通常希望LLM版本具有良好的稳定性和可见性,希望针对相同的输入给出相同的回答。为此,OpenAI提供了这些模型的静态快照版本。在我们撰写本书之时,上述模型最新的静态快照版本分别是gpt-3.5-turbo-0613、gpt-3.5-turbo-16k-0613、gpt-4-0613和gpt-4-32k-0613。

OpenAI已宣布在2024年提供GPT-3.5 Turbo和GPT-4的微调功能。

 

三. 在OpenAI Playground中使用GPT模型-ing

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/8789.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

情感分类学习笔记(1)

文本情感分类(二):深度学习模型 - 科学空间|Scientific Spaces 一、代码理解 cw lambda x: list(jieba.cut(x)) #定义分词函数 您给出的代码定义了一个使用 jieba 分词库的分词函数。jieba 是一个用于中文分词的 Python 库。该函数 cw 是…

03_led_horse_run_v0 跑马灯

03_led_horse_run_v0 在Verilog中实现跑马灯通常涉及到使用一个计数器来控制LED灯的亮灭顺序。 跑马灯是一种常见的电子显示方式,它通过控制多个LED灯的顺序点亮,形成一种动态的视觉效果,看起来就像灯在“跑”一样。 知识点: 移…

FTTR介绍

概念 FTTR(Fiber to The Room)是一种新型的光纤接入技术,它将光纤信号传输到室内的一个通信网络方案。在FTTR网络中,光纤到达建筑物内的分配盒后,通过铜缆或其他传输介质进入室内各个房间,为用户提供网络服…

Java面试八股文(SpringCloud篇)

****************************************************

前端双语实现方案(VUE版)

一、封装一个lib包 结构如下 en.js use strict;exports.__esModule true; exports.default {sp: {input: {amountError: Incorrect amount format},table: {total: Total:,selected: Selected:,tableNoData: No data,tableNoDataSubtext: Tip: Suggest to recheck your fil…

springboot利用Redis的Geo数据类型,获取附近店铺的坐标位置和距离列表

文章目录 GEO介绍GEO命令行应用添加地理坐标位置获取指定单位半径的全部地理位置列表springboot 的实际应用 GEO介绍 在Redis 3.2版本中,新增了一种数据类型:GEO,它主要用于存储地理位置信息,并对存储的信息进行操作。 GEO实际上…

整理好了!2024年最常见 100 道 Java基础面试题(三十七)

上一篇地址:整理好了!2024年最常见 100 道 Java基础面试题(三十六)-CSDN博客 七十三、抽象类是否可以继承具体类? 在Java中,抽象类(abstract class)可以继承自具体类(c…

Unity延时触发的几种常规方法

目录 1、使用协程Coroutine2、使用Invoke、InvokeRepeating函数3、使用Time.time4、使用Time.deltaTime5、使用DOTween。6、使用Vision Timer。 1、使用协程Coroutine public class Test : MonoBehaviour {// Start is called before the first frame updatevoid Start(){ …

使用css的box-reflect属性制作倒影效果

box-reflect 是一个在 CSS 中创建元素倒影效果的非标准属性。尽管它在过去的一些 WebKit 浏览器中(如旧版的 Safari 和 Chrome)得到了支持,但由于它并未成为 CSS 标准的一部分,因此在现代浏览器中的兼容性较差。以下是对 box-refl…

瑞麦德机电设备有限公司将莅临2024第13届生物发酵展

参展企业介绍 河南瑞麦德机电设备有限公司是专业从事机械输送气力输送、称重配料、筛分、磁选设备研发和制造于一体的企业,公司采用国内外同行业产品的先进技术,经专业团队设计、研发、生产,产品满足“ISO9001”,“GMP”等标准要求…

Java开发原则

Java开发原则 一. 设计规范1.1 Vo设计原则1.1.1 Long类型需要转为String类型 1.2 Mapper接口命名1.2.1 新增1.2.2 删除1.2.3 更新1.2.4 查询 一. 设计规范 1.1 Vo设计原则 1.1.1 Long类型需要转为String类型 由于Long类型转递到前端会出现数据溢出 1.2 Mapper接口命名 1.2…

React 学习-3

Props state可变&#xff0c;props不可变&#xff0c;故子组件使用props较多 ar title "菜鸟教程"; // var title 123; var MyTitle React.createClass({propTypes: {title: React.PropTypes.string.isRequired,},render: function() {return <h1> {this.…

线程的ThreadLocal

ThreadLocal是Java语言中的一个线程内部存储类&#xff0c;可以用来在多线程环境下保证每个线程都拥有自己独立的变量副本&#xff0c;避免了多线程间的数据共享问题。 ThreadLocal的使用方式非常简单&#xff0c;只需要创建一个ThreadLocal对象&#xff0c;然后使用它的get()…

【BST】Behavior Sequence Transformer for E-commerceRecommendation in Alibaba

一、提出背景 传统的Embedding&MLP模型结构将原始特征嵌入到低维向量中&#xff0c;然后将其concat后输入MLP进行最终推荐。DIN提出使用注意力机制来捕获候选项与用户先前点击的项之间的相似性。 然而&#xff0c;大多数这些工作只是连接不同的特征&#xff0c;而没有捕获用…

云动态摘要 2024-05-08

给您带来云厂商的最新动态&#xff0c;最新产品资讯和最新优惠更新。 最新优惠与活动 [免费试用]即刻畅享自研SaaS产品 腾讯云 2024-04-25 涵盖办公协同、营销拓客、上云安全保障、数据分析处理等多场景 云服务器ECS试用产品续用 阿里云 2024-04-14 云服务器ECS试用产品续用…

通过自适应提示提升大语言模型的零样本推理能力

随着大模型&#xff08;LLMs&#xff09;的快速发展&#xff0c;它们在自然语言处理&#xff08;NLP&#xff09;任务上取得了前所未有的成就。特别是&#xff0c;LLMs展现出了强大的推理和规划能力&#xff0c;这得益于它们的少样本和零样本学习能力。然而&#xff0c;现有的方…

LeetCode刷题笔记第217题:存在重复元素

LeetCode刷题笔记第217题&#xff1a;存在重复元素 题目&#xff1a; 给你一个整数数组nums。如果任一值在数组中出现至少两次&#xff0c;返回 true&#xff1b;如果数组中每个元素互不相同&#xff0c;返回 false。 想法&#xff1a; 要判断数组中是否存在重复的元素&…

从零开始精通RTSP之传输ADPCM等音频流

概述 在上一篇文章中&#xff0c;我们详细介绍了使用RTP传输AAC音频流的打包方法。除了AAC编码算法外&#xff0c;常用的音频编码算法还有ADPCM、G711A、G711U、G726等。接下来&#xff0c;我们继续介绍RTP传输ADPCM等音频流的打包方法。 封装方法 RTP封装ADPCM等音频数据时&am…

探究 Java 字符串的不可变性与内部机制

探究 Java 字符串的不可变性与内部机制 为什么String是不可变的 其实String不可变的原因是因为内部char[]被final修饰了&#xff0c; 其实String里的内部hash value也是一个私有的final整形存放hashcode&#xff0c;这么做的原因主要为了提高后续hash操作的性能。 不提供修…

spring模块(六)spring监听器(2)@EventListener

一、介绍 监听器的简化写法 二、原理 三、使用 Slf4j Component public class MyTask {EventListenerpublic void onApplicationEvent(ApplicationEvent event) {if (event instanceof ContextRefreshedEvent) {log.info("监听到 ContextRefreshedEvent...");}if…