GPT-4o API 全新版本发布:提升性能,增加性价比

5月13日,OpenAI 发布了全新ChatGPT模型 GPT-4o,它在响应速度和多媒体理解上都有显著提升。在这篇文章中,我们将介绍 GPT-4o 的主要特点及其 API 集成方式。

什么是 GPT-4o?

GPT-4o 是 OpenAI 于5月13日发布的最新多模态 AI 模型,其中“4o”的“o”代表“omni”,意为“全能的”。与先前的 ChatGPT 不同,GPT-4o 能够处理文本、音频、图像和视频的数据交互。

GPT-4o 图片

访问官网了解更多:https://openai.com/index/hello-gpt-4o/

GPT-4o 关键功能

更快速的响应时间

OpenAI表示,GPT-4o 相较于前代模型在响应速度上有显著提升。以前的 GPT 模型在与人类对话时需要完成语音识别、文本生成和语音合成三个步骤,总延迟时间在 2.8~5.4 秒之间。而 GPT-4o 缩短了响应时间到 3.20 秒,几近实时交互。

更好的声音情感识别

以前的模型常常忽略说话者的语气和背景噪音。GPT-4o 改进了这点,它可以识别和理解音频中的情感标记,使得对话更加自然。

情感识别功能

令牌使用量减少

GPT-4o 对多种语言(包括日语)的令牌使用进行了优化。例如,一段日语对话所需的令牌数从37 减少到24。因此,语言处理变得更加高效。

令牌使用示例

免费使用基础功能

GPT-4o 发布后,原本付费的服务(如 GPT、GPT Store 和 GPT-4)均可免费使用。

提供桌面客户端

除了线上访问,现在 macOS 用户还可以通过桌面应用访问 ChatGPT,Windows 版本也将在今年下半年推出。

集成 GPT-4o API

将 GPT-4o 的功能集成到您的应用中,可以通过 API 接口非常方便地实现。那么如何使用 GPT-4o API 呢?

GPT-4o API 使用方法

根据 OpenAI 提供的信息,GPT-4o API 可以通过 Chat Completions API、Assistants API 和 Batch API 使用,支持文本和视觉数据的多模态输入。

GPT-4o API 特性

与旧版 API 相比,GPT-4o API 在以下几个方面有了改进:

  • 更智能:在文本分析、推理和编程上有显著提升。
  • 响应更快:响应速度是 GPT-4 Turbo 的两倍。
  • 价格更低:输入和输出的费用比 GPT-4 Turbo 减少了一半。
  • 速率限制提升:与 GPT-4 Turbo 相比,速率限制提高了五倍。
  • 增强的视觉处理能力:优化了视觉处理。
  • 更好的非英语语言处理:在处理非英语语言文本时更为高效。

GPT-4o API 定价

根据 OpenAI API 定价页面的信息,GPT-4o 文本输入和输出的成本为:

  • 输入:5美元 / 百万 Tokens
  • 输出:15美元 / 百万 Tokens

视觉处理的费用根据图像宽度和高度计算。

定价示例

使用 JPEG-4o API 时的注意事项

使用或从旧版本切换到 GPT-4o API 时,请注意以下几点:

  1. GPT-4o API 支持通过感知能力理解不含音频的视频,需要将视频转换成帧输入模型。
  2. 截至 2024年5月14日,GPT-4o 不支持音频模式。
  3. GPT-4o 不支持图像生成功能,建议继续使用 DALL-E 3 API。
  4. OpenAI 建议目前使用 GPT-4 或 GPT-4 Turbo 的用户尝试 GPT-4o,评估其表现是否更优。

管理您的 API

GPT-4o API 的调试和管理至关重要。下面是 APIHub 中的 OpenAI 的接口文档。

Apifox

获取和使用 OpenAI API 密钥

要开始使用 GPT-4o API,你需要获取 OpenAI API 密钥。步骤如下:

1. 创建 OpenAI 账户

首先访问 OpenAI 官网并创建一个新账户。

OpenAI 账户

2. 获取 API 密钥

登录账户后,访问 API 密钥页面并点击“Create new secret key”生成新的密钥。

生成 API 密钥

记录并安全存储你的 API 密钥,因为生成后无法再次查看。

测试和管理 GPT-4o API

Apifox 是测试和管理 GPT-4o API 的理想工具。它提供了一个 OpenAI API 项目,涵盖所有 OpenAI 提供的 API。

OpanAI 项目

选择左侧菜单中的每一项,开始使用 GPT-4o API。

API 管理

实战:将 GPT-4o API 与 Apifox 结合使用

访问 Apifox 上的 OpenAI API 项目,选择 Chat Completions API。根据 ChatGPT 规范,输入 HTTP 方法和端点 URL。

在“Body”选项卡中以 JSON 格式输入 ChatGPT 消息,将 "model":"gpt-4o" 包含在内。

输入开发

在“Headers”选项卡中添加授权参数,输入你的 ChatGPT API 密钥,然后点击“发送”按钮。

Headers设定

你可以在 Apifox 中将 OpenAI 的 API 密钥设置为环境变量,以简化后续操作。

环境变量

总结

本文介绍了 OpenAI 新推出的 GPT-4o 模型及其 API 集成方式:

  • 速度更快
  • 支持更多类型的输入
  • 令牌使用量减少
  • 更高性价比的 API 费用
  • 改进的视觉和非英语文本处理能力

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/13126.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【简单介绍下在Ubuntu中如何设置中文输入法】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

国产化数据库_金仓_Linux版Docker版部署过程及简单使用

国产化数据库金仓Linux版部署过程 文档参考:https://help.kingbase.com.cn/v8/install-updata/install-linux/install-linux-3.html#id12 以下安装是在Centos7系统下进行 0.安装包准备 找到你的操作系统对应的平台所支持的软件包下载,我这里下载的是x…

react的多级路由定义

在写实验室项目的时候,有一个需求,在二级路由页面点击按钮,跳转到详情列表页面,同时三级路由不用在导航栏显示,效果图如下: 前期的尝试: 在route,js文件这样定义的: {path: music,…

mysql权限体系

提示:根据课程视频总结知识点------2024.05.15 文章目录 权限处理逻辑1、 能不能连接2、能不能执行操作 权限授予与回收1、创建用户2、授予权限3、查看权限4、回收权限5、 权限级别 账户安全管理1、用户权限设定原则2、历史文件泄密 用户权限设定原则1. 只读用户--数…

哈希表+DFS快速解决力扣129题:求根节点到叶节点数字之和

❤️❤️❤️ 欢迎来到我的博客。希望您能在这里找到既有价值又有趣的内容,和我一起探索、学习和成长。欢迎评论区畅所欲言、享受知识的乐趣! 推荐:数据分析螺丝钉的首页 格物致知 终身学习 期待您的关注 导航: LeetCode解锁100…

平均工资数据分析之回归

链接: R语言实战——中国职工平均工资的变化分析——相关与回归分析 1、模型诊断和评估的方法 1. 残差分析 1、残差图 (Residual Plot):用于检查残差是否存在非随机模式。理想情况下,残差应随机分布在零附近。 2、Q-Q 图 (Quantile-Quantile Plot)&am…

【liunx】yumvim

目录 Linux 软件包管理器 yum 关于 rzsz 注意事项 查看软件包 Linux开发工具 Linux编辑器-vim使用 vim的基本概念 vim的基本操作 vim正常模式命令集 vim末行模式命令集 简单vim配置 配置文件的位置 sudo提权 Linux 软件包管理器 yum 1.yum是什么&#xff1…

【前端】CSS基础(4)

文章目录 前言1、CSS常用属性1.1 文本属性1.1.1 文本对齐1.1.2 文本装饰1.1.3 文本缩进1.1.5 行高 前言 这篇博客仅仅是对CSS的基本结构进行了一些说明,关于CSS的更多讲解以及HTML、Javascript部分的讲解可以关注一下下面的专栏,会持续更新的。 链接&…

Day_5

1. Apache ECharts Apache ECharts 是一款基于 Javascript 的数据可视化图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表 官网地址:https://echarts.apache.org/zh/index.html 入门案例 快速入门&#x…

企业计算机服务器中了faust勒索病毒如何处理,faust勒索病毒解密恢复

随着网络技术的不断发展与应用,越来越多的企业利用网络走向了数字化办公模式,网络也极大地方便了企业生产运营,大大提高了企业生产效率,但对于众多企业来说,企业的数据安全一直是大家关心的主要话题,保护好…

fastjson2使用

说明:fastjson2是一个性能极致并且简单易用的Java JSON库(官方语),本文介绍在Spring Boot项目中如何使用fastjson2。 创建项目 首先,创建一个Maven项目,引入fastjson2依赖,如下: …

战网国际服注册教程 暴雪战网国际服账号注册一站式教程分享

战网国际版,也即Battle.net环球版,是由暴雪娱乐操刀的全球化游戏交流枢纽,它突破地理限制,拥抱全世界的游戏玩家。与仅限特定地区的版本不同,国际版为玩家开辟了无障碍通道,让他们得以自由探索暴雪庞大游戏…

如何使用JMeter测试导入接口/导出接口?

🍅 视频学习:文末有免费的配套视频可观看 🍅 关注公众号:互联网杂货铺,回复1 ,免费获取软件测试全套资料,资料在手,涨薪更快 今天上班,被开发问了一个问题:JM…

最小质数对-第12届蓝桥杯国赛Python真题解析

[导读]:超平老师的Scratch蓝桥杯真题解读系列在推出之后,受到了广大老师和家长的好评,非常感谢各位的认可和厚爱。作为回馈,超平老师计划推出《Python蓝桥杯真题解析100讲》,这是解读系列的第63讲。 最小质数对&#…

基于SSM的“羽毛球馆管理系统”的设计与实现(源码+数据库+文档)

基于SSM的“羽毛球馆管理系统”的设计与实现(源码数据库文档) 开发语言:Java 数据库:MySQL 技术:SSM 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 系统结构图 登录界面 后台用户添加 后台用户管理 球场添加 球场…

Linux 第三十三章

🐶博主主页:ᰔᩚ. 一怀明月ꦿ ❤️‍🔥专栏系列:线性代数,C初学者入门训练,题解C,C的使用文章,「初学」C,linux 🔥座右铭:“不要等到什么都没有了…

大模型学习笔记九:模型微调

文章目录 一、什么时候需要Fine-Tuning二、用Hugging Face根据电影评论输出来对电影进行情感分类1)安装依赖2)操作流程3)名字解释4)代码导入库和加载模型、加载数据库、加载tokenlizer5)其他相关公共变量赋值(随机种子、标签集评价、标签转token_Id)6)处理数据集:转成…

Altium Designer封装库和元器件符号库下载与导入教程(SnapEDA 、Ultra Librarian、Alldatasheetcn)

1.AD封装库和元器件符号库下载网址 以下是一些全球热门的Altium Designer封装库和元器件符号库下载网址推荐: Altium Content Vault (现称为Altium Manufacturer Part Search):这是Altium官方提供的元器件库,可以直接在Altium Designer中使用…

免费体验GPT-4o这5大功能,非常好用!

这几天,OpenAI发布了新的GPT版本,GPT-4o,比GPT4更加智能也更快。 据说,GPT-4o在文本、推理和编码智能方面实现了GPT-4 Turbo级别的性能,在多语言、文本、音频和视觉功能方面甚至超过了市面上所有同类产品。 有几个亮点…

数据结构复习指导之图的存储及基本操作

文章目录 图的存储及基本操作 考纲内容 复习提示 1.邻接矩阵法 2.邻接表法 3.十字链表 4.邻接多重表 5.图的基本操作 图的存储及基本操作 图的存储必须要完整、准确地反映顶点集和边集的信息。根据不同图的结构和算法,采用不同的存储方式将对程序的效率产生…