GPT-4o:免费且更快的模型

OpenAI GPT-4o 公告

OpenAI 推出了增强版 GPT-4 模型——OpenAI GPT-4o,用于支持 ChatGPT。首席技术官 Mira Murati 表示,更新后的模型速度更快,并在文本、视觉和音频处理方面有了显著提升。GPT-4o 将免费向所有用户开放,付费用户的使用容量可达免费用户的五倍。

首席执行官 Sam Altman 强调,该模型具备“原生多模态”能力,能够生成内容或理解语音、文本和图像中的指令。开发者将可以访问该 API,费用是 GPT-4 Turbo 的一半,速度则是其两倍。

ChatGPT 的语音模式即将新增功能,使其能够作为实时语音助手并观察周围环境。Altman 回顾了 OpenAI 的发展历程,指出公司现在主要通过付费 API 向开发者提供先进的 AI 模型。

在发布之前,有关 OpenAI 的公告存在不同的猜测,包括 AI 搜索引擎、集成到 GPT-4 中的语音助手或新模型 GPT-5。OpenAI 选择在 Google I/O 之前发布,我们预计 Gemini 团队将在 I/O 上发布各种 AI 产品。

解析名称:GPT-4o

  • GPT: GPT 代表生成式预训练 Transformer,一种用于语言处理任务的神经网络架构。OpenAI GPT-4o 建立在其前身 GPT-3 和 GPT-4 的基础上。
  • “o” 代表 Omni: 字母“o”表示 GPT-4o 的关键特性——全模式能力。与之前的模型不同,GPT-4o 可以处理并响应各种格式的信息:文本、语音甚至视频。这样可以更全面地理解用户输入,从而提供更相关的响应。

可实时推理音频、视觉和文本的 AI 模型(功能)

无论你如何提出问题和请求,人工智能都能理解。无论是说话、打字还是展示图片,OpenAI 的最新成果 GPT-4o 都会迅速且智能地回应。以下是 GPT-4o 成为人工智能革命性飞跃的原因:

像天才一样思考,像闪电一样行动:

  • 更聪明: GPT-4o 在基于文本的任务中拥有与 GPT-4 Turbo 相当的推理和编码能力。此外,它在理解和响应音频、视频以及非英语语言方面表现优异。
  • **极快的速度:**瞬间获得答案!GPT-4o 的响应速度是 GPT-4 Turbo 的两倍,适合实时应用。

更实惠,更强大:

  • 价格减半,乐趣加倍: OpenAI GPT-4o 比其前身便宜得多,输入和输出令牌的价格都只有一半,使得这项先进技术更易获得。
  • 更高效: GPT-4o 的速率限制是其前代的五倍,允许用户更广泛地探索其功能并处理更大的数据集。

清晰的视觉,流利的表达:

  • 更清晰的视觉: GPT-4o 改进的视觉处理能力使其能够更准确地解释和响应图像。
  • **打破语言障碍:**跨境沟通变得更简单。GPT-4o 能有效处理非英语语言,并通过新的文本分解系统,使沟通更流畅。

始终保持最新:

  • 最新知识: GPT-4o 的知识库更新至 2023 年 10 月的信息,确保提供最相关、最准确的答复。

这只是 GPT-4o 功能的一瞥。未来,你可能会看到它:

  • 使用另一个 GPT-4o 实时创作音乐!
  • 通过逼真的对话练习求职面试。
  • 在实时翻译的帮助下学习新语言。

OpenAI 在开发过程中优先考虑安全性,因此你可以放心使用 GPT-4o。

使用新的 ChatGPT 桌面应用程序 (MacOS) 增强工作流程

更快完成任务:

  • 使用键盘快捷键(Option + Space)立即询问 ChatGPT 问题,无需切换应用程序!
  • 直接在应用程序中讨论屏幕截图,非常适合集思广益或获取反馈。

与 ChatGPT 对话(即将推出):

  • 使用 ChatGPT 开始语音对话,非常适合深入讨论。(目前提供基于文本的语音模式)

现可供 Plus 用户 (MacOS) 使用:

  • 所有人很快都会获得访问权限!Windows 版本将于今年晚些时候推出。

模态

通过图像看世界(即将提供视频支持):

目前,GPT-4o API 可以通过其视觉功能理解视频内容。视频需要以每秒 2-4 帧的速度分解为静止图像(帧)。可以在整个视频中均匀采样这些帧,或使用特定算法选择关键帧。欲了解更多信息,请参阅“GPT-4o 入门指南”。

聆听您的声音(数量有限):

虽然目前还未广泛普及,但 OpenAI 计划在未来几周内向选定的可信测试人员推出音频支持。GPT-4o 将能够直接理解口语,使交互更加自然。

生成图像:

如果你的目标是创建图像,GPT-4o 尚未实现。OpenAI 的 DALL-E 3 API 仍然是生成创意视觉内容的首选。

探索 GPT-4o 的功能

现在,让我们探索 GPT-4o 的令人兴奋的可能性:

  • **和谐二重唱:**想象一下两个 GPT-4o 模型互动甚至一起唱歌!这为探索 AI 驱动的音乐创作的新形式打开了大门。
  • **完善面试技巧:**需要在即将到来的面试中脱颖而出吗?使用 GPT-4o 进行练习,模拟真实的面试环境,进行真实的对话。
  • **有人玩石头、剪刀、布吗?:**想玩吗?GPT-4o 可以成为你的游戏伙伴,快速玩一轮石头、剪刀、布。
  • **攻克数学难题:**被数学题难住了?GPT-4o 可以帮助你理解复杂的概念和解方程。
  • **解锁新语言:**学习一门新语言?GPT-4o 可以成为你的私人语言导师,提供实时翻译并协助语言习得。
  • **打破语言障碍:**跨语言无缝沟通现已成为现实。GPT-4o 可以实时翻译语言,促进全球协作和理解。

使用 OpenAI GPT-4o 是否安全?

GPT-4o 完全可以安全使用,因为 OpenAI 优先考虑人工智能的安全性和负责任的开发。以下是 GPT-4o 的安全措施:

  • 多模态安全设计: GPT-4o 从头开始在其所有功能(文本、图像和未来的音频/视频)中整合了安全措施。过滤训练数据和训练后优化模型行为等技术有助于降低潜在风险。此外,还专门为语音输出创建了新的安全系统。
  • 严格的风险评估: OpenAI 根据自己的安全框架对 GPT-4o 进行了细致的评估,重点关注网络安全、生物安全风险 (CBRN)、说服技术和模型自主性等领域。这些评估表明,GPT-4o 在任何类别中的风险不超过“中等”。该评估涉及整个开发过程中的全面自动化和人工评估过程。
  • **外部红队测试:**为了识别新模式(音频和视频)带来的潜在风险,GPT-4o 与 70 多位外部专家进行了广泛的测试。这些专家专注于社会心理学、偏见检测和错误信息等领域。从这一过程中获得的经验被用于进一步完善 GPT-4o 的安全措施,确保更安全、更值得信赖的交互体验。
  • 持续的安全改进: OpenAI 承认,特别是在音频功能方面,存在新的风险需要考虑。虽然文本和图像功能最初会发布,但音频功能将分阶段推出。最初,音频输出将仅限于一组预定的声音,并受现有安全协议的约束。OpenAI 将在即将发布的系统卡中提供有关所有模式的安全措施的更多详细信息。

OpenAI 在探索 GPT-4o 的全部潜力的同时,致力于持续降低风险。
订阅国外服务,如GPT、Midjourney、OnlyFans等,请使用WildCard

结论:释放 GPT-4o 的力量

OpenAI 的 GPT-4o 现已推出,它已准备好彻底改变您的 AI 交互体验。文本和图像功能将首先推出,无论是在 ChatGPT 的 GPT-4o 免费版还是 GPT Plus 版中。Plus 用户将享受更高的消息限制。准备好通过文本提示和图像输入体验 GPT-4o 的强大功能吧。

想要使用语音与 GPT-4o 互动?ChatGPT Plus 用户即将迎来以 GPT-4o 为特色的语音模式新 alpha 版本。

开发者可以立即加入!通过 OpenAI API 访问 GPT-4o 的文本和视觉功能,与 GPT-4 Turbo 相比,它具有速度快、价格合理和更高的速率限制等优势。虽然音频和视频功能即将推出,但初始访问权限将授予一组选定的合作伙伴。

请继续关注 OpenAI 揭示 GPT-4o 全部潜力的激动人心的更新!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/20161.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

乐高小人分类项目

数据来源 LEGO Minifigures | Kaggle 建立文件目录 BASE_DIR lego/star-wars-images/ names [YODA, LUKE SKYWALKER, R2-D2, MACE WINDU, GENERAL GRIEVOUS ] tf.random.set_seed(1)# Read information about dataset if not os.path.isdir(BASE_DIR train/):for name in …

52 https

HTTPS是什么 https也是一个应用层协议,是在http协议的基础上引入了一个加密层 http协议内容都是按照文本的方式明文传输的,这就导致在传输过程中出现一些被篡改的情况 http和https是可以同时存在的,数据时从应用层自上往下发的&#xff0c…

数仓建模—ChatETL

数仓建模—ChatETL 前面我们介绍过ChatBI ,就是让用户通过自然语言对话的方式可以获取到自己想要的数据,然后通过合适的报表展示出来,其实我们可以将其理解为应用层面的技术创新,但是这个实现的前提就是我们底层已经有加工好的大量的数据模型数据表,并且有完善的元数据建…

【Python】解决Python报错:AttributeError: ‘str‘ object has no attribute ‘xxx‘

🧑 博主简介:阿里巴巴嵌入式技术专家,深耕嵌入式人工智能领域,具备多年的嵌入式硬件产品研发管理经验。 📒 博客介绍:分享嵌入式开发领域的相关知识、经验、思考和感悟,欢迎关注。提供嵌入式方向…

每日刷题——相遇、宝石(模拟+数学)、相助(模拟+数组)、相依(dp的优化)

相遇 原题链接登录—专业IT笔试面试备考平台_牛客网 题目描述 运行代码 #include<iostream> using namespace std; int main(){ int a,b; cin>>a>>b; if(ab) { cout<<"p"; } else if(a - b 1 || (a 1 && b 3)){cout <<…

系统架构设计师【第10章】: 软件架构的演化和维护 (核心总结)

文章目录 10.1 软件架构演化和定义的关系10.1.1 演化的重要性10.1.2 演化和定义的关系 10.2 面向对象软件架构演化过程10.2.1 对象演化10.2.2 消息演化10.2.3 复合片段演化10.2.4 约束演化 10.3 软件架构演化方式的分类10.3.1 软件架构演化时期10.3.2 软件架构静态演…

eNSP学习——连接RIP与OSPF网络

目录 相关主要命令 原理概述 实验目的 实验内容 实验拓扑 实验编址 实验步骤 1、基本配置 2、搭建RIP和OSPF网络 3、配置双向路由引入 4、手工配置引入时的开销值 相关主要命令 [R1-ospf-1]import-route rip 1 //引入RIP路由 [R1-rip-1]import-route ospf 1 …

【计算机毕业设计】353微信小程序零食批发交易管理系统

&#x1f64a;作者简介&#xff1a;拥有多年开发工作经验&#xff0c;分享技术代码帮助学生学习&#xff0c;独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。&#x1f339;赠送计算机毕业设计600个选题excel文件&#xff0c;帮助大学选题。赠送开题报告模板&#xff…

微信小程序毕业设计-校园服务平台系统项目开发实战(附源码+论文)

大家好&#xff01;我是程序猿老A&#xff0c;感谢您阅读本文&#xff0c;欢迎一键三连哦。 &#x1f49e;当前专栏&#xff1a;微信小程序毕业设计 精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; &#x1f380; Python毕业设计…

RabbitMQ二、RabbitMQ的六种模式

一、RabbitMQ的六种模式 RabbitMQ共有六种工作模式&#xff1a; 简单模式&#xff08;Simple&#xff09;工作队列模式&#xff08;Work Queue&#xff09;发布订阅模式&#xff08;Publish/Subscribe&#xff09;路由模式&#xff08;Routing&#xff09;通配符模式&#xff…

代码随想录算法训练营第四十六天 | 完全背包理论基础、518. 零钱兑换 II、377. 组合总和 Ⅳ

完全背包理论基础 视频讲解&#xff1a; https://www.bilibili.com/video/BV1uK411o7c9 https://programmercarl.com/%E8%83%8C%E5%8C%85%E9%97%AE%E9%A2%98%E7%90%86%E8%AE%BA%E5%9F%BA%E7%A1%80%E5%AE%8C%E5%85%A8%E8%83%8C%E5%8C%85.html 完全和01背包的区别&#xff1a; …

通俗易懂->哈希表详解

目录 一、什么是哈希表&#xff1f; 1.1哈希表长什么样&#xff1f; 1.2为什么会有哈希表&#xff1f; 1.3哈希表的特点 1.3.1 取余法、线性探测 1.3.2 映射 1.3.3负载因子 1.4哈希桶 1.5闲散列与开散列 1.6总结 二、设计hash表 1、哈希表的设计 1&#xff09;插入…

Nginx实战:日志打印自定义请求头

nginx的日志可以打印很多内容&#xff0c;但是有时候自定义的请求头该怎么打印呢&#xff1f;像下面这种场景&#xff1a; 其实很简单&#xff0c;设置日志打印格式log_format的时候&#xff0c;自定义的请求头用 【$http_自定义请求头名】 的格式就可以打印出来 例如你的自定义…

如何掌握Spring事件发布和监听机制?

在软件设计和开发过程中&#xff0c;事件驱动是一种非常主流的架构模式&#xff0c;它的基本组成见下图&#xff0c;可以看到存在一个事件中心&#xff0c;而各个服务可以执行事件发布、订阅和消费等基本过程。 事件驱动架构代表的是一种架构设计风格&#xff0c;实现方法和工具…

[图解]企业应用架构模式2024新译本讲解05-表模块2

1 00:00:00,970 --> 00:00:03,440 接下来&#xff0c;我们就来看案例了 2 00:00:03,690 --> 00:00:09,260 案例跟上一次事务脚本案例是一样的 3 00:00:11,210 --> 00:00:13,130 也是收入确认这个案例 4 00:00:14,460 --> 00:00:15,580 这是表结构 5 00:00:15,7…

【Android】手动下载gradle插件包,解决gradle插件包下载不全问题。

问题描述 拉取别人的项目时&#xff0c;因为网络问题gradle插件包一直下载不全&#xff0c;一直build。 解决方案&#xff1a; 打开gradle>wrapper文件下gradle-wrapper.properties&#xff0c;查看需要下载gradle-7.2-bin.zip。 distributionBaseGRADLE_USER_HOME distr…

cmd窗口输出内容乱码问题

出现这样的问题是因为编码格式和解码格式不一样导致的&#xff0c;cmd窗口的默认解码格式为GBK&#xff0c;如想修改cmd默认编码格式可以按照下面步骤操作&#xff1a;打开cmd窗口输入&#xff1a;chcp 65001 65001指的是utf-8编码如果不清楚编码对应的 页面编码是是多少&#…

访问github加速方法续集dev-sidecar

访问github加速方法续集dev-sidecar dev-sidecar 重要提醒 ------------------------------重要提醒1--------------------------------- 注意&#xff1a;由于electron无法监听windows的关机事件&#xff0c;开着ds情况下直接重启电脑&#xff0c;会导致无法上网&#xff0c…

【网络层】IP地址基础 与 子网掩码

文章目录 IP地址基础IP地址概念IP地址分类公网地址和私网地址 子网掩码子网掩码作用默认子网掩码网络地址、主机地址、广播地址 IP地址基础 IP地址概念 IP地址&#xff1a;IP Address 在网络中&#xff0c;通信节点都需要有一个IP地址 IP地址以点分十进制表示&#xff0c;有…

建设人工智能平台,主流GPU卡选型分析

国内外主流GPU卡性能分析&#xff01;2024&#xff01; 大模型兴起助推算力需求激增 2024年&#xff0c;深度学习与人工智能技术飞速跃进&#xff0c;Transformer、GPT-3等大模型在自然语言处理、图像识别、语音合成等领域大放异彩&#xff0c;开启AI新纪元。其庞大的参数与数…