价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

OpenAI 今日推出了一款名为 GPT-4o Mini 的新模型,这款模型较轻便且成本更低,旨在为开发者提供一个经济实惠的选择。与完整版模型相比,GPT-4o mini 在成本效益方面表现卓越,价格仅为每百万输入 tokens 15 美分和每百万输出 tokens 60 美分,比之前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜超过 60%。这种经济实惠的定价使得更多的应用程序能够负担得起 AI 技术,预计将大大扩展 AI 应用的范围。

使用 OpenAI 的模型构建应用程序可能会产生巨额费用,许多开发者因此望而却步,转而选择谷歌的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku 等更便宜的模型。为此,OpenAI 进入了轻量级模型市场。OpenAI 的 API 平台产品负责人 Olivier Godement 在接受媒体采访时表示:“我认为 GPT-4o Mini 真正体现了 OpenAI 使 AI 更广泛可及的使命。如果我们希望 AI 能惠及世界的每一个角落、每一个行业、每一个应用,我们就必须让 AI 更加实惠。”

从今天开始,ChatGPT 免费版、Plus 版和团队计划的用户可以使用 GPT-4o Mini 代替 GPT-3.5 Turbo,企业用户将在下周获得访问权限。这意味着 ChatGPT 用户将不再能使用 GPT-3.5,但开发者仍可以通过 API 使用它,如果他们不想切换到 GPT-4o Mini。Godement 表示,GPT-3.5 将在某个时间点从 API 中退役,具体时间尚未确定。

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

具有卓越文本智能和多模态推理的小型模型

新模型不仅支持文本,还支持 API 中的视觉功能,未来还将处理视频和音频等多模态输入和输出。凭借这些能力,GPT-4o Mini 可以用于理解旅行行程并提供建议等更复杂的虚拟助手功能。然而,该模型主要用于简单任务,因此没有人会真正用它来廉价地构建类似 Siri 的助手。

GPT-4o mini 在学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,无论在文本智能还是多模态推理方面都表现出色,并支持与 GPT-4o 相同的语言范围。它在函数调用方面表现优异,能让开发者构建从外部系统获取数据或采取行动的应用程序,并且相比 GPT-3.5 Turbo,长上下文性能有所提升。

在测量大规模多任务语言理解(MMLU)测试中,GPT-4o Mini 取得了 82% 的得分。这项基准考试包括 57 个学科的约 16000 道选择题。相比之下,GPT-3.5 的得分为 70%,GPT-4o 为 88.7%,而谷歌声称其 Gemini Ultra 创下了 90% 的最高得分。竞争模型 Claude 3 Haiku 和 Gemini 1.5 Flash 分别得分 75.2% 和 78.9%。然而,研究人员对这些基准测试持谨慎态度,因为各家公司进行测试的方式略有不同,分数难以直接比较。此外,AI 可能会在其数据集中包含这些答案,从而让它“作弊”。

对于渴望以低成本构建 AI 应用的开发者来说,GPT-4o Mini 的推出为他们提供了另一种工具。OpenAI 让金融科技初创公司 Ramp 测试了该模型,使用它构建了一个提取收据费用数据的工具,用户可以上传收据的照片,模型会自动整理信息。电子邮件客户端 Superhuman 也测试了 GPT-4o Mini,并用它创建了电子邮件回复的自动建议功能。

这款新模型的目标是为开发者提供一种轻量级且廉价的工具,帮助他们创建无法负担更大、更昂贵模型的应用和工具。许多开发者会选择 Claude 3 Haiku 或 Gemini 1.5 Flash,而不是支付运行最强大模型之一所需的高昂计算成本。

至于为什么 OpenAI 花了这么久的时间才推出这个模型,Godement 表示,这是“纯粹的优先级问题”,因为公司专注于创建更大更好的模型,如 GPT-4,这需要大量的人力和计算资源。随着时间的推移,OpenAI 发现开发者渴望使用更小的模型,因此公司决定现在是投资资源构建 GPT-4o Mini 的时机。

内置安全措施

GPT-4o mini 继承了 GPT-4o 的安全措施,确保在开发过程中的每一步都强化安全性。从预训练阶段开始,OpenAI 就过滤掉仇恨言论、成人内容和垃圾信息等不希望模型学习或输出的内容。在后训练阶段,通过人类反馈强化学习(RLHF)等技术,使模型的行为与政策保持一致,提高模型响应的准确性和可靠性。

GPT-4o mini 具有与 GPT-4o 相同的安全缓解措施,这些措施通过自动和人工评估进行了仔细评估。来自社会心理学和虚假信息等领域的 70 多位外部专家测试了 GPT-4o,以识别潜在风险,OpenAI 已经解决了这些问题,并计划在即将发布的 GPT-4o 系统卡和准备得分卡中分享详细信息。这些专家评估的见解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。

此外,GPT-4o mini 还首次在 API 中应用了指令层级方法,增强了模型抵御越狱、提示注入和系统提示提取的能力,确保模型响应的可靠性和安全性。

可用性和未来展望

GPT-4o mini 现已在 Assistants API、Chat Completions API 和 Batch API 中上线。开发者可以通过支付每百万输入 tokens 15 美分和每百万输出 tokens 60 美分的费用,使用这一新型模型。在 ChatGPT 平台上,Free、Plus 和 Team 用户今天起可以使用 GPT-4o mini,取代 GPT-3.5,企业用户也将在下周开始访问。

OpenAI 承诺在未来继续推动 AI 技术的普及和成本降低。自 2022 年推出能力较低的 text-davinci-003 模型以来,GPT-4o mini 的每个 token 成本已下降了 99%。OpenAI 设想未来模型将无缝集成到每个应用程序和网站中,推动 AI 应用更高效、更经济地发展。​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/873589.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

某4G区域终端有时驻留弱信号小区分析

这些区域其实是长时间处于连接态的电信卡4G终端更容易出现。 出现问题时都是band1 100频点下发了针对弱信号的1650频点的连接态A4测量事件配置(其阈值为-106)。而这个条件很容易满足,一旦下发就会切到band3 1650频点。 而1650频点虽然下发ban…

区块链技术和系统;ZKRollup ;区块链交易打包和审查

目录 区块链技术和系统 ZKRollup 的基本概念和运作原理 基本概念 运作原理 交易打包和审查 一、交易打包 二、交易审查 区块链技术和系统 区块链技术作为一种去中心化、不可篡改且高度安全的分布式账本技术,近年来在金融科技、供应链管理、物联网、版权保护、投票系统…

神经网络之卷积神经网络

目录 一、卷积神经网络概述:1.卷积层:1.1卷积核与神经元:1.2卷积层作用:1.3多通道概念: 2.池化层:2.1池化层作用: 3.隐藏层与卷积层、池化层关系: 一、卷积神经网络概述:…

vue3 页面引入组件

子组件内容 注意这里的 name: "Rabbitmq"&#xff0c;要与下面引用的时候一致 <template><div><!-- 你的组件内容 --><div slot"footer" class"dialog-footer"><el-button type"primary" click"sub…

Flutter TextFiled频繁采集“剪切板信息”

在使用Flutter开发者&#xff0c;输入框是必不可少的功能&#xff0c;最近产品出了需要&#xff0c;要求输入框记住用户登录过的手机号&#xff0c;并在输入框输入时提示出来&#xff0c;这是个很基础的功能&#xff0c;但是在通过测试验收发布到应用市场时&#xff0c;被Vivo拒…

求职学习day6

起来还是刷了一小时视频。还是没办法元气满满的起床。 一个新的集中注意力的办法&#xff0c;屏幕使用时间限制。 计划 CodeTop 面试题目总结 接下来的刷题主要是codetop100 9:40-10:20主要练习自我介绍。 面试到11点&#xff0c;开始做平安的题目&#xff0c;然后去广州…

谷粒商城实战笔记-35-前端基础-ES6-模块化

文章目录 一&#xff0c;什么是模块化二&#xff0c;export1. export语法2. 批量导出3. 默认导出 三&#xff0c;import1&#xff0c;import语法2&#xff0c;批量导入 一&#xff0c;什么是模块化 模块化编程是一种软件设计技术&#xff0c;它将程序分解为独立的、可复用的部…

克隆的TrinityCore服务器网速慢卡顿问题的解决(未解决)

一台TrinityCore服务器&#xff0c;采用的是备份克隆安装的方式&#xff0c;在FreeBSD bhyve 中安装Ubuntu&#xff0c;安装细节见如下两篇文档&#xff1a;尝试在FreeBSD 的jail、bhyve里安装TrinityCore-CSDN博客 备份和镜像TrinityCore_魔兽世界 updating auth database...…

Spring Boot项目中使用MyBatis Generator (MBG) 自动生成Mapper文件

Spring Boot项目中使用MyBatis Generator (MBG) 自动生成Mapper文件可以很大程度上减少编码。本文着重介绍如何在实战中使用MGB自动生成Mapper文件 1. 添加MyBatis Generator依赖 在pom.xml中添加必要的依赖 <dependency><groupId>org.mybatis.spring.boot</…

uniapp中给data中的变量赋值报错

排查了一上午&#xff0c;原本以为是赋值的这个变量有一个键名是空字符串的问题&#xff0c;后来发现是因为在data中定义变量是写的是{}&#xff0c;如果写成null就不会报错了&#xff0c;具体原因不清楚为什么

逻辑回归(Logistic Regression,LR)

分类和回归是机器学习的两个主要问题。 分类处理的是离散数据回归处理的是连续数据 线性回归&#xff1a;回归 拟合一条线预测函数&#xff1a; 逻辑回归&#xff1a;分类——找到一条线可以将不同类别区分开 虽然称为逻辑回归&#xff0c;但是实际是一种分…

2024 HNCTF PWN(hide_flag Rand_file_dockerfile Appetizers TTOCrv_)

文章目录 参考hide_flag思路exp Rand_file_dockerfile libc 2.31思路exp Appetizers glibc 2.35绕过关闭标准输出实例客户端 关闭标准输出服务端结果exp TTOCrv_&#x1f3b2; glibc 2.35逆向DT_DEBUG获得各个库地址随机数思路exp 参考 https://docs.qq.com/doc/p/641e8742c39…

从零开始学量化~Ptrade使用教程(七)——期权相关操作

期权交易 可点击证券代码右侧的选&#xff0c;进入期权选择菜单。通过选择标的商品&#xff0c;认购期权和认沽期权中间的选项&#xff08;包括代码、成交价、幅度%、隐波%、内在价值、时间价值等&#xff09;&#xff0c;以及认购期权或认沽期权&#xff0c;选择所需的期权标的…

计算机网络入门 -- 常用网络协议

计算机网络入门 – 常用网络协议 1.分类 1.1 模型回顾 计算机网络细分可以划为七层模型&#xff0c;分别是物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。而上三层可以划为应用层中。 1.2 分类 1.2.1 应用层 为用户的应用进程提供网络通信服务&#xff0…

深入浅出WebRTC—DelayBasedBwe

WebRTC 中的带宽估计是其拥塞控制机制的核心组成部分&#xff0c;基于延迟的带宽估计是其中的一种策略&#xff0c;它主要基于延迟变化推断出可用的网络带宽。 1. 总体架构 1.1. 静态结构 1&#xff09;DelayBasedBwe 受 GoogCcNetworkController 控制&#xff0c;接收其输入…

【后端开发】身份和访问管理IAM(MFA,OTP,JWT,OAuth,SSO)

【后端开发】身份和访问管理IAM&#xff08;OTP&#xff0c;OAuth&#xff0c;JWT&#xff0c;SSO&#xff0c;MFA&#xff09; 文章目录 1、身份和访问管理&#xff08;IAM&#xff09;2、验证&#xff1a;多因素身份验证&#xff08;MFA&#xff09;3、验证&#xff1a;一次性…

Perl与数据库交互:深入理解DBI模块

Perl是一种非常强大的语言&#xff0c;特别是在处理文本和数据方面。在现代软件开发中&#xff0c;数据库的使用几乎是不可或缺的。Perl通过DBI&#xff08;Database Interface&#xff09;模块提供了一种标准的方式来与数据库进行交互。DBI是Perl中用于数据库交互的接口&#…

buu--web做题(4)

目录 [BJDCTF2020]ZJCTF&#xff0c;不过如此 [BUUCTF 2018]Online Tool [BJDCTF2020]ZJCTF&#xff0c;不过如此 <?phperror_reporting(0); $text $_GET["text"]; $file $_GET["file"]; if(isset($text)&&(file_get_contents($text,r)&q…

【iOS】——消息传递底层实现

消息传递是什么 Objective-C是一种动态类型语言&#xff0c;这意味着在编译时并不确定对象的具体类型&#xff0c;而是在运行时决定。消息传递机制允许程序在运行时向对象发送消息&#xff0c;对象再决定如何响应这些消息。 当你通过对象调用方法时&#xff0c;例如像这样[ob…

PhantomJs将html生成img|pdf

PhantomJS PhantomJS是一个可编程的无头浏览器&#xff0c;‌它基于WebKit内核&#xff0c;‌通过JavaScript API进行脚本化操作&#xff0c;它对各种web标准有快速和原生化的支持&#xff0c;包括DOM处理、CSS选择器、JSON、Canvas和SVG。‌无头浏览器指的是一个完整的浏览器内…