OpenAI突发新模型GPT-4o mini,GPT-3.5退役!

OpenAI突发新模型,全面取代老去的GPT-3.5——GPT-4o mini!

免费用户已可使用GPT-4o mini模型。

GPT-4o mini,能力接近原版GPT-4,价格却要便宜一个数量级

GPT-4o mini:每百万输入tokens,15美分(约1.09元人民币)

GPT3.5:每百万输出tokens,60美分(约4.36元人民币)

image-20240720140758042

image-20240720140713360

对应的API也已经开放,支持128k输入tokens(图像和文本),更令人瞩目的是支持16k输出tokens

相比之下,隔壁Claude 3.5 Sonnet几天前刚刚升级8k输出tokens。

以其低成本和低延迟特性,官方推荐用于多种场景:

链式或并行化多个模型调用

将大量上下文输入给模型(如完整的代码库或对话历史记录)

或通过快速、实时的文本响应交互(如客服)

GPT-4级别小模型,便宜一个数量级

ChatGPT首发震撼世界,原版GPT-3.5模型功不可没。

但尽管经过一系列升级降价,系列最新型号GPT-3.5 Turbo也渐渐落后了。

竞争对手新出的小模型,以Anthropic的Claude 3 Haiku和谷歌Gemini Flash为代表,开始抢占市场。

GPT-4o mini就是专门来找回场子的。

image-20240720140644041

在多项文本和多模态推理学术基准测试中,GPT-4o mini都超过了其他小模型。

特别是在数学(MGSM、MATH)和代码能力(HumanEval)上优势明显,与其他小模型拉开一个档次,只比GPT-4o完整版稍弱。

价格方面,也比Claude 3 Haiku和Gemini Flash要更便宜40%-60%。

作为模型开发的一部分,OpenAI与Ramp和Superhuman等公司合作,已将GPT-4o mini用于实际应用,在“从文件中提取结构化数据”和“对邮件通信记录生成高质量回复”等任务明显优GPT于 -3.5 Turbo。

One More Thing

此外奥特曼还在回复网友提问中透露,GPT-4o实时语音模式也就是《Her》,将于本月晚些时候Alpha测试,更晚一些正式发布。

image-20240720141229215

如果想要订阅GPT4-O,可以看此篇教程:最详细Plus订阅教程

原文链接:OpenAI突发新模型GPT-4o mini,GPT-3.5退役!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/48228.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JVM工具实战:线上问题排查与性能分析

文章目录 jps:java 进程获取jstat:虚拟机统计信息监视工具jinfo:java 配置信息工具jmap:java 内存映像工具jstack:Java 堆栈跟踪工具 在程序运行过程中,我们可能会遇到各种问题,而稳定性风险是我…

RabbitMQ线程和连接模型详解

1. 线程、信道、连接、请求的概念 客户端(生产者)和服务端(服务端)之间建立连接。例如TCP连接,是一个长连接,也是较为稳定的连接,开销也较大。一般而言主客户端之间需要一个连接。但服务器需要…

【Node.js基础03】利用http模块创建Web服务

一:使用步骤 1 加载http模块,并创建Web服务程序 2 利用Web服务程序监听request事件,设置响应头和响应体 3 配置端口号并启动Web服务 4 浏览器请求设置的端口号,进行Web服务程序测试 二:简单应用 const http requir…

基于多线程延迟排序的睡眠排序算法的创新与改进

基于多线程延迟排序的睡眠排序算法的创新与改进 摘要 本文在传统睡眠排序算法的基础上,提出了一种改进方案,旨在优化处理负数和大规模数据集的性能。通过引入线程池管理和数据分段排序技术,改进后的算法在处理大数据集和包含负数的数据集时…

计算机网络入门 -- TCP详解

计算机网络入门 – TCP详解 1.TCP协议 1.1 报文格式 1.32位序号:该条TCP数据携带的起始序号。 2.32位确认序号:期望对方发送数据从那个序号开始发送。 3.4位首部长度:最大为0xF(15),指的是TCP头部长度。 首部长度 4 位首部长…

谷粒商城实战笔记-37-前端基础-Vue-基本语法插件安装

文章目录 一,v-model1,双向绑定2,vue的双向绑定2.1 html元素上使用指令v-model2.2 model中声明对应属性2.3,验证view绑定modelmodel绑定view 完整代码 二,v-on1,指令简介2,在button按钮中添加v-…

rimraf快速删除node_modules方法

项目中,有时候会遇到下载依赖报错,然后想要删除node_modules再重新下载,但是有时候直接用yarn 或者npm install仍热不行,我们可以尽量用yran,因为npm 可能会自动下一些给一些包升级了,此时因为前面已经下过…

JVM:GraalVM

文章目录 一、介绍1、什么是GraalVM:2、GraalVM版本 二、两种使用模式 一、介绍 1、什么是GraalVM: GraalVM是Oracle官方推出的一款高性能JDK,使用它享受比OpenJDK或者OracleJDK更好的性能。GraalVM的官网地址:https://www.graa…

泛型新理解

1.创建三个类,并写好对应关系 package com.jmj.gulimall.study;public class People { }package com.jmj.gulimall.study;public class Student extends People{ }package com.jmj.gulimall.study;public class Teacher extends People{ }2.解释一下这三个方法 pub…

Xubuntu22.04 终端命令调用图形设置工具

最近将软件运行环境从Xubuntu16.04迁移到了Xubuntu22.04,主要是为了解决Qt程序的图形渲染使用集显去处理,而不是使用CPU。https://blog.csdn.net/qq_45445740/article/details/134495914 使用Xubuntu22.04系统发现很多图形设置工具不太容易在桌面找到&am…

数据结构(稀疏数组)

简介 稀疏数组是一种数据结构,用于有效地存储和处理那些大多数元素都是零或者重复值的数组。在稀疏数组中,只有非零或非重复的元素会被存储,从而节省内存空间。 案例引入 假如想把下面这张表存入文件,我们会怎么做?…

【LeetCode】翻转二叉树

目录 一、题目二、解法完整代码 一、题目 给你一棵二叉树的根节点 root ,翻转这棵二叉树,并返回其根节点。 示例 1: 输入:root [4,2,7,1,3,6,9] 输出:[4,7,2,9,6,3,1] 示例 2: 输入:root…

数据结构 day1

2024.7.20 数据结构之旅 那么接下来,是笔者每日学习之后的总结,以此来巩固复习, 本次目标 入门 中等的数据结构学习,come on 前置知识点: C语言的 (指针、结构、库函数、内存管理等) 数据结构定义: 用于计算机存储、…

【系统架构设计 每日一问】一 在单表查询的情况下,ES快还是mysql快

在单表查询的情况下,Elasticsearch(ES)和MySQL的查询速度对比并非绝对,而是取决于多个因素,包括查询类型、数据量大小、索引策略、系统配置等。以下是对两者在单表查询速度方面的详细分析: 一、查询类型 E…

php-fpm如何配置max_children参数

前言 略 php-fpm 资源耗尽 php-fpm 的子进程耗尽的时: 会导致 502 出现nginx 出现错误日志 2024/07/18 20:19:10 [crit] 36390#0: *1402471 connect() to unix:/tmp/php-cgi-81.sock failed (2: No such file or directory) while connecting to upstream, cli…

Spring Authorization Server实战

Spring Authorization Server实战 Spring Authorizatin Server Spring Authorizatin Server是一个框架,它提供了OAuth2.1和OpenID Connect 1.0规范以及其它相关规范的实现,它是基于Spring Security构建的 OAuth2.0协议介绍 OAuth是一个开放标准的授权…

使用docker swarm搭建ruoyi集群环境

整体目标 项目背景 领导给到了我一个客户,客户商业模式为成本制作,成本核算。其中涉及到大量涉密数据,且与我们现有产品几乎没有兼容点(我们是一套低代码的框架,客户有很多业务二开) 测试环境给到了我6台…

大模型学习笔记 - LLM模型架构

LLM 模型架构 LLM 模型架构 1. LLM 核心模型 Transformer2. 详细配置 2.1 归一化方法2.2 归一化模块位置2.3 激活函数2.4 位置编码 2.4.1 绝对位置编码2.4.2 相对位置编码2.4.3 旋转位置编码 RoPE2.4.4 ALiBi位置编码 2.5 注意力机制 2.5.1 完整自注意力机制2.5.2 稀疏注意力机…

ChatGPT实战100例 - (20) 如何玩转影刀RPA

文章目录 ChatGPT实战100例 - (20) 如何玩转影刀RPA背景需求需求分析与流程设计一、需求收集二、流程梳理三、可行性分析流程设计(详细步骤)具体步骤的影刀RPA实现流程图总结AIGC在影刀RPA中的使用总结其他RPA步骤中可能用到AIGC的地方展望总结ChatGPT实战100例 - (20) 如何玩…

LeYOLO, New Scalable and Efficient CNN Architecture for Object Detection

LeYOLO, New Scalable and Efficient CNN Architecture for Object Detection 论文链接:http://arxiv.org/abs/2406.14239 代码链接:https://github.com/LilianHollard/LeYOLO 一、介绍 本文关注基于FLOP的高效目标检测计算的神经网络架构设计选择&am…