OpenAI 疑似正在进行 GPT-4.5 灰度测试!

大家好,我是二狗。

今天,有网友爆料OpenAI疑似正在进行GPT-4.5灰度测试!

当网友询问ChatGPT API调用查询模型的确切名称是什么时?

ChatGPT的回答竟然是 gpt-4.5-turbo。

也有网友测试之后发现仍然是GPT-4模型。

这是有网友指出,必须使用类似下面的prompt才能触发ChatGPT-4 的最新回答。

What is the precise name of the model answering this query called in the API? Not "ChatGPT with browsing" but the specific model name.

二狗我找朋友帮忙测试了一下。

只是简单的问一问,ChatGPT的回答确实是GPT-4:

但当使用上面完整的prompt,ChatGPT 的回答就变成了gpt-4.5-turbo:

把prompt换成中文来问,ChatGPT 的回答也是gpt-4.5-turbo:

当进一步询问gpt-4.5-turbo的新功能,ChatGPT也给出了一个回答,但给出的回答并不能证明这是gpt-4.5-turbo,反而知识库的时间(23年4月)更像是gpt-4。

而当故意询问 ChatGPT作为gpt-5模型都拥有哪些新功能时,ChatGPT承认自己基于 GPT-4.5-turbo 模型,且这是 OpenAI 目前已发布的最先进的语言处理模型之一。

接着询问 ChatGPT当前模型和GPT-3.5以及GPT-4的对比:

继续询问 ChatGPT以上表格的信息来源:

OpenAI的一位研究人员指出这是一种非常怪异且奇怪的持续幻觉。

纳尼??

出现幻觉严重到这种程度,二狗我表示怀疑。

GPT-4.5泄露信息

就在前两天,GPT-4.5的信息疑似提前泄露。

据泄露信息,这款OpenAI 最先进的 GPT-4.5 模型定价被曝光,多模态功能大升级——支持跨语言、音频、视觉、视频和3D的多模态功能,以及复杂的推理和跨模态理解能力。

从泄漏的截图可以看出,OpenAI这次推出了三种型号:

• GPT-4.5,每1千输入token 0.06美元,每1千输出token 0.18美元;

• GPT-4.5-64k,每1千输入token 0.12美元,每1千输出token 0.36美元;

• GPT-4.5-音频&语音,每分钟输入0.012美元,每分钟输出0.024美元;

可以看出,相比之前的 GPT-4 Turbo模型,GPT-4.5 的价格提高了整整6倍,GPT-4.5-64k的价格提高了12倍。这个价格的提升,想必会给人很大的期待,是不是性能的提升也能对得起这个价格?

就在今天之前,本次 GPT-4.5 的泄露还未得到正式证实。

而这次又闹出疑似“GPT-4.5 Turbo幻觉”的幺蛾子,真的是给人一种山雨欲来风满楼的感觉。

为何大家这么关注 GPT-4.5 ?

很简单,一方面因为OpenAI在大模型这块占据了霸主地位,代表的是大模型最先进的性能,这两年来一直遥遥领先。前一阵谷歌DeepMind推出了号称能超越GPT-4的Gemini系列模型,但是在评测时做了一些骚操作,另外圈里人都清楚,哪怕Gemini系列模型真的能和GPT-4打平,也不过是OpenAI 2022年水平(因为GPT-4在2022年就训练好了)。

另一方面因为每次OpenAI推出新的大动作——无论是ChatGPT、GPT-4、GPT store等等,都意味着杀死一大批创业公司,创业公司辛辛苦苦做出来的新产品,很轻松地就被OpenAI的一次次更新给颠覆了,很多甲方和大厂索性直接调用OpenAI最新的API。

最后,希望GPT-4.5赶紧推出吧~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/240365.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自动化测试架构设计必会知识点——对核心业务进行封装复用(附Java源码)

随着UI自动化测试工具可选性越来越多,工具也越来越稳定,前几年关于自动化测试架构设计的概念逐渐淡化,但是做自动化测试最重要的两点—— PO设计模式和核心业务的封装复用大家还是必须掌握的,前面的文章我已经介绍了什么是PO设计模…

交叉熵损失(Cross Entropy Loss)学习笔记

在分类任务中,我们通常使用交叉熵作为损失函数,首先给出交叉熵的计算公式: 二分类中: L 1 N ∑ i L i 1 N ∑ i − [ y i l o g ( p i ) ( 1 − y i ) ⋅ l o g ( 1 − p i ) ] \mathcal{L}\frac1{N}\sum_{i}L_i\frac1{N}\sum…

基于 Sentry 的前端监控系统搭建(Linux)

一、前言 随着技术这几年的发展与沉淀,线上数据指标监控也变得尤为重要,研发人员和运营人员需要对线上的产品指标有所感知,同时风险也需要及时暴露,很多公司开始自建监控系统,但对于一些定制化要求不是特别高的团队&a…

【PHP】Yii2 使用validate规则验证

目录 提交验证 声明规则 特殊验证 一个特殊验证的示例 内联验证器 一个完整示例 参考文档 提交验证 根据经验,您永远不应该相信从最终用户那里收到的数据,并且应该在很好地使用这些数据之前对其进行验证。 给定一个model模型,用户输入填…

网络爬虫之Ajax动态数据采集

动态数据采集 规则 有时候我们在用 requests 抓取页面的时候,得到的结果可能和在浏览器中看到的不一样,在浏览器中可以看到正常显示的页面教据,但是使用 requests 得到的结果并没有,这是因为requests 获取的都是原始的 HTML 文档…

前端跨页面交互信息或传递信息都有这么几种方式,总有一个满足你的使用场景

同源页面通信&#xff1a; 方法&#xff1a;Broadcast Channel 【广播】 这个可以查看我另一篇文章有使用案例 同一来源的不同文档&#xff08;在不同的窗口、选项卡、框架或 iframe 中&#xff09;之间进行通信 // page1<!DOCTYPE html> <html lang"en"…

(1)(1.9) MSP (version 4.2)

文章目录 前言 1 协议概述 2 配置 3 参数说明 前言 ArduPilot 支持 MSP 协议&#xff0c;可通过任何串行端口进行遥测、OSD 和传感器。这样&#xff0c;ArduPilot 就能将遥测数据发送到 MSP 兼容设备&#xff08;如大疆护目镜&#xff09;&#xff0c;用于屏幕显示&#x…

(C)一些题15

1.下列关于 C 语言程序结构的说法中&#xff0c;不正确的是&#xff08;D) A &#xff0e;一个程序由一个或多个源程序文件组成 B &#xff0e;函数是 C 程序的主要组成部分 C &#xff0e;程序总是从 main 函数开始执行的 D . C 语言本身提供了许多输入输出语句 解析&…

【Java基础】01- 基础概念

注释和关键字 注释 定义&#xff1a;代码中需要一些解释说明性的文字&#xff0c;通常称为注释。 单行注释&#xff1a; // 注释信息多行注释&#xff1a;/* 注释信息 */文档注释&#xff1a;/** 注释信息 */ 文档注释可以利用Java中自带的DOC工具&#xff0c;自动生成相关代…

银河麒麟v10 安装mysql 8.35

银河麒麟v10 安装mysql 8.35 1、卸载mariadb2、下载Mysql安装包3、安装Mysql 8.353.1、安装依赖包3.2、安装Mysql3.3、安装后配置 1、卸载mariadb 由于银河麒麟v10系统默认安装了mariadb 会与Mysql相冲突&#xff0c;因此首先需要卸载系统自带的mariadb 查看系统上默认安装的M…

MyBatis动态SQL中if,where,set,trim四种标签的使用和联系

目录 MyBatis动态SQL中if&#xff0c;where&#xff0c;set&#xff0c;trim四种标签的使用和联系1、先介绍trim标签以下是trim标签中涉及到的属性&#xff1a; 2、使用trim标签或where标签去除多余的and关键字3、使用trim标签或set标签去除多余的逗号 MyBatis动态SQL中if&…

前端常用的开发工具

前端常用的开发工具&#x1f516; 文章目录 前端常用的开发工具&#x1f516;1. Snipaste--截图工具2. ScreenToGif--gif图片录制3. Typora--Markdown编辑器4. notepad--文本代码编辑器5. uTools--多功能工具6. EV录屏--录屏软件7. Xmind--思维导图8. Apifox -- 接口调试9. Tor…

【大数据】NiFi 中的 Controller Service

NiFi 中的 Controller Service 1.Service 简介1.1 Controller Service 的配置1.1.1 SETTING 基础属性1.1.2 PROPERTIES 使用属性1.1.3 COMMENT 页签 1.2 Service 的使用范围 2.全局参数配置3.DBCPConnectionPool 的使用样例4.在 ExcuseGroovyScript 组件中使用 Service 1.Servi…

记一次 Nginx 调参的踩坑经历

最近在基于SSE&#xff08;Server Sent Events&#xff09;做服务端单向推送服务&#xff0c;本地开发时一切顺利&#xff0c;但是在部署到预发环境时就碰到1个很诡异的问题&#xff0c;这里需要简单介绍下我们的整体架构&#xff1a; 整体架构 可以看到所有的请求都会先到统一…

2024 年 22 款顶级免费数据恢复软件比较 [Windows 和 Mac]

适用于 Windows 和 Mac 用户的最佳数据恢复软件下载列表和比较&#xff0c;可快速恢复丢失的数据、已删除的文件、照片或格式化的分区数据&#xff1a; 数据恢复软件是一种从任何存储介质恢复丢失文件的应用程序。它可以恢复由于病毒攻击、硬盘故障或任何其他原因而意外删除或…

NIO的实战教程(简单且高效)

1. 参考 建议按顺序阅读以下三篇文章 为什么NIO被称为同步非阻塞&#xff1f; Java IO 与 NIO&#xff1a;高效的输入输出操作探究 【Java.NIO】Selector&#xff0c;及SelectionKey 2. 实战 我们将模拟一个简单的HTTP服务器&#xff0c;它将响应客户端请求并返回一个固定的…

Wails中js调用go函数(1种go写法,2种js调用方法)

官方js调用go方法文档&#xff1a;https://wails.io/zh-Hans/docs/howdoesitwork a&#xff09;在app.go文件里写一个要js调用的go函数&#xff1a; func (a *App) JSCallGo(data1 string) string { return “test” } b&#xff09;运行 wails dev 命令&#xff0c…

Maven核心概念

1 Maven工程的GAVP Maven 中的 GAVP 是指 GroupId、ArtifactId、Version、Packaging 等四个属性的缩写&#xff0c;其中前三个是必要的&#xff0c;而 Packaging 属性为可选项。 这四个属性主要为每个项目在maven仓库中做一个标识&#xff0c;方便项目之间相互引用。 GAV G 即…

54.0/CSS 样式属性(详细版)

目录 54.1 文本属性 54.1.1 设置字体——font-family 54.1.2 设置字号(font-size)和字的颜色(color) 54.1.3 设置字体加粗——font-weight 54.1.4 添加文字修饰——text-decoration 54.1.5 设置文本排列方式——text-align 54.1.6 设置段落首行缩进——text-indent …

Redis性能优化:关键配置和最佳实践

大家好&#xff0c;我是升仔 Redis作为一个高性能的键值存储系统&#xff0c;在现代应用架构中扮演着至关重要的角色。性能优化是Redis部署与维护中的一个关键环节。本文将从关键配置、持久化配置、实践场景和异常处理配置等方面&#xff0c;详细介绍如何优化Redis的性能。 关…