OpenAI 承认 ChatGPT 最近确实变懒,承诺修复问题

文章目录

  • 一. ChatGPT 指令遵循能力下降引发用户投诉
    • 1.1 用户抱怨回应速度慢、敷衍回答、拒绝回答和中断会话
  • 二. OpenAI 官方确认 ChatGPT 存在问题,展开调查
  • 三. OpenAI 解释模型行为差异,回应用户质疑
  • 四. GPT-4 模型变更受人事动荡和延期影响

一. ChatGPT 指令遵循能力下降引发用户投诉

1.1 用户抱怨回应速度慢、敷衍回答、拒绝回答和中断会话

不知道大家有没有发现,自 11 月 6 日 OpenAI 的开发者大会以来,ChatGPT 似乎变得越来越懒了?具体而言,这一个月来,陆续有网友发现,ChatGPT 在其指令遵循能力上下滑严重,经常避开一些繁琐的重复性的任务,只给出一个启发性的“框架”,里面留下大量空白让用户自己去填空。

image-20231213094716574

OpenAI 在上周遭到部分用户投诉,许多用户声称,他们在使用 ChatGPT 或 GPT-4 API 时,会遇到回应速度慢、敷衍回答、拒绝回答、中断会话等一系列问题,OpenAI 承认了这一事实,并在声称将彻底、妥当地修复相关问题。

OpenAI 此前解释称,GPT-4 变懒惰的原因是,OpenAI 从 11 月 11 日起就未再更新模型,而 GPT 模型也正因此变得不可预测,当前该公司正在着手修复问题

据悉,用户抱怨 GPT-4 模型变“懒惰”是指,用户请求 GPT-4 撰写表格,但该模型仅仅输出三行;输入一段代码,模型只输出一些信息,随后再指示用户填写剩下的其他部分。有时候,GPT-4 甚至会告诉人们“你们完全可以自己完成这些工作”。

image-20231213094831858

二. OpenAI 官方确认 ChatGPT 存在问题,展开调查

伴随着大家质疑的声浪,昨天 OpenAI 官方下场,回应了关于 ChatGPT 变懒的传闻,与“律师函警告”不同,OpenAI 官方承认了确实存在这个问题,但是强调了他们从 11 月 11 日起并没有更新模型,目前出现这种问题的原因未知,正在组织人手进一步调查。

除了放出消息,OpenAI 还积极回复了网友们关心的问题,比如有网友质疑:所谓模型不就是那个权重参数的文件?如果这个文件没有改变,为什么一个固定的文件会变懒?

image-20231213095232360

而 OpenAI 回复,“模型行为的差异很微妙”,一些 Prompt 会出现这个问题,而另一些又不会,用户与开发者可能很久之后才会注意到这些问题(意思是说不是模型突然变懒,而是之前就懒但是大家没注意到……)

image-20231213095309613

三. OpenAI 解释模型行为差异,回应用户质疑

在承认 ChatGPT 变懒之后,官方也发布了一系列的帖子了强调模型的训练过程,比如训练一个 Chat 模型并不是像传统的软件工程,哪怕使用相同的数据集在不同的训练方式下也会在个性、写作风格 、拒绝行为、表现评估等等方面产生完全不同的模型。更新模型的过程也不像是在一个网站里上线一个新功能那样纯粹的加法模式,而是需要多人手工进行规划、创建与评估才能将模型的一个新的行为模式上线:

image-20231213095408168

OpenAI 后续解释称,由于模型长期未更新,这导致 GPT 模型行为出现了细微的变化,但只有少部分提示词效果变差,GPT-4 模型在整体层面依然能够保证妥善运行。

OpenAI 声称,他们将在彻底的离线评估和线上 A / B 测试后尽快更新 GPT-4 模型,同时也鼓励用户积极对模型表现进行回馈

四. GPT-4 模型变更受人事动荡和延期影响

有些人开始猜测是因为 OpenAI 合并模型、同时运行 GPT-4 和 GPT-4 Turbo 导致服务器持续过载、公司试图通过限制结果来节省资金等造成的。

众所周知,OpenAI 的运营成本极其昂贵,今年 4 月,研究人员表示,每天需要花费 70 万美元,即每次查询花费 36 美分,才能维持 ChatGPT 的运行。根据行业分析师当时的说法,OpenAI 必须将其 GPU 群扩大至 30000 台,才能在今年剩余时间内保持其商业性能。除了为其所有合作伙伴提供计算之外,OpenAI 还需要支持 ChatGPT 其他流程。

GPT-4 模型停更与该公司的人事动荡密不可分,OpenAI 的 CEO Sam Altman 离职风波及欧美假期共同导致了 OpenAI 日常事务呈现混乱局面,除了 GPT-4 例行更新遭到延期外,原定于今年 12 月初上线供开发人员分享模型的 GPT Store,也被延期到 2024 年初上线。

image-20231213100553716

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/217874.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【小沐学Python】Python实现语音识别(Whisper)

文章目录 1、简介1.1 whisper简介1.2 whisper模型 2、安装2.1 whisper2.2 pytorch2.3 ffmpeg 3、测试3.1 命令测试3.2 代码测试:识别声音文件3.3 代码测试:实时录音识别 4、工具4.1 WhisperDesktop4.2 Buzz4.3 Whisper-WebUI 结语 1、简介 https://gith…

Python 自动化之修理excel文件(二)

批量合成excel文档Pro版 文章目录 批量合成excel文档Pro版前言一、做成什么样子二、基本架构三、库输入模块四、用户输入模块五、数据处理模块1.获取当前目录的文件信息2.创建Workbook实例对象3.遍历entries列表4.获取Excel文件的工作表信息5.命名和写入数据 六、数据输出模块1…

IEEE期刊论文模板

一、模板下载 1、登陆IEEE作者中心Author Center 地址:Publish with IEEE Journals - IEEE Author Center Journals 2、点击“Download a template” 3、在弹出的模板下载页面点击IEEE模板选择器“IEEE Template Selector” 4、在弹出的模板选择器页面点击“Tran…

分支预测失败的处理

由于现代的超标量处理器采用了很多预测的方法来执行指令,并不是流水线中所有的指令都可以退休(retire),例如当流水线中的某条分支指令发生了预测错误,或者某条指令发生了异常,那么在这条指令之后进入流水线的所有指令就不允许退休了; 此时需要将这些指令…

翻译: LLM大语言模型图像生成原理Image generation

文本生成是许多用户正在使用的,也是所有生成式人工智能工具中影响最大的。但生成式人工智能的一部分兴奋点也在于图像生成。目前也开始出现一些可以生成文本或图像的模型,这些有时被称为多模态模型,因为它们可以在多种模式中操作,…

代码随想录算法训练营第四十二天|背包问题理论基础、01背包理论基础(滚动数组)、416. 分割等和子集

代码随想录算法训练营第四十二天|背包问题理论基础、01背包理论基础(滚动数组)、416. 分割等和子集 背包问题理论基础 背包问题理论基础 文章讲解:https://programmercarl.com/%E8%83%8C%E5%8C%85%E7%90%86%E8%AE%BA%E5%9F%BA%E7%A1%8001%E…

谈谈常用的分布式ID的设计方案?

典型回答 首先,我们需要明确通常的分布式ID定义,基本的要求包括: 全局唯一,区别于单点系统的唯一,全局是要求分布式系统内唯一。 有序性,通常都需要保证生成的ID是有序递增的。例如,在数据库存…

iframe 与主应用页面之间如何互相通信传递数据

背景 当我们的Web页面需要复用现有网站的页面时,我们通常会考虑代码层面的抽离引用,但是对于一些过于复杂的页面,通过 iframe 嵌套现有的网站页面也是一种不错的方式,。目前我就职的项目组就有多个业务利用 iframe 完成业务的复用…

QT 基础篇

目录 QPushButton QT帮助文档 QT 对象树 QPushButton QPushButton是Qt图形界面控件中的一种,看英文的意思,他就是按钮,是最基本的图形控件之一。在我们的最基本的项目中,运行: 是一个空白的窗体,里面什么也没有&am…

在Node.js中使用MongoDB连接数据库、创建集合

本文主要介绍在Node.js中使用MongoDB连接数据库、创建集合的方法。 目录 连接数据库使用原生驱动程序连接MongoDB数据库使用Mongoose连接MongoDB数据库 创建集合使用mongodb驱动程序 连接数据库 在Node.js中使用MongoDB连接数据库有两种方式:使用原生驱动程序和使用…

静态HTTP应用的性能优化技巧

在Web开发中,静态HTTP应用以其简单、快速和安全的特点受到了广泛欢迎。然而,随着Web应用的规模不断扩大,性能问题也日益突出。本文将为你介绍一些静态HTTP应用的性能优化技巧,让你的应用飞得更快、更稳定。 一、压缩文件 文件压…

以pycharm为例,生成Python项目所需要的依赖库/包文档:requirements.txt

平时我们在编写或者使用别人的Python项目时,往往会看到一个文档requirements.txt,该文档是描述一个Python项目中的第三方库的名称以及版本。本文介绍导出python当前项目依赖包requirements.txt的操作步骤。 方法一:如果每个项目有对应的虚拟…

【C++】哈希表

文章目录 哈希概念哈希冲突哈希函数哈希表闭散列开散列 开散列与闭散列比较 正文开始前给大家推荐个网站,前些天发现了一个巨牛的 人工智能学习网站, 通俗易懂,风趣幽默,忍不住分享一下给大家。 点击跳转到网站。 哈希概念 顺…

CPython(将Python编译为so)

环境 先配一下环境,我使用的是python3.8.5 pip install Cython 编译过程 我们准备一个要编译的文件 test.py def xor(input_string): output_string "" for char in input_string: output_string chr(ord(char) ^ 0x66) return output_string…

Redis - 事务隔离机制

Redis 的事务的本质是 一组命令的批处理 。这组命令在执行过程中会被顺序地、一次性 全部执行完毕,只要没有出现语法错误,这组命令在执行期间是不会被中断。 当事务中的命令出现语法错误时,整个事务在 exec 执行时会被取消。 如果事务中的…

PyTorch深度学习实战(25)——自编码器

PyTorch深度学习实战(25)——自编码器 0. 前言1. 自编码器2. 使用 PyTorch 实现自编码器小结系列链接 0. 前言 自编码器 (Autoencoder) 是一种无监督学习的神经网络模型,用于数据的特征提取和降维,它由一个编码器 (Encoder) 和一…

20分钟部署ChatGLM3-6B

准备工作 1.下载源代码: https://github.com/THUDM/ChatGLM3 2.下载预训练模型: https://modelscope.cn/models/ZhipuAI/chatglm3-6b/files 可以创建一个py文件,直接使用如下代码下载到本地: from modelscope.hub.snapshot_dow…

python实现形态学建筑物指数MBI提取建筑物及数据获取

前言 形态学建筑物指数MBI通过建立建筑物的隐式特征和形态学算子之间的关系进行建筑物的提取[1]。 原理 上图源自[2]。 实验数据 简单找了一张小图片: test.jpg 代码 为了支持遥感图像,读写数据函数都是利用GDAL写的。 import numpy as np import …

LNMP网站架构分布式搭建部署

1. 数据库的编译安装 1. 安装软件包 2. 安装所需要环境依赖包 3. 解压缩到软件解压缩目录,使用cmake进行编译安装以及模块选项配置(预计等待20分钟左右),再编译及安装 4. 创建mysql用户 5. 修改mysql配置文件,删除…

时间序列预测 — BiLSTM实现多变量多步光伏预测(Tensorflow)

目录 1 数据处理 1.1 导入库文件 1.2 导入数据集 1.3 缺失值分析 2 构造训练数据 3 模型训练 3.1 BiLSTM网络 3.2 模型训练 4 模型预测 1 数据处理 1.1 导入库文件 import time import datetime import pandas as pd import numpy as np import matplotlib.pyplot…