GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

GPT-4再次遭网友“群攻”,原因是“懒”得离谱!

有网友想在Android系统开发一个能够与OpenAI API实时交互的应用。

于是把方法示例链接发给GPT-4,让它参考用Kotlin语言编写代码:

图片

没成想,和GPT-4一来二去沟通半天,GPT-4死活给不出一个能正常运行的完整代码

反而解释了一通“应该怎么做”。

这让网友着实恼火,发推文吐槽“两周前能写好的代码,现在却不行了”。

图片

结果一下子炸出来更多网友:

终于有人调查这事儿了。

图片

大伙儿连连表示遇到了类似问题:

图片

据网友所述,似乎从11月6日GPT-4大更新起,就开始出现这种情况了。

目前有OpenAI员工出面回应,表示已将问题反馈给团队

只要代码,完整代码!

也难怪网友会“破防”,就说上面网友把方法示例链接发给GPT-4,让它用Kotlin语言编写代码之后。

GPT-4给出的回复是这样婶儿的,足足列了7条步骤,都在解释“应该怎么做”:

图片

直到最后才给出代码,但只是一个基础“模版”:

图片

网友起初还比较有耐心,告诉它“不需要解释,只要给我代码,完整的代码,能100%正常运行的代码”:

图片

结果GPT-4张口又在解释、举例子:

图片

网友气不打一处来,直接打断它,并再次强调“不要解释,给我代码”:

图片

GPT-4这下可是真真明白了,把上面那个模版稍微改动了一下,就发出来了:

图片

这才有了开头的一幕,网友无奈发帖吐槽。

图片

对于GPT-4的回复,网友“怒吼”了一句:他们都对你做了什么?抱歉你被削弱了。

图片

GPT-4此刻也是一脸无辜🥺。

陆陆续续出来吐槽的网友中,更有甚者表示已经不用ChatGPT了。

图片

AI图像编辑器dingboard CEO@kache (yacine)在前一天也发帖吐槽,浏览量达157000+:

在过去的一个半星期里,我一直在编写“幼稚”的代码,因为GPT-4不那么遵循指令了。

图片

巧了不是,如果按网友所说的“一个半星期”来算,时间还和奥特曼·真还传事件吻合了。

kache (yacine)还有一条帖子满满都是情绪,“请把旧的GPT-4还给我”:

图片

这位网友表示“我懂你”:

以前它能做出很好的猜测,现在它会给我十个理由解释为什么它不能做出好的猜测。

上周,我对着聊天框大喊“f*ing do it!!”的次数创下历史新高。

图片

一时间,GPT-4的“懒惰”成为众多网友“讨伐”对象。

沃顿商学院教授Ethan Mollick也看不下去了,亲自上手测试了一下,结果似乎表明这是真的。

图片

Ethan Mollick重复了一系列之前用代码解释器(Code Interpreter)做过的分析。

图片

GPT-4虽然知道该怎么做,但会一直提示“去完成工作”。导致原本的一个步骤变成了许多步骤,而且有些步骤很奇怪。

这下Ethan Mollick也是无语住了。

GPT-4到底是怎么了?背后原因还不得而知,网友们也是纷纷猜测起来。

OpenAI员工:已反馈给团队

Ethan Mollick还是很严谨,认为即便如此也不足以证明GPT-4变得越来越笨了,他推测这可能是系统负载过高的暂时问题。

图片

如果你是在手机(移动设备)上遇到了这种问题,那可能是因为手机版系统提示的原因,会指示ChatGPT生成更简短精要的答案。

我的测试是在网页版进行的。

image.png

Reddit上也有人发文讨论,其中有一篇帖子指出“并不是新版GPT-4懒,只是我们用错了”:

image.png

文中指出,GPT-4自本月6号进行了一次大更新后,基础版本没有自定义提示,这就导致GPT-4没有预定义的“路径”来指导其行为。

这让它非常通用,但默认设置下它的输出也有些“无方向”。

解决办法之一,就是使用更新后提供的自定义GPT新功能(GPTs),为每项工作设置一个专门的GPT。

也相继有网友分享“小妙招”:

新版GPT-4改变游戏规则的一点是它能一次性解释的代码量。明确地说出类似“请完整地写出这个测试”的指令,可能会有用。

同时,明确指出“不要重写已经写过的代码”也很有帮助,这样可以节省token,让模型专注于产生新的输出。

我还发现,加入“一步一步思考”的提示会在开始时增加一些计划性的文本,这有助于后续输出更好地定位上下文。

image.png

但也有网友表示自己在用的时候,无论如何都会留下一些“待办事项”:

图片

这位网友更是直言GPT-4现在像是得了老年痴呆:

OpenAI暗示的是新版GPT-4非常善于遵循指令,但事实并非如此。

我从一开始就一直在使用GPT-3、3.5再到后来的4,从未见过这种程度的阿尔茨海默症。

image.png

在网友的激烈吐槽下,OpenAI员工也出面回应。

起初是让网友们提供一些具体的例子,说是研究一下,很有可能在下次模型版本迭代中修补这些问题。

图片

此话一出,炸出更多网友“上报故障”。

image.png

will depue再次回应:

感谢反馈,在这里的所有示例都会帮助我们更快地解决这个问题。我刚刚将其转发给团队,后续消息会及时通知。

图片

看来官方后续回应还要再等一波,家人们最近有遇到类似情况吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/182096.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数字孪生智慧园区:企业与政府合作的共赢之选

随着科技的快速发展和数字化转型的推动,数字孪生技术正逐渐成为智慧城市和园区建设的重要方向。数字孪生智慧园区,以数字孪生技术为驱动,通过对园区实体和虚拟环境的全面感知和深度理解,为园区管理者和入驻企业提供智能化决策支持…

微信发红包,有哪些测试点

1、功能 1.在红包钱数,和红包个数的输入框中只能输入数字 2.红包里最多和最少可以输入的钱数 200 0.01 3.拼手气红包最多可以发多少个红包 100 3.1超过最大拼手气红包的个数是否有提醒 4.当红包钱数超过最大范围是不是有对应的提示 5.当发送的红包个数超过…

YOLOv5改进之ShuffleNetV2

目录 一、原理 网络结构 二、代码 三、应用到YOLOv5 一、原理

linux 之iptables

1.iptables防火墙基本介绍 Linux系统的防火墙:IP信息包过滤系统,它实际上由两个组件 netfilter和 iptables 组成。 主要工作在网络层,针对IP数据包。体现在对包内的IP地址、端口、协议等信息的处理上。 iptables由软件包iptables提供的命令…

uniapp中使用pageScrollTo让页面滚动到固定节点或距离

uniapp中使用pageScrollTo让页面滚动到固定节点或距离 思路:计算当前节点距离顶部的距离滚动距离然后使用pageScrollTo进行滚动(要保证页面加载完成之后在执行) #topic" id :页面的节点 changeTop(id) {let query uni.c…

计算机技术指标

计算机的主要技术指标有性能、功能、可靠性、兼容性等参数,技术指标的好坏由硬件和软件两方面的因素决定。 ▶1.性能指标 系统性能是整个系统或子系统实现某种功能的效率。计算机的性能主要取决于速度与容量。计算机运行速度越快,在某一时间片内处理的…

量子计算:探索未来的计算技术

量子计算:探索未来的计算技术 引言 在过去的几十年里,我们见证了计算机技术从简单的计算和存储发展到复杂的数据处理和人工智能的飞速进步。然而,随着我们进一步探索科技的前沿,传统的计算方法开始显示出其局限性。在这种情况下,量子计算——一种基于量子力学原理的新型计…

windows上执行python-crontab定时程序

参考: https://blog.51cto.com/u_16175493/6762921 https://blog.51cto.com/u_16213645/7365321 https://blog.csdn.net/weixin_35753291/article/details/129060570 报错处理: https://cloud.tencent.com/developer/ask/sof/105993995 https://pypi.org…

filebrowser搭建网盘

在内网中使用IIS搭建FTP和WEBdev映射到外网,配置麻烦,使用体验不是很好,而使用filebrowser则简单多了。 一.下载文件 https://github.com/filebrowser/filebrowser/releases/ 下载windows版本二.解压部署 将安装包加压到d:\windows-browser …

案例,linux环境下OpenCV+Java,实现证件照在线更换背景色

先看效果(图片来自网络,如有侵权,请联系作者删除) 主要是通过java实现的,linux环境编译安装opencv及证件照背景色更换的核心算法在前面一篇文章中有写到。 目前算法还有瞎呲,当照片光线不均的时候会出现误…

阶段三:Web开发(学习如何在Web应用中进行数据库操作)

在Web应用中进行数据库操作是常见的需求,Python提供了多种库和框架来简化这个任务。以下是使用Python进行Web应用中数据库操作的基本步骤: 选择一个Web框架:Python有很多流行的Web框架,如Django、Flask和Tornado等。这些框架提供…

【JavaEE初阶】死锁问题

目录 一、死锁的三种典型场景 1、一个线程,一把锁 2、两个线程,两把锁 3、N个线程,M把锁 死锁,是多线程代码中的一类经典问题。我们知道加锁是能解决线程安全问题的,但是如果加锁的方式不当,就可能产生死…

工会排队奖励模式:创新营销策略,实现共赢局面

在当今的商业环境中,创新营销策略的重要性日益凸显。工会排队奖励模式作为一种新型的营销策略,旨在通过结合线上和线下消费,激励消费者购买产品或服务,并获得返现奖励。这种模式通过将消费者的支出和商家的抽成资金纳入奖金池&…

CH58x-BLE 程序阅读笔记

CH58x-BLE 程序阅读笔记 1. 广播1.1 广播类型设置1.2 广播数据长度 2. MTU设置2.1 CH58x 蓝牙协议栈支持有效最大MTU为247 1. 广播 1.1 广播类型设置 1.2 广播数据长度 1) GAP-广播数据(最大大小31字节,但最好保持较短以节省广告时的电量&a…

python tkinter 使用(十一)

python tkinter 使用(十一) #!/usr/bin/python3 # -*- coding: UTF-8 -*- """Author: zhTime 2023/11/27 下午3:36 .Email: Describe: """ import tkinter from tkinter import *master Tk() master.title("菜单") master.geometry…

记录MySql删除42亿行数据表方法

背景: 现网db有个log表自增ID溢出,业务已经切换到其他表,但是之前有其他业务删除大表导致现网出现故障,这里考虑到是一张静态表,所以采用的是直接删除的方式,记录下当时的删除的步骤。 直接删除的风险&am…

Linux 磁盘挂载

一、查看挂载点 df -h 二、查看磁盘信息 fdisk -l 下面红色的这一块就是未分区的磁盘 三、 进行磁盘分区 fdisk /dev/sdb /dev/sdb :是上面fdisk -l查询出来未分区的磁盘地址 根据提示输入m获取命令 四、执行命令,创建一个分区 1、新建分区&#…

【前端】three.js

文章目录 概述three.js-master目录结构Threejs 的基本要素场景相机透视相机正交相机 网格2d3d 灯光AmbientLight(环境光)平行光(DirectionalLight)点光源(PointLight)聚光灯(SpotLight) 渲染器 Threejs 的实…

WordPress更改文章分类插件

当WP网站内容比较多的时候,有时候如果涉及到批量修改文章分类,如果一个个的去操作的话就太费事了,如果使用后台批量修改分类的话是增加旧分类不会取消选择,就就导致我们适得其反还需要一个一个的去编辑取消,实在繁琐了…

Java高级技术(单元测试)

一,概括 二,junit 三,案例 (1),实验类 package com.bilibili;public class Name {public static void main(String name) {if (name null){System.out.println("0");return;}System.out.print…