GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

GPT-4再次遭网友“群攻”,原因是“懒”得离谱!

有网友想在Android系统开发一个能够与OpenAI API实时交互的应用。

于是把方法示例链接发给GPT-4,让它参考用Kotlin语言编写代码:

图片

没成想,和GPT-4一来二去沟通半天,GPT-4死活给不出一个能正常运行的完整代码

反而解释了一通“应该怎么做”。

这让网友着实恼火,发推文吐槽“两周前能写好的代码,现在却不行了”。

图片

结果一下子炸出来更多网友:

终于有人调查这事儿了。

图片

大伙儿连连表示遇到了类似问题:

图片

据网友所述,似乎从11月6日GPT-4大更新起,就开始出现这种情况了。

目前有OpenAI员工出面回应,表示已将问题反馈给团队

只要代码,完整代码!

也难怪网友会“破防”,就说上面网友把方法示例链接发给GPT-4,让它用Kotlin语言编写代码之后。

GPT-4给出的回复是这样婶儿的,足足列了7条步骤,都在解释“应该怎么做”:

图片

直到最后才给出代码,但只是一个基础“模版”:

图片

网友起初还比较有耐心,告诉它“不需要解释,只要给我代码,完整的代码,能100%正常运行的代码”:

图片

结果GPT-4张口又在解释、举例子:

图片

网友气不打一处来,直接打断它,并再次强调“不要解释,给我代码”:

图片

GPT-4这下可是真真明白了,把上面那个模版稍微改动了一下,就发出来了:

图片

这才有了开头的一幕,网友无奈发帖吐槽。

图片

对于GPT-4的回复,网友“怒吼”了一句:他们都对你做了什么?抱歉你被削弱了。

图片

GPT-4此刻也是一脸无辜🥺。

陆陆续续出来吐槽的网友中,更有甚者表示已经不用ChatGPT了。

图片

AI图像编辑器dingboard CEO@kache (yacine)在前一天也发帖吐槽,浏览量达157000+:

在过去的一个半星期里,我一直在编写“幼稚”的代码,因为GPT-4不那么遵循指令了。

图片

巧了不是,如果按网友所说的“一个半星期”来算,时间还和奥特曼·真还传事件吻合了。

kache (yacine)还有一条帖子满满都是情绪,“请把旧的GPT-4还给我”:

图片

这位网友表示“我懂你”:

以前它能做出很好的猜测,现在它会给我十个理由解释为什么它不能做出好的猜测。

上周,我对着聊天框大喊“f*ing do it!!”的次数创下历史新高。

图片

一时间,GPT-4的“懒惰”成为众多网友“讨伐”对象。

沃顿商学院教授Ethan Mollick也看不下去了,亲自上手测试了一下,结果似乎表明这是真的。

图片

Ethan Mollick重复了一系列之前用代码解释器(Code Interpreter)做过的分析。

图片

GPT-4虽然知道该怎么做,但会一直提示“去完成工作”。导致原本的一个步骤变成了许多步骤,而且有些步骤很奇怪。

这下Ethan Mollick也是无语住了。

GPT-4到底是怎么了?背后原因还不得而知,网友们也是纷纷猜测起来。

OpenAI员工:已反馈给团队

Ethan Mollick还是很严谨,认为即便如此也不足以证明GPT-4变得越来越笨了,他推测这可能是系统负载过高的暂时问题。

图片

如果你是在手机(移动设备)上遇到了这种问题,那可能是因为手机版系统提示的原因,会指示ChatGPT生成更简短精要的答案。

我的测试是在网页版进行的。

image.png

Reddit上也有人发文讨论,其中有一篇帖子指出“并不是新版GPT-4懒,只是我们用错了”:

image.png

文中指出,GPT-4自本月6号进行了一次大更新后,基础版本没有自定义提示,这就导致GPT-4没有预定义的“路径”来指导其行为。

这让它非常通用,但默认设置下它的输出也有些“无方向”。

解决办法之一,就是使用更新后提供的自定义GPT新功能(GPTs),为每项工作设置一个专门的GPT。

也相继有网友分享“小妙招”:

新版GPT-4改变游戏规则的一点是它能一次性解释的代码量。明确地说出类似“请完整地写出这个测试”的指令,可能会有用。

同时,明确指出“不要重写已经写过的代码”也很有帮助,这样可以节省token,让模型专注于产生新的输出。

我还发现,加入“一步一步思考”的提示会在开始时增加一些计划性的文本,这有助于后续输出更好地定位上下文。

image.png

但也有网友表示自己在用的时候,无论如何都会留下一些“待办事项”:

图片

这位网友更是直言GPT-4现在像是得了老年痴呆:

OpenAI暗示的是新版GPT-4非常善于遵循指令,但事实并非如此。

我从一开始就一直在使用GPT-3、3.5再到后来的4,从未见过这种程度的阿尔茨海默症。

image.png

在网友的激烈吐槽下,OpenAI员工也出面回应。

起初是让网友们提供一些具体的例子,说是研究一下,很有可能在下次模型版本迭代中修补这些问题。

图片

此话一出,炸出更多网友“上报故障”。

image.png

will depue再次回应:

感谢反馈,在这里的所有示例都会帮助我们更快地解决这个问题。我刚刚将其转发给团队,后续消息会及时通知。

图片

看来官方后续回应还要再等一波,家人们最近有遇到类似情况吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/182096.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数字孪生智慧园区:企业与政府合作的共赢之选

随着科技的快速发展和数字化转型的推动,数字孪生技术正逐渐成为智慧城市和园区建设的重要方向。数字孪生智慧园区,以数字孪生技术为驱动,通过对园区实体和虚拟环境的全面感知和深度理解,为园区管理者和入驻企业提供智能化决策支持…

微信发红包,有哪些测试点

1、功能 1.在红包钱数,和红包个数的输入框中只能输入数字 2.红包里最多和最少可以输入的钱数 200 0.01 3.拼手气红包最多可以发多少个红包 100 3.1超过最大拼手气红包的个数是否有提醒 4.当红包钱数超过最大范围是不是有对应的提示 5.当发送的红包个数超过…

YOLOv5改进之ShuffleNetV2

目录 一、原理 网络结构 二、代码 三、应用到YOLOv5 一、原理

linux 之iptables

1.iptables防火墙基本介绍 Linux系统的防火墙:IP信息包过滤系统,它实际上由两个组件 netfilter和 iptables 组成。 主要工作在网络层,针对IP数据包。体现在对包内的IP地址、端口、协议等信息的处理上。 iptables由软件包iptables提供的命令…

量子计算:探索未来的计算技术

量子计算:探索未来的计算技术 引言 在过去的几十年里,我们见证了计算机技术从简单的计算和存储发展到复杂的数据处理和人工智能的飞速进步。然而,随着我们进一步探索科技的前沿,传统的计算方法开始显示出其局限性。在这种情况下,量子计算——一种基于量子力学原理的新型计…

案例,linux环境下OpenCV+Java,实现证件照在线更换背景色

先看效果(图片来自网络,如有侵权,请联系作者删除) 主要是通过java实现的,linux环境编译安装opencv及证件照背景色更换的核心算法在前面一篇文章中有写到。 目前算法还有瞎呲,当照片光线不均的时候会出现误…

【JavaEE初阶】死锁问题

目录 一、死锁的三种典型场景 1、一个线程,一把锁 2、两个线程,两把锁 3、N个线程,M把锁 死锁,是多线程代码中的一类经典问题。我们知道加锁是能解决线程安全问题的,但是如果加锁的方式不当,就可能产生死…

工会排队奖励模式:创新营销策略,实现共赢局面

在当今的商业环境中,创新营销策略的重要性日益凸显。工会排队奖励模式作为一种新型的营销策略,旨在通过结合线上和线下消费,激励消费者购买产品或服务,并获得返现奖励。这种模式通过将消费者的支出和商家的抽成资金纳入奖金池&…

CH58x-BLE 程序阅读笔记

CH58x-BLE 程序阅读笔记 1. 广播1.1 广播类型设置1.2 广播数据长度 2. MTU设置2.1 CH58x 蓝牙协议栈支持有效最大MTU为247 1. 广播 1.1 广播类型设置 1.2 广播数据长度 1) GAP-广播数据(最大大小31字节,但最好保持较短以节省广告时的电量&a…

Linux 磁盘挂载

一、查看挂载点 df -h 二、查看磁盘信息 fdisk -l 下面红色的这一块就是未分区的磁盘 三、 进行磁盘分区 fdisk /dev/sdb /dev/sdb :是上面fdisk -l查询出来未分区的磁盘地址 根据提示输入m获取命令 四、执行命令,创建一个分区 1、新建分区&#…

【前端】three.js

文章目录 概述three.js-master目录结构Threejs 的基本要素场景相机透视相机正交相机 网格2d3d 灯光AmbientLight(环境光)平行光(DirectionalLight)点光源(PointLight)聚光灯(SpotLight) 渲染器 Threejs 的实…

WordPress更改文章分类插件

当WP网站内容比较多的时候,有时候如果涉及到批量修改文章分类,如果一个个的去操作的话就太费事了,如果使用后台批量修改分类的话是增加旧分类不会取消选择,就就导致我们适得其反还需要一个一个的去编辑取消,实在繁琐了…

Java高级技术(单元测试)

一,概括 二,junit 三,案例 (1),实验类 package com.bilibili;public class Name {public static void main(String name) {if (name null){System.out.println("0");return;}System.out.print…

PC端数据列表有头像显示头像,没有头像显示名字的第一个字

PC端数据列表有头像显示头像&#xff0c;没有头像显示名字的第一个字 .charAt(0) 是 JavaScript 字符串对象的方法&#xff0c;用于获取字符串的第一个字符。 字符串中的字符位置是从 0 开始的&#xff0c;所以.charAt(0) 就表示获取字符串的第一个字符。 <el-table ref&qu…

哈希思想应用【C++】(位图,布隆过滤器,海量数据处理面试题)

目录 一&#xff0c;位图 1. 位图概念 2.实现 3. 测试题 位图的优缺点 二&#xff0c;布隆过滤器 1). 布隆过滤器提出 2). 概念 3). 布隆过滤器的查找 4). 布隆过滤器删除(了解) 5). 布隆过滤器优点 6). 布隆过滤器缺陷 三&#xff0c;海量数据面试题 1&#xff…

java开发必备的Tomcat-servlet-http和spring boot基础入门

tomcat 介绍 概念&#xff1a; Tomcat是一个开源免费的轻量级Web服务器&#xff0c;是Apache软件基金会的核心项目&#xff0c;支持Servlet/JSP少量JavaEE(JakartaEE)规范。 JavaEE&#xff1a;Java Enterprise Edition&#xff0c;Java企业版。指Java企业级开发的技术规范总和…

Testlink 1.9.20+phpstudy_pro安装遇到的问题

phpstudy_pro启动了Apache2.4.39和Mysql5.7.26,php的版本是7.3.4zai。 安装Testlink 1.9.19时没有数据库的问题&#xff0c;安装Testlink 1.9.20时遇到了数据库问题&#xff0c;如下图所示&#xff1a; 网上搜索“Failed!Mysql Database cannnot be used”&#xff0c;给出的…

STM32开发学习(地址映射)

LED灯代码&#xff1a; #define PERIPH_BASE ((unsigned int)0x40000000)#define AHB1PERIPH_BASE (PERIPH_BASE 0x00020000)#define GPIOF_BASE (AHB1PERIPH_BASE 0x1400)#define GPIOF_MODER *(unsigned int*)(GPIOF_BASE0x00) #define GPIOF_BSRR *(uns…

Linux下Docker 离线安装详细步骤,亲测成功

1.离线原因&#xff1a;公司新创不能使用开元linux&#xff0c;使用了一个变种centOS&#xff0c;致使yum被禁 2.步骤&#xff1a; 2.1 下载docker tar包&#xff0c;下载地址&#xff1a;Index of linux/https://download.docker.com/linux/ 2.2 新建自己的软件目录&am…

大数据之HBase

HBase介绍 Apache的三篇论文&#xff0c;GFS谷歌文件系统->HDFS&#xff1b;MR -> MR ; BigTable ->HBase;HBase是hadoop数据库&#xff0c;一种分布式、可扩展的大数据NoSQL数据库之一。适合对于大量数据进行随机、实时的读写操作 HBase数据模型 Bigtable是一个稀…