ChatGPT3.5和4.0在官方给出的有哪些区别呢?简单罗列一下,我个人觉得官方给的都太高级,我们平时普通人很难问ChatGPT这种问题。
官方测试所涉及的能力:
- 视觉能力
- 代码能力
- 数学计算能力
- 工具使用能力
- 与人的交互能力
- 人类专业考试的能力
视觉能力
GPT-4比3.5多的一个能力能力是它从纯文本中产生了视觉概念,比如可以文生图,比如你让ChatGPT根据你的描述生成一个帅哥还是美女,GPT-4就可以,但ChatGPT没有这种能力。
这个测试方法是让模型用SVG(一种简易的图像格式)生成“汽车”、“卡车”、“猫”和“狗”。GPT-4和ChatGPT生成的图像如下:
GPT-4生成的汽车、卡车、猫和狗
ChatGPT生成的汽车、卡车、猫和狗
还有一个用24个英文字母画人物的例子:
GPT-4生成的字母人物
ChatGPT生成的字母人物
结论:ChatGPT对图像基本没有概念。
与人类交互的能力
官方的案例是看一段文字做阅读理解,翻译成中文大概意思如下:
Mark:我不喜欢你昨晚对Jack的方式。
Judy:你没看到做了什么?他打了他兄弟的头!
Mark:但那不是你对他大吼大叫的理由
Judy:那你希望我怎么做?让他痛打他的兄弟而我什么都不说?
Mark:不是。
Judy:那你为什么替他说话?
问题:Mark的意图可能是什么?
GPT-4的回答是:Mark的意图是表达他对Judy处理Jack方式的不满。他希望Judy能够更加冷静和礼貌。
ChatGPT的回答是:Mark的意图是为Jack的行为辩护,并表达他对Judy处理方式的异议。
第二个问题是:Judy是如何接纳Mark意见的?
GPT-4的回答是:Judy认为Mark抨击了对她教养小孩的方法和缺少同理心。她很生气,并且质疑Mark的动机。
ChatGPT只回答:Judy不同意Mark的观点。
单从结果来看GPT-4是不是更合理。在理解人的意图上,GPT-4有碾压性的优势。
其他例子不举了,我觉得离我们普通人很远,我们如果想用GPT-4很大程度上是看上了文生图,以及后面可能先给PLUS用户使用的Sora(文生视频能力),以及与人类交互的能力,GPT-4的推理能力更强,是你的知己那么回答你的问题更可能接近你要的答案。
如果你想用文生图,或者你和ChatGPT打交道更多场景下需要与人类交互的能力,或者你需要一些文字生成流程图的案例就选择GPT-4,如果想升级GPT-4参考:https://aliyuntm.com/chatgpt/how-to-update-gpt4.html
最后以终为始来看,结论如果你用ChatGPT每个月给你带来的收益大于$20,那么你无脑升级GPT-4,如果你打开的次数一个月两三次,日常简单搜索下问题,那么ChatGPT3.5完全够用,没必要升级。