Claude3和GPT4哪个强?

在短短两个月内,全球最强人工智能的桂冠再次易主。

此前,Claude3 Opus以其卓越的表现超越了GPT-4,吸引了无数用户抛弃GPT,转而拥抱Claude3。然而,OpenAI近日强势回归,用实力证明了GPT依然是人工智能领域的霸主。

在最新的AI基准测试中,OpenAI布的GPT-4-Turbo-2024-04-09版本大幅超越了Claude3 Opus,重新夺回了全球第一AI的宝座。

4e50a63c992afd1bddcd955f3e7f6f27.jpeg

值得一提的是,这个版本不是一个普通的测试版本,而是作为一个正式版本GPT-4-Turbo发布的。

这也是GPT-4-Turbo系列首次发布正式版,足以看出这个版本的份量。网友甚至纷纷直接将其改名为GPT-4.5-Turbo了。

笔者第一时间通过国内最稳、更新最快的AI镜像站AskManyAI进行了GPT-4.5-Turbo体验。

36da8a8b9a26db6722ee960ef05bb031.jpeg

附AskManyAI地址(GPT-4、Claude3、Gemini都是最新版本):

https://askmanyai.cn

值得一提的是,AskManyAI的有个独特的AI混战模式,你的一个问题,可以指定多个最强的AI同时给你回答,简直就是做大模型测试的理想环境:

af380fea42f426f9bdfe164a602030c6.jpeg

好了,话不多说,我们这就开始测评了!

最新版GPT-4.5-Turbo 大战 Claude 3 Opus

代码能力测试

首先我们来看看代码debug方面的表现:

e13cde58fe9abed91c50837ba5cd241a.jpeg53ff7922e11c931787eadd0360d73f19.jpeg85f24094a335d7b26f48b999a5f5abec.jpeg

这是一个很隐蔽的bug,Claude 3 Opus完全没找到bug在哪,其实这个bug,以前的GPT-4也找不到。但是刚刚更新的这个GPT-4.5-Turbo竟然找到了bug!

而且给到了非常正确的修复bug后的代码!

简直惊呆我了,这是第一个能修复这个bug的AI。

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

科研学术能力测试

然后我们来看看专业学术问题的表现。

我们这次加大难度,上传一个生物样品图片给AI:

4840ee6a4cdf1635dd61703c23aa49a9.jpeg

然后我们在AskManyAI网站同时选中Claude、GPT和Gemini这三个地表最强的多模态AI,看他们对这个图片分析的结果:

836c19f08c7caf736e1b5b555ee42076.jpeg

结果发现,最新版的GPT-4在图片问答方面还是不如Claude-3 Opus。这方面的能力排序是 Claude-3 > Gemini Pro > GPT-4。

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

我们再换一个专业问题:

ac2fd441d72ad2069e528e7870ed54c3.jpeg

df27d9c4d5b056a96578320f1d266e14.jpeg11ef3d204e3221f7836ff5e8544d33e5.jpegac0e7e0fd7f1d4461d946d480ca2b62a.jpeg

关于Sora技术原理的解释,所有的AI中,只有最新的GPT-4没有出现知识性的错误,Kimi和Gemini的错误是最离谱的,竟然说Sora是GAN的架构。。。而Claude-3的视频片段选择这个地方的讲解出现了错误——Sora是生成式的,不是检索式的。

我猜测这可能是因为只有GPT-4的知识库已经更新到了2024年的4月份。而Sora是2月份刚发布的,所以只有GPT-4学到了这方面的知识。

最新版GPT-4完胜!

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

营销能力测试

这次测试加大难度,直接丢给AI一个产品文档PDF,让他去生成一篇营销文案和搜索SEO的标题。

3633100585d9fc23ed9d624943f380c7.jpeg

同样,这次GPT-4完胜!

AI写作能力测试

最后测试下AI写作能力!

e8e602fd3998452e4cd752b53f15a556.jpeg2f8a86957c3b220bbcacc3b72f6ad836.jpeg94360c0c9e3f67fdb7bb2f9808a98305.jpegb6465aff3853f1108c9b88225681a4b6.jpeg611496b3686f0d6b8733095e05a16c79.jpegc69ddc9b88c189b9ab6dc43e085afa6a.jpeg82bff7a1fb5cc26ed629120885877801.jpeg

写作的测试结果就要见仁见智了,每个人的看法都可能不一样。

这里面我最喜欢的是GPT-4和Claude-3写的文章,但Gemini Pro的写作速度非常快,不到5秒就写完了全篇。而GPT-4和Claude-3则写了一分钟不止。

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

好了,今天的评测就到这里了。你们更喜欢哪个AI呢?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/815818.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Jmeter杂记:测试计划参数详解

测试计划各参数详解 1,用户自定义变量,是全局变量,供所有线程组使用,可用配置元件:用户自定义变量替代 2,连续的运行线程组,默认不勾选,则随机的运行多个线程组中的取样器&#xff…

图机器学习NetworkX代码实战-创建图和可视化

完整代码见资源,下面列举了其中的几个图 安装networkX及相应工具包 pip install numpy pandas matplotlib tqdm networkx 当安装完成后,输入如下代码验证版本及是否安装成功 import networkx as nxnx.__version__ import matplotlib.pyplot as plt …

国内ai人工智能软件大全

很多人一直在寻找一个稳定且可靠的全球AI大模型测试平台,希望它不仅真实可信,而且能提供稳定、快速的服务,不会频繁出现故障或响应缓慢。迄今为止,我已经尝试了国内外至少10个不同的服务站点。不幸的是,这些站点总是存…

Linux 文件页反向映射

0. 引言 操作系统中与匿名页相对的是文件页,文件页的反向映射对比匿名页的反向映射更为简单。如果还不清楚匿名页反向映射逻辑的,请移步 匿名页反向映射 1. 文件页反向映射数据结构 struct file: 用户进程每open()一次文件,则会生…

Promise实现

Promise实现 const PENDING pending const FULFILLED fulfilled const REJECTED rejectedclass MPromise {FULFILLED_CALLBACK_LIST []REJECTED_CALLBACK_LIST []_status PENDINGconstructor(fn) {// 初始状态为pendingthis.status PENDINGthis.value nullthis.reason…

分享一个 git stash 的实际使用场景。

当我将新的变更记录提交为 git commit --amend 后,发现这需要修改云端上的提交记录,也就是 vscode 中会出现这张图 于是,我通过 git reset head^ 撤销掉刚刚的提交。 reset 前: reset 后: 但在撤销的同时&#xf…

深入理解计算机网络分层结构

一、 为什么要分层? 计算机网络分层的主要目的是将复杂的网络通信过程分解为多个相互独立的层次,每个层次负责特定的功能。这样做有以下几个好处: 模块化设计:每个层次都有清晰定义的功能和接口,使得网络系统更易于设…

解决Xshell登录云服务器的免密码和云服务器生成子用户问题

Xshell登录云服务器的免密码问题 前言一、Xshell登录云服务器的免密码操作实践 二、centos创建用户创建用户实操删除用户更改用户密码直接删除子用户 前言 Xshell登录云服务器免密码问题的解决方案通常涉及使用SSH密钥对。用户生成一对密钥(公钥和私钥)…

Spring源码刨析之配置文件的解析和bean的创建以及生命周期

public void test1(){XmlBeanFactory xmlBeanFactory new XmlBeanFactory(new ClassPathResource("applicationContext.xml"));user u xmlBeanFactory.getBean("user",org.xhpcd.user.class);// System.out.println(u.getStu());}先介绍一个类XmlBeanFac…

Linux —— FTP服务【从0-1】

目录 一、介绍 1.概述 2.FTP的传输模式 PORT 主动模式 PASV 被动模式 3.FTP服务的作用 二、搭建FTP服务器 FTP服务端配置 1.安装vsftpd文件服务 2.启动服务 3.防火墙配置 4.FTP服务相关文件说明 FTP客户端配置 1.安装FTP客户端工具 lftp 2.访问FTP服务器 Linux系…

探索量子计算:打开未来技术的大门

在科技领域,每一次技术革命都能开启新的可能性,推动人类社会进入一个新的时代。当前,量子计算作为一种前沿技术,正引领着下一轮科技革命的浪潮。本文将深入探索量子计算的奥秘,解析其工作原理,并通过一个简…

Windows10/11 重装之后,刷新原来的文件夹里的用户权限

将 d:\* 下所有文件的所有者,更改为Administrator takeown /F d:\WorkSpaces\* /R /A 赋予system、Administrator、Authenticated Users所有控制访问权限。可以自己改用户,删掉对应的即可 icacls d:\* /grant System:(F) /grant Administrator:(F) …

子集和问题(c++题解)

题目描述 子集和问题的一个实例为〈S,t〉。其中,S{ x1, x2,…, xn}是一个正整数的集合,c是一个正整 数。子集和问题判定是否存在S的一个子集S1,使得子集S1和等于c。 对于给定的正整数的集合S{ x1&#xf…

深度学习图像处理基础工具——opencv 实战2 文档扫描OCR

输入一个文档,怎么进行文档扫描,输出扫描后的图片呢? 今天学习了 opencv实战项目 文档扫描OCR 问题重构:输入图像 是一个含有文档的图像——> 目标是将其转化为 规则的扫描图片 那么怎么实现呢? 问题分解&#…

ELFK日志分析系统

目录 1. Elasticsearch 特点和功能: 使用场景: Elasticsearch 结构和术语: 2. Logstash Logstash 的特点和功能: Logstash 工作流程: Logstash 的插件(Plugin): 3. Kibana …

Go 之常见的几种设计模式

学一学Go中常见的几种设计模式和对应的示例 单例模式 确保一个类型只有一个实例,同时提供一个全局访问点。 package mainimport "fmt"type Singleton struct {data string }var instance *Singletonfunc GetInstance() *Singleton {if instance nil {…

Python 复杂密码图形化生成工具,支持选择生成10位和12位复杂密码(初版)

代码 #!/usr/bin/env python # -*- coding: utf-8 -*- # Time : 2024/3/26 15:22 # Author : wyq # File : 部署测试.py import random import string from tkinter import *def generate_password(length):characters string.ascii_letters string.digits string.p…

HTML:链接

目录 一、超链接 二、 外联元素 一、<a>超链接 <a> 标签用于定义超链接&#xff0c;超链接可以让用户从一个网页跳转到另一个网页。 常用属性&#xff1a; href指定链接的目标地址。download表示链接是一个下载链接&#xff0c;指定下载的文件名。target 指定在…

JavaScript扩展运算符...的实现原理

… 作用 扩展运算符&#xff08;spread&#xff09;是三个点&#xff08;…&#xff09;&#xff0c;用于取出参数对象中的所有可遍历属性&#xff0c;浅拷贝到当前对象之中。 常见用法 1.浅拷贝数组 const a1 [test1, test2]; const a2 [...a1];a2[0] test2; a2 // [te…

【vue】Vue3开发中常用的VSCode插件

Vue - Official&#xff1a;vue的语法特性&#xff0c;如代码高亮&#xff0c;自动补全等 Vue VSCode Snippets&#xff1a;自定义一些代码片段 v3单文件组件vdata数据vmethod方法 别名路径跳转 参考 https://www.bilibili.com/video/BV1nV411Q7RX