大语言模型通用能力排行榜(2024年11月8日更新)

数据来源SuperCLUE

榜单数据为通用能力排行榜

排名

模型名称

机构

总分

理科

文科

Hard

使用方式

发布日期

-

o1-preview

OpenAI

75.85

86.07

76.6

64.89

API

2024年11月8日

-

Claude 3.5 Sonnet(20241022)

Anthropic

70.88

82.48

76.56

53.6

POE

2024年11月8日

-

ChatGPT-4o-latest

OpenAI

70.85

84.65

77.1

50.8

API

2024年11月8日

🏅

GLM-4-Plus

智谱AI

69.64

81.41

76.44

51.08

API

2024年11月8日

🏅

SenseChat 5.5

商汤

69

81.17

76.67

49.16

API

2024年11月8日

🏅

AndesGPT-2.0

OPPO

68.91

81.46

76.61

48.64

API

2024年11月8日

🏅

Qwen2.5-72B-Instruct

阿里巴巴

68.9

83.12

76.96

46.64

API

2024年11月8日

-

Claude 3.5 Sonnet(20240620)

Anthropic

68.23

81.68

76.54

46.48

poe

2024年11月8日

-

Gemini-1.5-Pro-002

Google

68.19

80.42

76.32

47.82

API

2024年11月8日

-

Qwen-max-0919

阿里巴巴

68

83.03

76.5

44.48

API

2024年11月8日

-

GPT-4-Turbo-2024-04-09

OpenAI

67.48

80.78

74.85

46.82

API

2024年11月8日

🥈

Hunyuan-Turbo

腾讯

67.35

81.47

76.84

43.74

API

2024年11月8日

🥈

360gpt2-pro

360

67.19

82.95

74.94

43.68

API

2024年11月8日

🥈

Step-2-16k

阶跃星辰

67.02

80.52

76.65

43.91

API

2024年11月8日

🥈

DeepSeek-V2.5

深度求索

66.87

81.69

75.42

43.5

API

2024年11月8日

🥈

Doubao-pro-0828

字节跳动

66.43

79.98

75.1

44.22

API

2024年11月8日

🥉

Baichuan4

百川智能

66.28

81.81

75.94

41.1

API

2024年11月8日

🥉

山海大模型4.0

云知声

66.26

80.05

75.38

43.34

API

2024年11月8日

🥉

TeleChat2-Large

TeleAI

66.23

78.85

75.54

44.28

API

2024年11月8日

-

Llama-3.1-405B-Instruct

Meta

65.84

80.54

71.53

45.46

API

2024年11月8日

4

Ernie-4.0-turbo-8k-preview

百度

64.93

78.69

74.4

41.7

API

2024年11月8日

-

GPT-4o-mini

OpenAI

64.85

79.84

73.24

41.46

API

2024年11月8日

4

Moonshot(kimi)

月之暗面

63.93

74.37

75.08

42.34

网页

2024年11月8日

5

Sky-Chat-3.0

昆仑万维

62.64

74.32

75.46

38.12

API

2024年11月8日

5

TeleChat2-35B

TeleAI

62.46

74.07

74.05

39.26

模型

2024年11月8日

-

Llama-3.1-70B-Instruct

Meta

61.62

77.52

69.64

37.7

API

2024年11月8日

6

Qwen2.5-7B-Instruct

阿里巴巴

60.61

74.62

73.28

33.92

API

2024年11月8日

-

Llama-3.2-90B-Instruct

Meta

60.58

75.89

69

36.84

API

2024年11月8日

7

讯飞星火V4.0

科大讯飞

59.4

72.49

71.55

34.16

API

2024年11月8日

8

GLM-4-9B-Chat

智谱AI

56.83

69.22

71.94

29.32

模型

2024年11月8日

-

Gemma-2-9b-it

Google

55.48

67.78

69.62

29.02

模型

2024年11月8日

9

MiniCPM3-4B

面壁智能

53.16

63.04

69.87

26.56

模型

2024年11月8日

-

Llama-3.1-8B-Instruct

Meta

51.42

63.27

65.3

25.69

API

2024年11月8日

10

Yi-1.5-9B-Chat-16K

零一万物

51.37

59.2

67.86

27.06

模型

2024年11月8日

-

Llama-3.2-11B-Instruct

Meta

50.61

63.1

64.02

24.72

API

2024年11月8日

11

Yi-1.5-6B-Chat

零一万物

48.69

57.03

63.89

25.16

模型

2024年11月8日

12

Qwen2.5-1.5B-Instruct

阿里巴巴

43.92

46.14

64.54

21.1

API

2024年11月8日

-

Gemma-2-2b-it

Google

42.25

43.36

63.72

19.67

模型

2024年11月8日

-

Phi-3-Mini-4K-Instruct

微软

39.98

52.28

44.75

22.9

模型

2024年11月8日

-

Mistral-7B-Instruct-v0.3

Mistral AI

37.11

41.06

51.21

19.05

模型

2024年11月8日

13

Baichuan2-7B-Chat

百川智能

33.59

28.46

58.09

14.22

模型

2024年11月8日

13

Qwen2.5-0.5B-Instruct

阿里巴巴

32.85

30.53

54.13

13.9

API

2024年11月8日

13

RWKV-6-World-7B

RWKV

32.76

27.46

58.05

12.76

模型

2024年11月8日

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/61012.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt 5.6.3 手动配置 mingw 环境

- 安装 qt 5.6.3 mingw 版 - 打开 qt creator - 找到选项 工具 - 选项- 构建和运行 - 找到 “编译器” 选项卡 ,点击 "添加" “编译器路径” 设置为 qt 安装目录下, tool 文件夹内的 g.exe 设置完成后,点击 "apply" ,使选项生…

k8s上部署redis高可用集群

介绍: Redis Cluster通过分片(sharding)来实现数据的分布式存储,每个master节点都负责一部分数据槽(slot)。 当一个master节点出现故障时,Redis Cluster能够自动将故障节点的数据槽转移到其他健…

抖音热门素材去哪找?优质抖音视频素材网站推荐!

是不是和我一样,刷抖音刷到停不下来?越来越多的朋友希望在抖音上创作出爆款视频,但苦于没有好素材。今天就来推荐几个超级实用的抖音视频素材网站,让你的视频内容立刻变得高大上!这篇满是干货,直接上重点&a…

Dify 通过导入 DSL 文件创建 Workflow 过程及实现

本文使用 Dify v0.9.2 版本,主要介绍 Dify 通过导入 DSL(或 URL)文件创建(或导出)Workflow 的操作过程及源码分析实现过程。Dify通过导入DSL文件创建Workflow过程及实现:https://z0yrmerhgi8.feishu.cn/wik…

代码随想录第46期 单调栈

这道题主要是单调栈的简单应用 class Solution { public:vector<int> dailyTemperatures(vector<int>& T) {vector<int> result(T.size(),0);stack<int> st;st.push(0);for(int i1;i<T.size();i){if(T[i]<T[st.top()]){st.push(i);}else{wh…

3步实现贪吃蛇

方法很简单&#xff0c;打开页面&#xff0c;复制&#xff0c;粘贴 一.整体思维架构 我们根据游戏的开始&#xff0c;运行&#xff0c;结束&#xff0c;将整个游戏划分成三个部分。在每个部分下面又划分出多个功能&#xff0c;接下来我们就根据模块一一实现功能。 二.Gamesta…

【linux012】文件操作命令篇 - more 命令

文章目录 more 命令1、基本用法2、常见选项3、交互式键盘命令4、举例5、注意事项 more 命令 more 是 Linux 中的一个分页查看命令&#xff0c;用于逐屏显示文件内容。它特别适合用于查看较长的文件&#xff0c;与 cat 不同&#xff0c;more 不会一次性输出所有内容&#xff0c…

机器学习笔记2 - 机器学习的一般流程

image.png 1、数据基本处理 数据集的划分 根据用途可将获取到的数据划分为训练集和测试集&#xff0c;有时还会有验证集。一般而言训练集用于训练模型&#xff0c;测试集用于测试模型的效果&#xff08;泛化误差&#xff09;。严格来讲&#xff0c;测试集的数据不能直接或间接&…

《C陷阱与缺陷》

文章目录 1、【词法陷阱】1.1 符号与组成符号间的关系1.1 与 1.3 y x/*p 与 y x/(*p)&#xff0c;a-1 与 a - 1 与 a -1, 老版本编译器的处理是不同的&#xff0c;严格的ANSI C则会报错1.4 十进制的 076&#xff0c;会被处理为八进制&#xff0c;ANSI C禁止这种用法&#x…

小白快速上手 labelme:新手图像标注详解教程

前言 本教程主要面向初次使用 labelme 的新手&#xff0c;详细介绍了如何在 Windows 上通过 Anaconda 创建和配置环境&#xff0c;并使用 labelme 进行图像标注。 1. 准备工作 在开始本教程之前&#xff0c;确保已经安装了 Anaconda。可以参考我之前的教程了解 Anaconda 的下…

脑机接口、嵌入式 AI 、工业级 MR、空间视频和下一代 XR 浏览器丨RTE2024 空间计算和新硬件专场回顾

这一轮硬件创新由 AI 引爆&#xff0c;或许最大受益者仍是 AI&#xff0c;因为只有硬件才能为 AI 直接获取最真实世界的数据。 在人工智能与硬件融合的新时代&#xff0c;实时互动技术正迎来前所未有的创新浪潮。从嵌入式系统到混合现实&#xff0c;从空间视频到脑机接口&…

【STM32】MPU6050简介

文章目录 MPU6050简介MPU6050关键块带有16位ADC和信号调理的三轴MEMS陀螺仪具有16位ADC和信号调理的三轴MEMS加速度计I2C串行通信接口 MPU6050对应的数据手册&#xff1a;MPU6050 陀螺仪加速度计 链接: https://pan.baidu.com/s/13nwEhGvsfxx0euR2hMHsyw?pwdv2i6 提取码: v2i6…

ISP——你可以从这里起步(二)

接上一篇&#xff0c;上一篇是原理篇&#xff0c;这一篇是实战篇&#xff0c;为了实现下面框图中的不完美ISP。 第一章 做一张RAW图自己用 不是所有的人都能获得raw图&#xff0c;即使获得了raw图也需要对应的sensor参数才能把它用起来&#xff0c;所以我找了一条野路子可以把…

Istio分布式链路监控搭建:Jaeger与Zipkin

分布式追踪定义 分布式追踪是一种用来跟踪分布式系统中请求的方法&#xff0c;它可以帮助用户更好地理解、控制和优化分布式系统。分布式追踪中用到了两个概念&#xff1a;TraceID 和 SpanID。 TraceID 是一个全局唯一的 ID&#xff0c;用来标识一个请求的追踪信息。一个请求…

【论文阅读】主动推理:作为感知行为的理论

文章目录 主动推理&#xff1a;作为感知行为的理论摘要1.引言2. 主动推理的概念和历史根源3. 主动推理的规范视角—以及它的发展历程 未完待续 主动推理&#xff1a;作为感知行为的理论 Active inference as a theory of sentient behavior 摘要 这篇文章综述了主动推理的历…

【MySQL】MySQL数据库入门:构建你的数据基石

&#x1f351;个人主页&#xff1a;Jupiter. &#x1f680; 所属专栏&#xff1a;MySQL初阶探索&#xff1a;构建数据库基础 欢迎大家点赞收藏评论&#x1f60a; 目录 &#x1f985;数据库基础&#x1f400;什么是数据库&#x1f40f;主流数据库&#x1f986;MySQL数据库的基本…

6.584-Lab1:MapReduce

前置知识/概念 Raft 是一个基于“Leader”的协议&#xff0c;能够保证分布式网路的一致性。 RPC&#xff08;Remote Producer Call&#xff09; 参考链接1 参考链接2 Go中RPC的简单实现 Golang中regexp正则表达式的用法 https://gukaifeng.cn/posts/golang-zheng-ze-biao-…

抽象java入门1.5.3.1——类的进阶

前言&#xff1a;在研究神技代码Hello word的时候&#xff0c;发现了一个重大公式bug&#xff0c;在代码溯源中&#xff0c;我发现了一个奇怪的东西&#xff0c;就是OUT不是类中类&#xff08;不是常规类的写法&#xff09; 内容总结&#xff1a; 代码运行的顺序复习 正片开始…

人力资源招聘系统的革新之路:从传统到智能的转变

在全球化与数字化交织的今天&#xff0c;企业间的竞争日益激烈&#xff0c;而人才作为企业发展的核心驱动力&#xff0c;其重要性不言而喻。传统的人力资源招聘方式&#xff0c;如依赖纸质简历、人工筛选、面对面面试等&#xff0c;不仅效率低下&#xff0c;且难以精准匹配企业…

AXI DMA IP BUG踩坑记录

1. 问题描述 在突发的过程中总是一旦使用XAxiDma_SimpleTransfer函数就会出现AXI STREAM信号的READY信号先拉高4个数据(32位)的时钟后会迅速拉低,换句话说就是一旦PS端发起了XAxiDma_SimpleTransfer,AXI总线的READY信号就会拉高四个节拍,这样就会导致传输的数据出现问题。…