DeepSeek-Coder-v2击败GPT-4 Turbo,成为竞技场最强开源编码模型!

目录

01 编码与数学击败GPT-4 Turbo

02 深度求索:价格战的导火索




就在刚刚,竞技场排名再次刷新:

深度求索的DeepSeek-Coder-v2成为竞技场最强开源编码模型!

它在Coding Arena中已攀升至第4名,水平接近GPT-4 Turbo。





没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:
升级ChatGPT-4o Turbo步骤icon-default.png?t=N7T8https://www.zhihu.com/pin/1768399982598909952

在编码领域的整体性能评估中,DeepSeek-Coder-v2的评分和稳定性均位于前10,超越了智谱GLM-4、Llama-3等一众知名开源模型。

据了解,完全开源的DeepSeek-Coder-v2现提供236B和16B两种参数规模,支持338种编程语言和128K上下文长度。


而且就在Claude 3.5 Sonnet发布同日,深度求索官网的代码助手也第一时间上线了类似“Artifacts”的功能(自动生成代码并直接在浏览器上运行)。

例如,DeepSeek-Coder-v2可以直接生成经典游戏——扫雷。


网页设计:

总之,DeepSeek-Coder-v2尤为擅长编码和数学。



01 编码与数学击败GPT-4 Turbo



深度求索于上周发布了DeepSeek-Coder-v2,它在编码和数学方面击败了GPT-4 Turbo。



在Arena-Hard-Auto排行榜上,DeepSeek-Coder-v2超过了Yi-large、Claude3-Opus、GLM-4和Qwen2-72B。


 

同时,DeepSeek-Coder-v2还具有良好的通用性能,在推理和中英通用能力上位列国内第一梯队。


现在,仅过去一周时间,DeepSeek-Coder-v2正式登顶竞技场最强开源编码模型。

随着这一登顶,其背后的公司深度求索再次引人关注。

老实说,这家公司一直很有看点。

与月之暗面、智谱AI、Minimax、百川智能等获得大厂投资的AI初创公司不同,深度求索由一家搞私募量化的投资基金发起。

当同行都在寻找AI应用落地时,深度求索却喊出了“不做应用做研究”的口号。

短短半年时间,它发布并开源了多个百亿级参数的大模型。

甚至仅凭一己之力点燃了大模型价格战的第一把火。

02 深度求索:价格战的导火索

深度求索由知名私募巨头幻方量化于2023年4月创立。

早在2019年,幻方就发布了自研深度学习训练平台“萤火一号”。据称该项目总投资近2亿元,共搭载了1100块GPU。

后来“萤火一号”升级为“二号”,搭载的GPU数量达到了约1万张。这意味着,单从算力看,幻方甚至比很多大厂都更早拿到了做ChatGPT的入场券。

去年11月,深度求索发布了第一代大模型DeepSeek Coder,免费商用,完全开源。紧接着12月,它又发布了参数670亿的DeepSeek,主打发布即开源。

今年5月初,深度求索宣布开源第二代MoE大模型DeepSeek-V2。没错,就是那个“性能比肩GPT-4 Turbo,价格却只有GPT-4百分之一”的模型。

DeepSeek-V2推出后,深度求索一度被AI圈称作“价格屠夫”,被认为是引爆大模型价格战的导火索之一。

此外,它还推出了专为视觉与语言理解应用设计的DeepSeek-VL系列大模型。

总之,这家公司一直被视为可能改变国内AI市场格局的“黑马”。

Anthropic联合创始人Jack Clark曾表示:

“DeepSeek组建了一支团队,他们对训练雄心勃勃的模型所需的基础设施有着深刻的理解。中国制造也将成为AI模型的发展趋势。”

面对竞技场最新排名,网友们纷纷猜测新王Claude 3.5 Sonnet在编码上的表现究竟如何。


如何使用WildCard正确方式打开GPT-4o,目前 WildCard 支持的服务非常齐全,可以说是应有尽有!

官网有更详细介绍:WildCard



推荐阅读:


超越GPT-4o!新王Claude 3.5 Sonnet来啦!免费使用

CVPR‘24 最佳学生论文,从灵感到成稿仅用一个月,源自业余创意!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/34345.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql的information_schema浅析

information_schema 是 MySQL 中的一个虚拟数据库,它包含了关于 MySQL 服务器的所有元数据。 information_schema 作用 元数据管理:提供关于数据库、表、列、索引、权限等的信息。 性能优化:帮助了解数据库结构和索引使用情况,便…

Latex学习之“usefont”用法

Latex学习之“\usefont”用法 一、通俗的解释 \usefont 是 LaTeX 中的一个命令,用于在文档中临时改变字体,其基本语法如下: \usefont{字体编码}{字体族}{字体系列}{字体形状}这样看起来好像蛮抽象,你可能以及晕了,什…

QT中eventFilter的用途详解

QEventFilter 是 Qt 框架中的一个机制,用于拦截和处理事件。这在 Qt 的事件驱动模型中非常重要,因为它允许我们在事件到达目标对象之前捕获并处理它们。下面是对 QEventFilter 的详细解释,分为几个关键部分: 1. 事件处理机制 在…

Arduino称重传感器和 HX711 放大器(数字秤)

Arduino称重传感器和 HX711 放大器(数字秤) Arduino with Load Cell and HX711 Amplifier (Digital Scale) In this guide, you’ll learn how to create a digital scale with the Arduino using a load cell and the HX711 amplifier. First, you’l…

队列。。。

目的: 1.掌握队列存储结构的表示和实现方法。 2.掌握队列的入队和出队等基本操作的算法实现。 3.了解队列在解决实际问题中的简单应用。 要求: (1)根据输入的队列长度n和各元素值建立一个循环队…

Redis-使用 jedis 操作数据

文章目录 1、Jedis简介2、环境准备3、创建maven普通项目,导入如下依赖4、测试JAVA程序和Redis之间的通信 1、Jedis简介 "Jedis" 通常是作为 "Java Redis" 的缩写或简称来理解的。Java Embedded Data Structures Interface 表示 Java嵌入式数据结构接口 2、…

高德行政区查询-综合省市县三级选择跳转

一、需求: 需要使用高德地图进行省市县的一个选择,每选择一次就在地图上对选择的省市县进行定位并画出该区域的范围。 最终效果: 二、准备工作 高德的API的key:两种 三、完整页面代码 综合的是这两篇中的内容(不…

19、删除链表的倒数第

1、题目描述 给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 示例 1: 输入:head [1,2,3,4,5], n 2 输出:[1,2,3,5]示例 2: 输入:head [1], n 1 输出:[]示例 …

Vue3从入门到精通

文章目录 前言为什么选择Vue框架Vue是什么?为什么要学习Vue? Vue简介Vue API风格选项式API(Options API)组合式API(Composition API) Vue开发前的准备创建Vue项目 Vue项目目录结构![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/0400cdd482704d4d9ffa8a3a6687b12…

什么是档案业务建设评价

档案业务建设评价是对档案管理机构或部门在档案业务建设方面进行的评估和考核。评价主要根据一定的评价标准和指标,对档案业务的各个方面进行综合评估,包括档案收集、整理、保管、利用等环节,以及档案管理机构的组织管理、技术能力等方面。 评…

猫头虎 分享已解决Error || API Rate Limits: HTTP 429 Too Many Requests

猫头虎 分享已解决Error || API Rate Limits: HTTP 429 Too Many Requests 🐯 摘要 📄 大家好,我是猫头虎,一名专注于人工智能领域的博主。在AI开发中,我们经常会遇到各种各样的错误,其中API Rate Limits…

Redis-笔记(视频摘抄:哔哩哔哩博主(感谢!)-遇见狂神)

Redis(缓存数据库,有效控制查询)是非关系型数据库 缓存穿透、缓存击穿,缓存雪崩 Nosql概述 为什么使用NoSQL 大数据时代,那么什么是大数据,大数据就是一般的数据库没有办法进行分析处理,其中…

算法训练(leetcode)第十六天 | 530. 二叉搜索树的最小绝对差、501. 二叉搜索树中的众数、236. 二叉树的最近公共祖先

刷题记录 530. 二叉搜索树的最小绝对差递归非递归 501. 二叉搜索树中的众数*236. 二叉树的最近公共祖先 530. 二叉搜索树的最小绝对差 leetcode题目地址 如果是一颗普通树,则使用暴力求解法:遍历树并保存树种每个节点的值,排序后找差值最小…

【Unity】数据持久化 PlayerPrefs

1、PlayerPrefs是什么 是unity提供的可以用于存储读取玩家数据的公共类 2、存储相关 2.1 PlayerPrefs的数据存储类似于键值对存储一个键对应一个值 提供了存储3种数据的方法int float string 键: string类型 值: int float string对应3种API PlayerPrefs.SetInt("myAge…

Web 应用开源项目大全

Web 应用开源项目大全结合巴比达内网穿透实现WEB公开访问。 下面是一个Web应用的开源列表。没什么可说的,太疯狂了。尤其是Web 2.0那一堆。我不知道你怎么想,有些开源项目的源码写得挺不好的,尤其是性能方面。或许你会以为改一改他们就可以成…

java构造方法的重载

在java中,与普通方法一样,构造方法也可以重载,在一个类中可以定义多个构造方法,但是要求每个构造方法的参数类型或参数不同。在创建对象时,可以通过调用不同的构造方法为不同属性赋值。 示例代码如下 class Student5…

全球网络战市场规模未来十年将超过万亿元

报告称,网络战市场涉及组件、最终用户和地区,其中组件分为硬件、软件和服务,最终用户分为政府、企业和私人、航空航天和国防、BFSI(银行、金融服务和保险)、医疗保健等,地区涉及北美、欧洲、亚太地区和拉美…

python turtle 画帕恰狗

先上个图给大家看看 代码 ##作者V w1933423 import turtle turtle.bgcolor("#ece8dc") turtle.setup(600,900) p turtle.Pen() p.pensize(14) p.speed(5) p.color("black")p.penup() p.goto(-54,-44) p.pendown() p.goto(-37,-39) p.goto(-27,-24) p.go…

Unity如何保存玩家的数据(Unity的二进制序列化)

文章目录 什么是二进制序列化读写文件构造函数 自定义二进制序列化 什么是二进制序列化 Unity中的二进制序列化是一种将游戏对象或数据结构转换为二进制格式的过程,以便于存储或网络传输。这使数据能够以高效的方式保存,同时在需要时可以被正确地恢复&a…

太全了吧?CISP全类别详细介绍,看完不迷惑

今天聊聊CISP,注册信息安全专业人员证。 很多人以为说CISP就是个证书,没这么简单,这里面区别可大了。 CISP根据工作领域和实际岗位需要,分为综合型、攻防领域、IT审计、软件开发、数据治理、电子取证和云安全领域等17项证书。 这么…