DeepSeek-Coder-v2击败GPT-4 Turbo,成为竞技场最强开源编码模型!

目录

01 编码与数学击败GPT-4 Turbo

02 深度求索:价格战的导火索




就在刚刚,竞技场排名再次刷新:

深度求索的DeepSeek-Coder-v2成为竞技场最强开源编码模型!

它在Coding Arena中已攀升至第4名,水平接近GPT-4 Turbo。





没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:
升级ChatGPT-4o Turbo步骤icon-default.png?t=N7T8https://www.zhihu.com/pin/1768399982598909952

在编码领域的整体性能评估中,DeepSeek-Coder-v2的评分和稳定性均位于前10,超越了智谱GLM-4、Llama-3等一众知名开源模型。

据了解,完全开源的DeepSeek-Coder-v2现提供236B和16B两种参数规模,支持338种编程语言和128K上下文长度。


而且就在Claude 3.5 Sonnet发布同日,深度求索官网的代码助手也第一时间上线了类似“Artifacts”的功能(自动生成代码并直接在浏览器上运行)。

例如,DeepSeek-Coder-v2可以直接生成经典游戏——扫雷。


网页设计:

总之,DeepSeek-Coder-v2尤为擅长编码和数学。



01 编码与数学击败GPT-4 Turbo



深度求索于上周发布了DeepSeek-Coder-v2,它在编码和数学方面击败了GPT-4 Turbo。



在Arena-Hard-Auto排行榜上,DeepSeek-Coder-v2超过了Yi-large、Claude3-Opus、GLM-4和Qwen2-72B。


 

同时,DeepSeek-Coder-v2还具有良好的通用性能,在推理和中英通用能力上位列国内第一梯队。


现在,仅过去一周时间,DeepSeek-Coder-v2正式登顶竞技场最强开源编码模型。

随着这一登顶,其背后的公司深度求索再次引人关注。

老实说,这家公司一直很有看点。

与月之暗面、智谱AI、Minimax、百川智能等获得大厂投资的AI初创公司不同,深度求索由一家搞私募量化的投资基金发起。

当同行都在寻找AI应用落地时,深度求索却喊出了“不做应用做研究”的口号。

短短半年时间,它发布并开源了多个百亿级参数的大模型。

甚至仅凭一己之力点燃了大模型价格战的第一把火。

02 深度求索:价格战的导火索

深度求索由知名私募巨头幻方量化于2023年4月创立。

早在2019年,幻方就发布了自研深度学习训练平台“萤火一号”。据称该项目总投资近2亿元,共搭载了1100块GPU。

后来“萤火一号”升级为“二号”,搭载的GPU数量达到了约1万张。这意味着,单从算力看,幻方甚至比很多大厂都更早拿到了做ChatGPT的入场券。

去年11月,深度求索发布了第一代大模型DeepSeek Coder,免费商用,完全开源。紧接着12月,它又发布了参数670亿的DeepSeek,主打发布即开源。

今年5月初,深度求索宣布开源第二代MoE大模型DeepSeek-V2。没错,就是那个“性能比肩GPT-4 Turbo,价格却只有GPT-4百分之一”的模型。

DeepSeek-V2推出后,深度求索一度被AI圈称作“价格屠夫”,被认为是引爆大模型价格战的导火索之一。

此外,它还推出了专为视觉与语言理解应用设计的DeepSeek-VL系列大模型。

总之,这家公司一直被视为可能改变国内AI市场格局的“黑马”。

Anthropic联合创始人Jack Clark曾表示:

“DeepSeek组建了一支团队,他们对训练雄心勃勃的模型所需的基础设施有着深刻的理解。中国制造也将成为AI模型的发展趋势。”

面对竞技场最新排名,网友们纷纷猜测新王Claude 3.5 Sonnet在编码上的表现究竟如何。


如何使用WildCard正确方式打开GPT-4o,目前 WildCard 支持的服务非常齐全,可以说是应有尽有!

官网有更详细介绍:WildCard



推荐阅读:


超越GPT-4o!新王Claude 3.5 Sonnet来啦!免费使用

CVPR‘24 最佳学生论文,从灵感到成稿仅用一个月,源自业余创意!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/34345.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Latex学习之“usefont”用法

Latex学习之“\usefont”用法 一、通俗的解释 \usefont 是 LaTeX 中的一个命令,用于在文档中临时改变字体,其基本语法如下: \usefont{字体编码}{字体族}{字体系列}{字体形状}这样看起来好像蛮抽象,你可能以及晕了,什…

Arduino称重传感器和 HX711 放大器(数字秤)

Arduino称重传感器和 HX711 放大器(数字秤) Arduino with Load Cell and HX711 Amplifier (Digital Scale) In this guide, you’ll learn how to create a digital scale with the Arduino using a load cell and the HX711 amplifier. First, you’l…

Redis-使用 jedis 操作数据

文章目录 1、Jedis简介2、环境准备3、创建maven普通项目,导入如下依赖4、测试JAVA程序和Redis之间的通信 1、Jedis简介 "Jedis" 通常是作为 "Java Redis" 的缩写或简称来理解的。Java Embedded Data Structures Interface 表示 Java嵌入式数据结构接口 2、…

高德行政区查询-综合省市县三级选择跳转

一、需求: 需要使用高德地图进行省市县的一个选择,每选择一次就在地图上对选择的省市县进行定位并画出该区域的范围。 最终效果: 二、准备工作 高德的API的key:两种 三、完整页面代码 综合的是这两篇中的内容(不…

19、删除链表的倒数第

1、题目描述 给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 示例 1: 输入:head [1,2,3,4,5], n 2 输出:[1,2,3,5]示例 2: 输入:head [1], n 1 输出:[]示例 …

Vue3从入门到精通

文章目录 前言为什么选择Vue框架Vue是什么?为什么要学习Vue? Vue简介Vue API风格选项式API(Options API)组合式API(Composition API) Vue开发前的准备创建Vue项目 Vue项目目录结构![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/0400cdd482704d4d9ffa8a3a6687b12…

什么是档案业务建设评价

档案业务建设评价是对档案管理机构或部门在档案业务建设方面进行的评估和考核。评价主要根据一定的评价标准和指标,对档案业务的各个方面进行综合评估,包括档案收集、整理、保管、利用等环节,以及档案管理机构的组织管理、技术能力等方面。 评…

猫头虎 分享已解决Error || API Rate Limits: HTTP 429 Too Many Requests

猫头虎 分享已解决Error || API Rate Limits: HTTP 429 Too Many Requests 🐯 摘要 📄 大家好,我是猫头虎,一名专注于人工智能领域的博主。在AI开发中,我们经常会遇到各种各样的错误,其中API Rate Limits…

Redis-笔记(视频摘抄:哔哩哔哩博主(感谢!)-遇见狂神)

Redis(缓存数据库,有效控制查询)是非关系型数据库 缓存穿透、缓存击穿,缓存雪崩 Nosql概述 为什么使用NoSQL 大数据时代,那么什么是大数据,大数据就是一般的数据库没有办法进行分析处理,其中…

Web 应用开源项目大全

Web 应用开源项目大全结合巴比达内网穿透实现WEB公开访问。 下面是一个Web应用的开源列表。没什么可说的,太疯狂了。尤其是Web 2.0那一堆。我不知道你怎么想,有些开源项目的源码写得挺不好的,尤其是性能方面。或许你会以为改一改他们就可以成…

python turtle 画帕恰狗

先上个图给大家看看 代码 ##作者V w1933423 import turtle turtle.bgcolor("#ece8dc") turtle.setup(600,900) p turtle.Pen() p.pensize(14) p.speed(5) p.color("black")p.penup() p.goto(-54,-44) p.pendown() p.goto(-37,-39) p.goto(-27,-24) p.go…

Unity如何保存玩家的数据(Unity的二进制序列化)

文章目录 什么是二进制序列化读写文件构造函数 自定义二进制序列化 什么是二进制序列化 Unity中的二进制序列化是一种将游戏对象或数据结构转换为二进制格式的过程,以便于存储或网络传输。这使数据能够以高效的方式保存,同时在需要时可以被正确地恢复&a…

太全了吧?CISP全类别详细介绍,看完不迷惑

今天聊聊CISP,注册信息安全专业人员证。 很多人以为说CISP就是个证书,没这么简单,这里面区别可大了。 CISP根据工作领域和实际岗位需要,分为综合型、攻防领域、IT审计、软件开发、数据治理、电子取证和云安全领域等17项证书。 这么…

怎么样才能踏入机器视觉这个行业?

机器视觉从业的定位层次: 00001. 底层算法开发 00002. 应用软件开发 00003. 视觉系统集成 00004. 视觉系统使用刚好我有一些资料,是我根据网友给的问题精心整理了一份「机器视觉的资料从专业入门到高级教程」, 00005. 点个关注在评论区回…

[FreeRTOS 功能应用] 信号量 功能应用

文章目录 一、基础知识点二、代码讲解三、结果演示四、代码下载 一、基础知识点 [FreeRTOS 基础知识] 信号量 概念 [FreeRTOS 内部实现] 信号量 [FreeRTOS 内部实现] 创建任务 xTaskCreate函数解析 本实验是基于STM32F103开发移植FreeRTOS实时操作系统,信号量实战…

this.$prompt 提示框增加文本域并修改文本域高度

2024.06.24今天我学习了如何对提示框增加文本域的方法&#xff0c;效果如下&#xff1a; 代码如下&#xff1a; <script>methods:{reject_event(){this.$prompt(驳回内容, 提示, {confirmButtonText: 确定,cancelButtonText: 取消,inputType: textarea,inputPlaceholder…

计算机网络(数据链路层)

数据链路层概述 数据链路层位于计算机网络的低层&#xff0c;且在物理层之上&#xff0c;数据链路层使用的信道主要有以下两种类型。 &#xff08;1&#xff09;点对点通信。在信道上使用一对一的点对点通信。 &#xff08;2&#xff09;广播信道。这种信道使用一对多的广播通…

【linux】详解——库

目录 概述 库 库函数 静态库 动态库 制作动静态库 使用动静态库 如何让系统默认找到第三方库 lib和lib64的区别 /和/usr/和/usr/local下lib和lib64的区别 环境变量 配置相关文件 个人主页&#xff1a;东洛的克莱斯韦克-CSDN博客 简介&#xff1a;C站最萌博主 相关…

DDK电通拧紧MFC-S060控制器过流维修

一、DDK伺服拧紧轴控制器过流故障的成因 1. 电源电压过低&#xff1a;当电源电压过低时&#xff0c;控制器可能会出现过流现象。 2. 负载过大&#xff1a;当负载过大时&#xff0c;DDK电通拧紧机控制器MFC-S060的电流也会随之增大&#xff0c;可能导致过流故障。 3. 控制器内部…

开箱即用:一个易用的开源表单工具!【送源码】

随着互联网的普及&#xff0c;表单应用场景越来越广泛&#xff0c;从网站注册、调查问卷到考试测评&#xff0c;无处不在。传统的表单制作方式需要一定的代码基础&#xff0c;对于不懂编程的小伙伴来说&#xff0c;无疑是一道门槛。 今天&#xff0c;给大家分享一款开源的表单…