全球最强开源AI大模型来了!Databricks称DBRX吊打Llama 2和GPT-3.5

美国AI初创公司Databricks公布,在语言理解、编程和数学方面,其将开源的模型DBRX的测试得分均高于GPT-3.5、Mixtral、Meta的Llama 2-70B、马斯克旗下xAI的Grok-1。作为混合专家模型,DBRX的输出token速度高Llama 2一筹。

全球最强大的开源人工智能大语言模型将要易主

美国AI初创公司Databricks加州当地时间3月27日周三公布,该司Mosaic Research团队开发的通用LLM DBRX将开源。DRBX由Databricks耗时几个月、投入约1000万美元训练打造,设计类似于OpenAI的ChatGPT。Databricks将根据一种开源许可证发布DBRX。

模型综合表现

Databricks的首席神经网络架构师兼开发DBRX团队负责人Jonathan Frankle声称,DBRX超越了其他任何开源模型。他分享的数据显示,包括回答一般知识问题、进行阅读理解、解决逻辑难题和生成高质量代码等在内,在衡量AI模型能力的约十几个基准测试中,DBRX的表现都优于现有的一切开源模型。

Databricks在公司博客文章中介绍,DBRX在语言理解、编程、数学和逻辑方面轻松击败了Meta的Llama 2-70B、法国MixtralAI公司的Mixtral 和 马斯克旗下xAI开发的Grok-1这类当前流行的开源模型。Databricks的开源基准指标 Gauntlet 包含了30 多种不同的最先进模型(SOTA) 基准指标测试,DBRX的测试性能均优于前述三种大模型。

模型性能分析

下图可见,在语言理解方面,DBRX的分值为73.7%,高于GPT-3.5的70.0%;在编程能力方面,DBRX的得分70.1%远超GPT-3.5的48.1%,在数学方面,DBRX的得分66.9%也高于GPT-3.5的57.1%。

DBRX的大多数基准指标表现也强于GPT-3.5

Databricks认为,这点很重要,因为上个季度该司发现,1.2万余名客户的行为发生了重大转变。企业和组织越来越多地用开源模型取代专有模型提高效率和控制力。根据Databricks的经验,许多客户可以通过根据特定的任务定制开源模型,这种量身定制的模型在质量和速度方面都能超越专有模型。

模型的语言理解能力

下图可见,在语言理解方面,DBRX的分值为73.7%,高于Llama 2-70B的69.8%、Mixtral的71.4%和Grok-1的73.0%;在编程能力方面,DBRX的得分70.1%远超Llama 2-70B的32.3%、Mixtral的54.8%和Grok-1的63.2%,在数学方面,DBRX的得分为66.9%,也高于Llama 2-70B的54.1%、Mixtral的61.1%和Grok-1的62.9%。

Databricks介绍,DBRX 是一个基于 MegaBlocks 研究和开源项目构建的混合专家模型(MoE),因此每秒输出token的速度极快。Databricks相信,这将为 MoE 未来最先进的开源模型铺平道路。因为 MoE 本质上可以让用户训练更大的模型,并以更快的吞吐量提供服务。DBRX在任何给定时间内仅使用 360亿个参数。但模型本身有 1320 亿个参数,在速度(token/秒)与性能(质量)方面可以鱼与熊掌兼得。

下图可见DBRX和Llama 2-70B在收到编程方面具体任务指令时的反馈对比,DBRX的反应速度,即输出token超过了Llama 2-70B。

行业评论

有评论认为,在目前生成式AI热潮中最富盛名的那些公司兑他们LLM的代码严格保密,比如OpenAI和谷歌,DBRX开源意味着,Databricks为挑战这种做法的努力添了一把火。

Databricks 表示,还希望公开创建其开源模型所涉及的工作。这比开源大模型的Meta更进一步。Meta迄今尚未公开创建Llama 2 模型的一些关键细节。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/775871.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

车载以太网AVB交换机 gptp透明时钟 5口 全千兆 SW1500

全千兆车载以太网交换机 一、产品简要分析 5端口千兆车载以太网交换机,包含4个通道的1000BASE-T1接口使用罗森博格H-MTD和泰科MATEnet双接口,1个通道1000BASE-T标准以太网(RJ45接口),可以实现车载以太网多通道交换,千兆和百兆车载…

Docker搭建LNMP环境实战(06):Docker及Docker-compose常用命令

Docker搭建LNMP环境实战(06):Docker及Docker-compose常用命令 此处列举了docker及docker-compose的常用命令,一方面可以做个了解,另一方面可以在需要的时候进行查阅。不一定要强行记忆,用多了就熟悉了。 1、…

Golang hash/crc32 库实战指南:从基础到优化

Golang hash/crc32 库实战指南:从基础到优化 引言理解CRC32hash/crc32库概览实战技巧数据校验性能优化多线程应用 错误处理与调试错误处理调试 实际案例分析结论 总结重点回顾 引言 在现代软件开发中,数据的完整性和安全性至关重要。无论是数据库存储、…

python的os模块的getcwd()、listdir()、splitext()、chdir()、rename()方法

getcwd() 获得当前路径 例子: import ospath os.getcwd()print(path) 结果: D:\pythonProject\test listdir(path) 返回列表,路径下所有文件和子文件夹 例子: import osfile_list os.listdir(rD:\TEST)print(file_list) s…

Vue-vue3

一、Vue3简介二、Vue3有那些优化性能的提升源码升级拥抱TypeScript新的特性 三、创建Vue3.0工程四、Vue3工程结构(使用cli创建的vue3)五、常用的Composition API(组合式API)setupsetup的两个注意点 ref函数reactive函数Vue3.0中的…

PCL 彩色点云RGB转灰度并显示

目录 一、算法原理1、原理概述2、参考文献二、代码实现三、结果展示本文由CSDN点云侠原创,原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫与GPT。 一、算法原理 1、原理概述 不同要素之间的灰度差异较为明显。点云灰度值与RGB属性的关系为:

=> ERROR [internal] load metadata for docker.io/library/java:8-alpine问题解决

[internal] load metadata for docker.io/library/java:8-alpine问题解决 这里上面说加载来自docker.io的数据出错,要注意:docker.io/library/java:8-alpine这个地址并不能访问,也ping不通,只是docker这里是这么写的而已。 分析 …

MySQL高阶SQL语句(二)

文章目录 MySQL高阶SQL语句(二)一、MySQL常用查询1、子查询1.1 语法1.1.1 结合select语句查询1.1.2 结合insert语句查询1.1.3 结合update语句查询1.1.4 结合delete语句查询1.1.5 在in前面添加not1.1.6 exists关键字 2、别名 二、MySQL视图1、视图介绍1.1…

《科学技术创新》是什么级别的期刊?是正规期刊吗?能评职称吗?

问题解答: 问:《科学技术创新》期刊是哪个级别? 答:省级 主管单位:黑龙江省科学技术协会 主办单位:黑龙江省科普事业中心 问:《科学技术创新》期刊影响因子? 答:(2…

bugku-web-Flask_FileUpload

查看页面源码 这里提示给他一个文件,它将返回一个python运行结果给我,并且提示只能上传jpg和png文件 传递一个图片 查看源码 传递一个非图片 将源码写入新建的txt文件中 print(hello world) 将文件后缀改为jpg 上传 上传成功 查看源码 得到运行结果 我…

展示大屏-24小时天气预报

一、项目说明 展示大屏显示未来一周天气和24小时天气详情。 二、技术工具 1.语言&框架:java、springboot 2.UI界面:jQuery、HTML、CSS、 VUE 3.开发工具:IntelliJ IDEA、Eclipse 三、实现步骤 后端步骤 1.调取免费或收费的API接口。 …

JAVA面试大全之并发篇

目录 1、并发基础 1.1、多线程的出现是要解决什么问题的? 本质什么? 1.2、Java是怎么解决并发问题的? 1.3、线程安全有哪些实现思路? 1.4、如何理解并发和并行的区别? 1.5、线程有哪几种状态? 分别说明从一种状态到另一种状态转变有哪些方式? 1.6、通常线程有哪几…

mysql数据库高级面试题-2024

数据库三大范式是什么 第一范式:列不可再分 第二范式:行可以唯一区分,主键约束,要求表中的每个非主键列完全依赖于主键列 第三范式:表的非主属性不能依赖与其他表的非主属性 外键约束 且三大范式是一级一级…

linux连接不到docker端口

1、是否是防火墙开启 2、是否开启 IP 转发功能 net.ipv4.ip_forward net.ipv4.ip_forward 是 Linux 内核中的一个参数,用于控制 IP 转发功能。IP 转发是指在一个路由器或者网络设备上接收到一个 IP 数据包后,根据目标 IP 地址的路由信息将数据包发送到合…

故障诊断模型 | 结合理论边界和深度对抗网络的迁移学习开集故障诊断

文章目录 文章概述模型描述参考资料文章概述 目前,基于深度迁移学习的智能机器诊断得到了很好的研究,通常假设源域和目标域共享相同的故障类别,这可以称为闭集诊断迁移(The Closed-set Diagnosis Transfer, CSDT)。然而,由于机器零部件的不确定性和复杂性,可能会出现未知的…

table Diffusion 的Web 用户界面简介

引言: Stable Diffusion是一个AI 绘图软件 (开源模型),可本地部署,可切换多种模型,且新的模型和开源库每天都在更新发布,最重要的是免费,没有绘图次数限制。 Stable Diffusion 的 …

「DevExpress中文教程」如何将DevExtreme JS HTML编辑器集成到WinForms应用

在本文中我们将演示一个混合实现:如何将web UI工具集成到WinForms桌面应用程序中。具体来说,我们将把DevExtreme JavaScript WYSIWYG HTML编辑器(作为DevExtreme UI组件套件的一部分发布的组件)集成到Windows Forms应用程序中。 获取DevExtreme v23.2正式…

2024最新版克魔助手抓包教程(9) - 克魔助手 IOS 数据抓包

引言 在移动应用程序的开发中,了解应用程序的网络通信是至关重要的。数据抓包是一种很好的方法,可以让我们分析应用程序的网络请求和响应,了解应用程序的网络操作情况。克魔助手是一款非常强大的抓包工具,可以帮助我们在 Android …

远程todesk 和向日葵连接ubuntu无法连接

问题 今天远程用todesk 和向日葵连接对方ubuntu22.04 LTS的 电脑,无法连接,一开始以为是防火墙问题,后来发现不是,找了半天资料最后解决。 原因 没有安装X11桌面环境,还是原先的wayland 解决方案 ctrl alt T …

华为耳机快速配对新设备,一招搞定

耳机现在已经是我们形影不离的随身设备,如果我们碰见华为手机或平板无法连接或连接不上华为耳机(如FreeBuds、FreeLace系列及FreeClip蓝牙耳机)的问题,其实很简单,今天分享一个小妙招,帮助我们快速解决这个…