Hugging News #0717: 开源大模型榜单更新、音频 Transformers 课程完成发布!

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧!🎉 😍

重磅更新

Hugging Face 🤗 开源大模型排行榜发现异常:让我们来调查一下!🧐

17a990372b123a0b2c80626d99d478fa.png

Open LLM 排行榜是 Hugging Face 设立的一个用于评测开放大语言模型的公开榜单。最近,随着 Falcon 🦅 的发布并在 Open LLM 排行榜上疯狂屠榜,围绕这个榜单在推特上掀起了一轮热烈的讨论。讨论主要围绕排行榜上的四个评测基准其中之一: 大规模多任务语言理解(Massive Multitask Language Understanding,MMLU)基准。

社区发现头部模型 LLaMA 🦙 在 Open LLM 榜单上的 MMLU 得分比 LLaMA 论文 中宣称的数字要低很多,大家都感觉很奇怪。

因此,我们决定深入分析一下这个现象🕳🐇,看看到底是什么原因,又应该如何解决。

在这段旅程中,你将学到很多有关如何评测模型的知识,因此,如果后面你在网络上或论文中看到了相关的评测数字,相信你就会有一定的判断力了。

详细内容请看我们在 Hugging Face 公众号发布的文章:Open LLM 排行榜近况。

Hugging Face 🤗 开源大模型榜单更新啦 🔥

146422155755f5663d1eadda5a82c534.png
  • 💡更新之一:使用更新版 Harness 重新刷榜,更新得分 🆙

在 Falcon 大模型发布之后,很多人对我们开源大模型榜单上的 LLaMA 排名下降及评分进行讨论🙋在 Harness 版本更新之后,我们对所有大模型重新刷榜,目前的得分结果都是最新的!

  • 💡更新之二:更快速的推理 💨

我们现在对兼容模型使用 text - generation - inference 文本生成推理,它速度极快且无缝连接,直接让后端的速度提升了一个数量级 🤯。对于其他模型,我们使用超级棒的 accelerate 来优化并行性。

  • 💡更新之三:提高了可复制性 📄

可以在更多的位置找到你想要的信息以便复制或重现 💻 比如在 "about" 可以找到更多的指令细节;在扩展 view 里可以看到更多有关模型的信息;一如既往,所有刷榜的结果和数据也都开源在我们的 Hub 上📊

如果我们在 Hugging Face 做一个中文大模型的列表并随时更新,你觉得怎么样?🤔️

欢迎留言告诉我们你的想法和问题 🙋

社区活动

「AI 头像变装秀」活动邀请你参加!

d9a9fe30f4dafbc0614ae4648a9cce9e.jpeg

我们在小红书平台上举办的「AI 头像变装秀」活动时间已经过半,我们看到大家生成了很多很多可爱的、抖包袱的、唯美的 AI 头像,只能说大家都太优秀啦!越发觉得好像没有一个 AI 生成的头像,出门都不好意思跟人打招呼啦!

7 月 5 日至 7 月 31 日举行 Hugging Face AI 头像变装秀活动 🔥

活动介绍: 我们将分享一段 Stable Diffusion 的 Notebook 代码 🖥️ (https://hf.link/tx)(不要听到代码就头疼呀集美们,超简单的!)顺着执行这段 Notebook 代码,你将可以使用 AI 生成自己的头像,生成头像的风格不限✨

参与方式: 在使用我们提供的代码生成头像之后,请在你的小红书发布一篇笔记 📒 分享你的成果或体验,并 @Hugging Face 官方账号让我们知道。

活动时间: ⏰ 活动将在 7 月 31 日 (周一) 晚上 12 点截止,届时获赞最多的 前三名 小伙伴将获得神秘小惊喜 🎁

如果有疑问 🙋请随时私信或留言!可到小红书查看活动详情,或者在公众号后台回复「头像」加入活动群。

官方小红书账号活动链接:https://hf.link/imot4

内容更新

音频 Transformers 课程完成发布!

2449cdd790fa2ac05bf4926b4a31774b.png

我们发布了完全开源的音频 Transformers 课程,迄今为止反响非常好!🤗

Transformers 作为一种强大而多功能的深度学习架构,一次又一次地证明了自己在各种任务中的卓越表现,包括自然语言处理、计算机视觉,最近更是在音频处理领域也有不凡的表现。

在这门课程中,我们将探索如何将 Transformers 应用于音频数据。你将学习如何使用它们来处理各种音频相关的任务。无论你对语音识别、音频分类还是从文本生成语音感兴趣,Transformers 和本课程都能满足你的需求。

课程链接 🚀:https://hf.co/learn/audio-course/chapter0/introduction

我们已经完成了 7 个单元的发布:

  • 单元 1:处理音频数据 - 为处理音频奠定基础。🧱

  • 单元 2:音频应用简介 - 介绍了众多音频应用。🏃‍♂️

  • 单元 3:音频的 Transformers 架构 - 讲解了处理音频相关任务时存在的不同类型的架构和设计!⚡️

  • 单元 4:构建音乐流派分类器 - 实际操作教程,教你如何构建音频分类流程。🎶

  • 单元 5:语音识别 - 深入探索语音识别,并构建一个模型来转录会议记录

  • 单元 6:文字转语音 - 学习如何将给定的文本转换为音频输出

  • 单元 7:具体应用 - 构建真实世界的音频应用程序

完成这门课以后,你将获得使用 Transformers 处理音频数据的坚实基础,并且能够将这些技术应用到各类音频相关的任务上。

为了这次课程,我们还进行了两次线上活动,目前两次活动的回放已经发布,请通过我们的官方哔哩哔哩账号查看:
https://hf.link/bili

本期内容编辑: Shawn


以上就是本期的 Hugging News,新的一周开始了,我们一起加油!💪🎉

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/2292.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

nacos注册中心+Ribbon负载均衡+完成openfeign的调用(超详细步骤)

目录 1.注册中心 1.1.nacos注册中心 1.2. 微服务注册和拉取注册中心的内容 2.3.修改订单微服务的代码 3.负载均衡组件 3.1.什么是负载均衡 3.2.什么是Ribbon 3.3.Ribbon 的主要作用 3.4.Ribbon提供的负载均衡策略 4.openfeign完成服务调用 4.1.什么是OpenFeign 4.2…

vscode remote-ssh配置

使用vscode的插件remote-ssh进行linux的远程控制。 在vscode上安装完remote-ssh插件后,还需要安装openssh-client。 openssh-client安装 先win R打开cmd,输入ssh,查看是否已经安装了。 如果没有安装,用管理员权限打开powershe…

Linux云服务器,docker compose文件部署多个jar,docker部署多模块boot项目

前提条件 Linux服务器 服务器已经安装docker docker已经安装jdk镜像 docker已经安装mysql镜像 将要部署的项目的jar包打包好,项目是多模块springboot项目 部署过程 项目是3个模块的Spring boot项目,打出来3个jar,将这些jar包拷贝到…

Linux/Unix-gcc编译回顾

1、gcc编译为可执行程序四步骤:预处理->编译->汇编->链接 注意:-o 用于修改生产的文件名 2、gcc常用参数 指定头文件:-I 语法: gcc -I 头文件所在文件夹路径 源文件 -o 生成文件名 如果头文件和源文件中同一个文件夹…

性能测试 Linux 环境下模拟延时和丢包实现

在性能测试过程中,我们还需要模拟网络异常的情况下,是否会出现一些异常数据。最常见的就是写库操作,比如说我们下单的场景,如果出现网络异常的时候是否会出现数据对不上这种情况。 如我们JMeter发送成功的请求数量和最终数据库表…

linux之Ubuntu系列(五)用户管理、查看用户信息 终端命令

创建用户 、删除用户、修改其他用户密码的终端命令都需要通过 sudo 执行 创建用户 设置密码 删除用户 sudo useradd -m -g 组名 新建用户名 添加新用户 -m:自动建立用户 家目录 -g:指定用户所在的组。否则会建立一个和用户同名的组 设置新增用户的密码&…

Git源代码管理方案

背景 现阶段的Git源代码管理上有一些漏洞,导致在每次上线发布的时间长、出问题,对整体产品的进度有一定的影响。 作用 新的Git源代码管理方案有以下作用: 多功能并行开发时,测试人员可以根据需求任务分配测试自己的功能&#…

Ceph 分布式存储之应用

一、创建 CephFS 文件系统 MDS 接口 1、服务端操作 1)在管理节点创建 mds 服务 [rootadmin ceph]# cd /etc/ceph [rootadmin ceph]# ceph-deploy mds create node01 node02 node03 [ceph_deploy.conf][DEBUG ] found configuration file at: /root/.cephdeploy.c…

.Net5 mvc项目UseBrowserLink插件功能失效的原因

前期基于.Net Framework创建的Web项目,使用了BrowserLink插件协助前端开发,功能一直都比较稳定,后来项目迁到.Net5 ,发现BrowserLink 已经失去了从浏览器定位到项目源代码的功能,希望在后面的版本还能继续支持此版本&a…

国内流行的数据可视化软件工具

在信息爆炸的时代,越来越多的数据堆积如山。但是,这些密集的数据没有重点且可读性较差。因此,我们需要数据可视化来帮助数据易于理解和接受。相比之下,可视化更直观、更有意义,使用适当的数据可视化工具来可视化数据非…

SDN系统方法 | 1. 概述

随着互联网和数据中心流量的爆炸式增长,SDN已经逐步取代静态路由交换设备成为构建网络的主流方式,本系列是免费电子书《Software-Defined Networks: A Systems Approach》的中文版,完整介绍了SDN的概念、原理、架构和实现方式。原文: Softwar…

基于FT232HL的USB2.0转ARINC429板卡

基于FT232HL的USB2.0转ARINC429板卡 1 概述 《USB2.0转ARINC429板卡》采用底板子板,层叠安装的结构;使用同样的底板,变换不同功能的子板实现不同的功能版本。 a) 降低硬件设计复杂度:新板卡设计只需要设计子板,子板的…

MySQL中这14个小玩意,让人眼前一亮!!!

前言 我最近几年用MYSQL数据库挺多的,发现了一些非常有用的小玩意,今天拿出来分享到大家,希望对你会有所帮助。 1.group_concat 在我们平常的工作中,使用group by进行分组的场景,是非常多的。 比如想统计出用户表中…

《动手学深度学习》(pytorch版本)中`d2lzh_pytorch`包问题

《动手学深度学习》(pytorch版本)中d2lzh_pytorch包问题

【深度学习】张量的广播专题

一、说明 张量广播(tensor broadcasting)是一种将低维张量自动转化为高维张量的技术,使得张量之间可以进行基于元素的运算(如加、减、乘等)。在进行张量广播时,会将维度数较少的张量沿着长度为1的轴进行复制…

YOLOv5图像和视频对象生成边界框的目标检测实践(GPU版本PyTorch错误处理)

识别图像和视频里面的对象,在计算机视觉中是一个很重要的应用,比如无人驾驶,这个就需要实时的检测到周边环境的各种对象,并及时做出处理。目标检测在以往的文章中有重点讲解过几种,其中Faster R-CNN的源码解读&#xf…

7.kafka+ELK连接

文章目录 kafkaELK连接部署Kafkakafka操作命令kafka架构深入FilebeatKafkaELK连接 kafkaELK连接 部署Kafka ###关闭防火墙systemctl stop firewalld systemctl disable firewalldsetenforce 0vim /etc/selinux/configSELINUXdisabled###下载安装包官方下载地址:ht…

Vue自定义指令

需求1:定义一个v-big指令,和v-text功能类似,但会把绑定的数值放大10倍。 需求2:定义一个v-fbind指令,和v-bind功能类似,但可以让其所绑定的input元素默认获取焦点。 自定义指令函数式v-big: &l…

2023最新版本Activiti7系列-事件篇

事件篇 事件(event)通常用于为流程生命周期中发生的事情建模。事件总是图形化为圆圈。在BPMN 2.0中,有两种主要的事件分类:*捕获(catching)与抛出(throwing)*事件。 捕获: 当流程执…