每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息,快来看看吧!🎉 😍
重磅更新
Hugging Face 🤗 开源大模型排行榜发现异常:让我们来调查一下!🧐
Open LLM 排行榜是 Hugging Face 设立的一个用于评测开放大语言模型的公开榜单。最近,随着 Falcon 🦅 的发布并在 Open LLM 排行榜上疯狂屠榜,围绕这个榜单在推特上掀起了一轮热烈的讨论。讨论主要围绕排行榜上的四个评测基准其中之一: 大规模多任务语言理解(Massive Multitask Language Understanding,MMLU)基准。
社区发现头部模型 LLaMA 🦙 在 Open LLM 榜单上的 MMLU 得分比 LLaMA 论文 中宣称的数字要低很多,大家都感觉很奇怪。
因此,我们决定深入分析一下这个现象🕳🐇,看看到底是什么原因,又应该如何解决。
在这段旅程中,你将学到很多有关如何评测模型的知识,因此,如果后面你在网络上或论文中看到了相关的评测数字,相信你就会有一定的判断力了。
详细内容请看我们在 Hugging Face 公众号发布的文章:Open LLM 排行榜近况。
Hugging Face 🤗 开源大模型榜单更新啦 🔥
💡更新之一:使用更新版 Harness 重新刷榜,更新得分 🆙
在 Falcon 大模型发布之后,很多人对我们开源大模型榜单上的 LLaMA 排名下降及评分进行讨论🙋在 Harness 版本更新之后,我们对所有大模型重新刷榜,目前的得分结果都是最新的!
💡更新之二:更快速的推理 💨
我们现在对兼容模型使用 text - generation - inference 文本生成推理,它速度极快且无缝连接,直接让后端的速度提升了一个数量级 🤯。对于其他模型,我们使用超级棒的 accelerate 来优化并行性。
💡更新之三:提高了可复制性 📄
可以在更多的位置找到你想要的信息以便复制或重现 💻 比如在 "about" 可以找到更多的指令细节;在扩展 view 里可以看到更多有关模型的信息;一如既往,所有刷榜的结果和数据也都开源在我们的 Hub 上📊
如果我们在 Hugging Face 做一个中文大模型的列表并随时更新,你觉得怎么样?🤔️
欢迎留言告诉我们你的想法和问题 🙋
社区活动
「AI 头像变装秀」活动邀请你参加!
我们在小红书平台上举办的「AI 头像变装秀」活动时间已经过半,我们看到大家生成了很多很多可爱的、抖包袱的、唯美的 AI 头像,只能说大家都太优秀啦!越发觉得好像没有一个 AI 生成的头像,出门都不好意思跟人打招呼啦!
7 月 5 日至 7 月 31 日举行 Hugging Face AI 头像变装秀活动 🔥
活动介绍: 我们将分享一段 Stable Diffusion 的 Notebook 代码 🖥️ (https://hf.link/tx)(不要听到代码就头疼呀集美们,超简单的!)顺着执行这段 Notebook 代码,你将可以使用 AI 生成自己的头像,生成头像的风格不限✨
参与方式: 在使用我们提供的代码生成头像之后,请在你的小红书发布一篇笔记 📒 分享你的成果或体验,并 @Hugging Face 官方账号让我们知道。
活动时间: ⏰ 活动将在 7 月 31 日 (周一) 晚上 12 点截止,届时获赞最多的 前三名 小伙伴将获得神秘小惊喜 🎁
如果有疑问 🙋请随时私信或留言!可到小红书查看活动详情,或者在公众号后台回复「头像」加入活动群。
官方小红书账号活动链接:https://hf.link/imot4
内容更新
音频 Transformers 课程完成发布!
我们发布了完全开源的音频 Transformers 课程,迄今为止反响非常好!🤗
Transformers 作为一种强大而多功能的深度学习架构,一次又一次地证明了自己在各种任务中的卓越表现,包括自然语言处理、计算机视觉,最近更是在音频处理领域也有不凡的表现。
在这门课程中,我们将探索如何将 Transformers 应用于音频数据。你将学习如何使用它们来处理各种音频相关的任务。无论你对语音识别、音频分类还是从文本生成语音感兴趣,Transformers 和本课程都能满足你的需求。
课程链接 🚀:https://hf.co/learn/audio-course/chapter0/introduction
我们已经完成了 7 个单元的发布:
单元 1:处理音频数据 - 为处理音频奠定基础。🧱
单元 2:音频应用简介 - 介绍了众多音频应用。🏃♂️
单元 3:音频的 Transformers 架构 - 讲解了处理音频相关任务时存在的不同类型的架构和设计!⚡️
单元 4:构建音乐流派分类器 - 实际操作教程,教你如何构建音频分类流程。🎶
单元 5:语音识别 - 深入探索语音识别,并构建一个模型来转录会议记录
单元 6:文字转语音 - 学习如何将给定的文本转换为音频输出
单元 7:具体应用 - 构建真实世界的音频应用程序
完成这门课以后,你将获得使用 Transformers 处理音频数据的坚实基础,并且能够将这些技术应用到各类音频相关的任务上。
为了这次课程,我们还进行了两次线上活动,目前两次活动的回放已经发布,请通过我们的官方哔哩哔哩账号查看:
https://hf.link/bili
本期内容编辑: Shawn
以上就是本期的 Hugging News,新的一周开始了,我们一起加油!💪🎉