HuggingFace Hub系列:推动NLP前进的协作平台

在当今快速发展的机器学习(ML)领域,没有任何一个公司,包括科技巨头,能够独立“解决AI”。这是一个需要通过共享知识和资源在社区中协作来实现的目标。正是基于这个信念,Hugging Face Hub应运而生,它是一个集成了超过120,000个模型、20,000个数据集和50,000个演示的平台,旨在促进ML工作流程中的协作与共享。

Hugging Face Hub提供了一个中央位置,任何人都可以在这里分享、探索、发现和实验开源机器学习。我们正在构建最大的开源模型、数据集、演示和指标集合,以实现民主化和为每个人推进ML的目标。

为了加强社区成员之间的互动和合作,我们鼓励大家阅读行为守则和内容指南,了解我们期望社区成员所维护的价值观。

Hugging Face Hub能为您提供什么?

Hugging Face Hub托管基于Git的仓库,这些仓库是带有版本控制的桶,可以包含所有的文件。

在此平台上,您可以上传和发现:

  • 模型:托管最新的NLP、视觉和音频任务的前沿模型。
  • 数据集:提供不同领域和模态的广泛数据集。
  • 空间(Spaces):在浏览器中直接演示ML模型的交互式应用。

此外,Hub提供版本控制、提交历史、差异、分支以及超过十几种库集成的功能!您可以在仓库文档中了解所有仓库共享的特性。

模型

在社区的共享下,您可以发现并使用数以万计的开源ML模型。为了促进负责任地使用和开发模型,模型仓库配备了模型卡片,以告知用户每个模型的局限性和偏见。还可以包括有关其任务、语言和指标的附加元数据,如果仓库包含TensorBoard跟踪,甚至可以添加训练指标图表。为您的模型添加推理小部件也很简单,允许任何人直接在浏览器中与模型互动!对于程序化访问,提供了API以即时服务您的模型。

丰富的资源库

Hugging Face Hub以Git为基础的仓库系统,不仅提供版本控制、提交历史、差异、分支等功能,还整合了十几种库,使得共享和发现资源变得前所未有的简单。

  • 模型:从NLP、视觉到音频任务,你可以发现和使用数以万计的开源ML模型。为促进负责任地使用模型,每个模型仓库都配备了模型卡片,详细说明了模型的局限性和偏见。
  • 数据集:Hub收录了超过5,000个数据集,支持100多种语言,涵盖NLP、计算机视觉和音频等多个领域的任务。通过详尽的数据集卡片和数据集预览,用户可以直接在浏览器中探索数据。
  • Spaces:提供了一种简单的方式来托管ML演示应用,支持Gradio和Streamlit两种Python SDK,使得在几分钟内就能构建出酷炫的应用。
数据集

Hub是超过5,000个数据集的家园,这些数据集涵盖了100多种语言,可用于NLP、计算机视觉和音频的广泛任务。Hub简化了数据集的查找、下载和上传过程。数据集伴随着详尽的文档,如数据集卡片和数据集预览,让您可以直接在浏览器中探索数据。虽然许多数据集是公开的,但组织和个人可以创建私有数据集,以符合许可或隐私问题。您可以在Hugging Face Hub文档中进一步了解数据集。

空间(Spaces)

Spaces是在Hub上托管ML演示应用的简便方式。它们允许您构建ML作品集,在会议或对利益相关者展示项目,并与ML生态系统中的其他人协作。

目前,我们支持两个出色的Python SDK(Gradio和Streamlit),让您在几分钟内构建酷炫的应用。用户还可以创建静态Spaces,这些Spaces是Space内的简单HTML/CSS/JavaScript页面。

在探索了一些Spaces(看看我们的每周Space!)之后,深入了解Spaces文档,学习如何创建您自己的Space。您还可以将您的Space升级,以在GPU或其他加速硬件上运行。

组织

公司、大学和非营利组织是Hugging Face社区的重要组成部分!Hub提供了组织功能,可用于分组账户并管理数据集、模型和Spaces。教育工作者还可以为使用Hugging Face的课堂创建协作组织。组织的仓库将在组织的页面上展示,组织的每个成员都有能力贡献到仓库中。除了方便地分组所有组织的工作外,Hub还允许管理员设置角色以控制对仓库的访问,并管理其组织的支付方式和账单信息。当协作时,机器学习更加有趣!

探索现有的组织,创建新组织,并访问组织文档以了解更多信息。

随着机器学习技术的不断进步,Hugging Face Hub提供了一个独特的、以社区为中心的平台,旨在促进开源机器学习资源的共享与协作。无论您是数据科学家、研究人员还是ML爱好者,Hugging Face Hub都是探索和贡献于这一创新领域不可或缺的资源。

后续

        后续,我会围绕这个huggingface系列框架详细的写一下说明文档,从安装、使用、模型训练、数据下载等等方面,写一个专题文章。希望NLP方向的小伙伴们能够喜欢。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/736225.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

201912青少年软件编程(Scratch)等级考试试卷(一级)

201912 青少年软件编程(Scratch)等级考试试卷(一级) 第1题:【 单选题】 关于造型和背景,下面说法不正确的是? A:造型编号从1开始 B:有四个背景,删除第二个背景,背景编…

11_Http

文章目录 HttpHttp协议网络模型Http协议的工作流程Http请求报文请求行请求方法请求资源协议版本 请求头空行请求体抓包软件:Fiddler Http响应报文响应行状态码 响应头响应体 请求完整的处理流程 Https 整体流程图: 前端:负责获取数据&#xf…

雷赛控制卡获取轴当前位置的值不正确问题处理

现像 从雷赛控制卡中获取当前轴位置值时发现轴在向零点的右边走时显示的值是负数。正常来就一般是要反馈正数的。一般轴零点右边是正方向,限位是正限位,反馈的位置也应该是正数。 如果雷赛软件中的【单轴参数】中的基本设置中的【脉冲模式】设置的是对的…

【C语言基础】:深入理解指针(终篇)

文章目录 深入理解指针一、函数指针变量4.1 函数指针变量的创建4.2 函数指针变量的使用4.3 typedef关键字 二、函数指针数组三、转移表四、回调函数4.1 什么是回调函数4.2 qsort使用举例4.2.1 使用qsort函数排序整形数据4.2.2 使用qsort排序结构数据4.2.3 qsort函数的模拟实现 …

elasticsearch 深度分页查询 Search_after(图文教程)

Search_after使用 一. 简介二. 不带PIT的search_after查询2.1 构造数据2.2 search_after分页查询2.2 问题 三. 带PIT的search_after查询3.1 构建第一次查询条件3.2 进行下一页查询3.3 删除PIT 四.参考文章 前言 这是我在这个网站整理的笔记,有错误的地方请指出,关注…

【调试记录】vscode远程连接问题汇总

1. kex_exchange_identification kex_exchange_identification: read: Connection reset by xxx.xx.xx.x 一直连不上实验室的服务器,用PUTTY和Mobaxterm也不行(报错:Remote side unexpectedly closed network connection)。已知…

傅里叶变换pytorch使用

参考视频:1 傅里叶变换原理_哔哩哔哩_bilibili 傅里叶变换是干嘛的: 傅里叶得到低频、高频信息,针对低频、高频处理能够实现不同的目的。 傅里叶过程是可逆的,图像经过傅里叶变换、逆傅里叶变换后,能够恢复到原始图像…

【管理干部竞聘上岗】某星级酒店中层干部竞聘上岗管理咨询项目纪实

在这次项目合作中,我们的目的主要是设计一次公开、透明的竞聘活动,通过科学、公正的方法选拔出公司管理级岗位的最佳候选人。基于华恒智信的专业性,我们再次选择与其合作开展项目。在项目合作中,专家团队为我们进行了专业性的培训…

AIGC实战——GPT(Generative Pre-trained Transformer)

AIGC实战——GPT 0. 前言1. GPT 简介2. 葡萄酒评论数据集3. 注意力机制3.1 查询、键和值3.2 多头注意力3.3 因果掩码 4. Transformer4.1 Transformer 块4.2 位置编码 5. 训练GPT6. GPT 分析6.1 生成文本6.2 注意力分数 小结系列链接 0. 前言 注意力机制能够用于构建先进的文本…

【网络原理】TCP 协议中比较重要的一些特性(一)

目录 1、TCP 协议 2、确认应答 2.1、确认序号 3、超时重传 4、连接管理 4.1、建立连接(三次握手) 4.2、断开连接(四次挥手) 1、TCP 协议 TCP 是工作中最常用到的协议,也是面试中最常考的协议,具有面…

软考高级:单元测试、集成测试、确认测试(内部确认测试、Alpha 测试、Beta测试、验收测试)概念和例题

作者:明明如月学长, CSDN 博客专家,大厂高级 Java 工程师,《性能优化方法论》作者、《解锁大厂思维:剖析《阿里巴巴Java开发手册》》、《再学经典:《Effective Java》独家解析》专栏作者。 热门文章推荐&am…

Electron程序如何在MacOS下获取相册访问权限

1.通过entitiment.plist,在electron-builder签名打包时,给app包打上签名。最后可以通过codesign命令进行验证。 TestPhotos.plist electron-builder配置文件中加上刚刚的plist文件。 通过codesign命令验证,若出现这个,则说明成…

Fortran语法介绍(三)

个人专栏—ABAQUS专栏 Abaqus2023的用法教程——与VS2022、oneAPI 2024子程序的关联方法 Abaqus2023的用法教程——与VS2022、oneAPI 2024子程序的关联方法Abaqus有限元分析——有限元网格划分基本原则 Abaqus有限元分析——有限元网格划分基本原则各向同性线弹性材料本构模型…

《手把手教你》系列技巧篇(二十七)-java+ selenium自动化测试- quit和close的区别(详解教程)

1.简介 尽管有的小伙伴或者童鞋们觉得很简单,不就是关闭退出浏览器,但是宏哥还是把两个方法的区别说一下,不然遇到坑后根本不会想到是这里的问题。 2.源码 本文介绍webdriver中关于浏览器退出操作。driver中有两个方法是关于浏览器关闭&…

SQL28 计算用户8月每天的练题数量

👨‍💻 大唐coding:个人主页 🎁 个人专栏: 《力扣高频刷题宝典》《SQL刷题记录》 ⛵ 既然选择远方,当不负青春,砥砺前行! 大家好,我是大唐,今天我们来做一道牛客题库SQL…

MySQL-----存储过程

▶ 介绍 存储过程是事先经过编译并存储在数据库中的一段SQL语句的集合,调用存储过程可以简化应用开发人员的很多工作,减少数据在数据库和应用服务器之间的传输,对于提高数据处理的效率是有好处的。 存储过程思想上很简单,…

C switch 语句

一个 switch 语句允许测试一个变量等于多个值时的情况。每个值称为一个 case,且被测试的变量会对每个 switch case 进行检查。 语法 C 语言中 switch 语句的语法: switch(expression){case constant-expression :statement(s);break; /* 可选的 */ca…

Sora模型详细描述提示词的10个技巧

在使用Sora进行文本生成视频时,详细描述提示词是提高生成质量和准确度的重要手段。下面将详细介绍10个关于详细描述提示词的技巧,帮助用户更有效地利用Sora模型生成符合需求的文本内容。 1. 具体化描述 详细说明:在提供提示词时&#xff0c…

python实现B/B+树

python实现–顺序查找 python实现–折半查找 python实现–分块查找 python实现B/B树 B树和B树都是一种多路搜索树,用于对大量数据进行排序和查找。它们在数据库系统中被广泛应用,特别是用于构建索引结构。 B树(B-Tree) B树&…