HuggingFace开源的自然语言处理AI工具平台

HuggingFace是一个开源的自然语言处理AI工具平台,它为NLP的开发者和研究者提供了一个简单、快速、高效、可靠的解决方案,让NLP变得更加简单、快速、高效、可靠。

Hugging Face平台主要包括以下几个部分:

Transformers:一个提供了数千种预训练好的NLP模型(如BERT、GPT-3等)以及相应工具包(如PyTorch、TensorFlow等)接口的库,可以方便地加载、使用、修改、分享这些模型;
Datasets:一个提供了数百种高质量且多样化的NLP数据集(如SQuAD、GLUE等)以及相应工具包接口(如Pandas等)接口的库,可以方便地下载、使用、分析、分享这些数据集;
Spaces:一个提供了免费且易用的在线服务平台,可以方便地部署、展示、测试自己或他人基于Transformers或Datasets构建好的NLP应用或项目;
Hub:一个提供了一个在线的模型和数据集的仓库,可以方便地浏览、搜索、下载、上传、分享自己或他人的NLP模型和数据集;
Accelerate:一个提供了一个简单且高效的分布式训练和推理的工具包,可以方便地在不同的设备和平台上运行和优化自己的NLP模型;
Tokenizers:一个提供了一个快速且灵活的文本分词和编码的工具包,可以方便地处理不同的语言和格式的文本数据;
Course:一个提供了一个免费且实用的NLP在线课程,可以方便地学习和掌握NLP的基础知识和最新技术。 https://github.com/huggingface/awesome-huggingface

Hugging Face成立于2016年,与其他同期创业公司类似,成立初期奔跑在聊天机器人赛道。

最初,Hugging Face推出一款面向青少年的聊天机器人APP,其用AI技术生成的表情和笑话,旨在为青少年提供情感疏导、娱乐服务。

例如,当用户发送自拍照,或者是一个悲伤的表情时,聊天机器人能够做出相应的反应。
然而,公司发展并没有很大起色,苦于破局的创始人转向训练聊天机器人的NLP能力,同时构建了一个底层库来容纳各种机器学习模型和数据集,并且作为开源项目公开发布。

无心插柳柳成荫,Hugging Face迅速走红。

如今,聊天机器人早已从App Store中下架,而Hugging Face却成为GitHub史上增长最快的机器学习库,其Transformer开源库累计有96302个Star和20000多个分支。此外,Hugging Face提交共享了166894个训练模型,26900个数据集。
成立六年多时间里,Hugging Face估值一路冲高。
在去年的C轮融资中,公司估值达20亿美元,由Lux Capital领投,红杉基金等跟投,NBA球星杜兰特也入股了。

对于取得的这些成绩,Clément在机器学习播客中表示:

Hugging Face之所以快速增长是缘于弥补了科学与生产之间的鸿沟,通过搭建平台为开源界和科学界赋能,所产生的价值比通过搭建专有工具产生的价值要高上千倍。

某种程度上,Hugging Face是在构建人工智能领域的“GitHub”,让其成为一个由社区开发者驱动的开源平台。

开放、开源才是正解?

自ChatGpt爆火以来,AI赛道风起云涌。各大科技巨头争先恐后入局,抢夺领先地位。在这一背景下,Hugging Face扛起了“开源”的大旗,推出开源版HuggingChat,打破闭源模式ChatGPT的主导地位。在发布HuggingChat的当天,Julien Chaumond发推文称:有人说封闭的API正在获胜,但我们永远不会放弃为开源AI而战;

Hugging Face · GitHub

Models - Hugging Face

https://blog.csdn.net/a1920993165/article/details/128082968

HuggingFace简明教程,BERT中文模型实战示例.NLP预训练模型,Transformers类库,datasets类库快速入门._哔哩哔哩_bilibili

HuggingFace简明教程_weixin_44748589的博客-CSDN博客

Huggingface 超详细介绍 - 知乎

https://www.cnblogs.com/dongxiong/p/12763923.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/39794.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

期权定价模型系列【5】—ETF期权数据

1.前言 对期权定价模型进行研究时,往往需要匹配的实际数据,国内上市时间超过两年、主流的ETF期权包括华夏上证50ETF期权、沪深300ETF期权等,其对应的标的资产分别为华夏上证50ETF、华泰柏瑞沪深300ETF、嘉实沪深300ETF。 2.上证50ETF期权合约…

浅析基于视频汇聚与AI智能分析的新零售方案设计

一、行业背景 近年来,随着新零售概念的提出,国内外各大企业纷纷布局智慧零售领域。从无人便利店、智能售货机,到线上线下融合的电商平台,再到通过大数据分析实现精准推送的个性化营销,智慧零售的触角已经深入各个零售…

数组常用方法总结

数组常用方法总结 一.获取数组长度1.1 使用length 二.数组转字符串2.1 Arrays是什么2.2 使用toString() 三. 数组拷贝3.1 使用 copyOf()3.2 copyOfRange() 四.数组排序4.1使用 sort() 五. 数组逆序六. 判断两个数组是否相等6.1 使用equals() 一.获取数组长度 1.1 使用length p…

ArrayList

目录 1.ArrayList简介 2.ArrayList的构造 2.1ArrayList() 2.2ArrayList(Collection c) 2.3ArrayList(int initialCapacity) 3.ArrayList常见操作 4.ArrayList的遍历的遍历 1.ArrayList简介 在集合框架中, ArrayList 是一个普通的类,实现了 List…

【jenkins】jenkins流水线构建打包jar,生成docker镜像,重启docker服务的过程,在jenkins上一键完成,实现提交代码自动构建的功能

【jenkins】jenkins流水线构建打包jar,生成docker镜像,重启docker服务的过程,在jenkins上一键完成,实现提交代码自动构建,服务重启,服务发布的功能。一键实现。非常的舒服。 1. 启动脚本 shell脚本 这是 s…

MySQL 中 不等于 会过滤掉 Null 的问题

null值与任意值比较时都为fasle not in 、"!"、"not like"条件过滤都会过滤掉null值的数据 SELECT * from temp; SELECT * from temp where score not in (70); 返回null解决方法: SELECT * from temp where score not in (70) or score is null;SELECT…

迅捷视频工具箱:多功能音视频处理软件

这是一款以视频剪辑、视频转换、屏幕录像等特色功能为主,同时附带有视频压缩、视频分割、视频合并等常用视频处理功能为主的视频编辑软件。该软件操作简单易用,即使没有视频处理经验的用户也可以轻松上手。将视频添加到工具箱对应功能后,简单…

zookeeper-安装部署

详情可以查看添加链接描述 1.安装jdk apt-get install openjdk-8-jdk2.安装单机zookeeper # 下载 #https://downloads.apache.org/zookeeper/zookeeper-3.7.1/apache-zookeeper-3.7.1.tar.gz # 用这个包启动的时候会报错Error: Could not find or load main class org.apach…

【OFDM系列】DFT为什么能求频率幅度谱?DFT后的X[k]与x(n)幅度的关系?DFT/IDFT底层数学原理?

文章目录 问题引入铺垫一些小公式DFT公式证明DFT公式分解为4部分先考虑k10的情况:再考虑k1≠0的情况: DFT计算后,X(k)与x(n)的关系: Matlab FFT示例代码IDFT公式证明Matlab调用FFT/IFFT并绘图 问题引入 上面是DFT和IDFT的公式,IDFT先不谈。在…

django实现文件上传

在django中实现文件上传有三种方法可以实现: 自己手动写使用Form组件使用ModelForm组件 其中使用ModelForm组件实现是最简单的。 1、自己手写 先写一个上传的页面 upload_file.html enctype"multipart/form-data 一定要加这个,不然只会上传文件名…

HTTPS 的加密流程

目录 一、HTTPS是什么? 二、为什么要加密 三、"加密" 是什么 四、HTTPS 的工作过程 1.对称加密 2.非对称加密 3.中间人攻击 4.证书 总结 一、HTTPS是什么? HTTPS (Hyper Text Transfer Protocol Secure) 是基于 HTTP 协议之上的安全协议&…

四、Controller 配置总结、RestFul 风格

文章目录 一、Controller 配置总结二、RestFul 风格2.1 使用 RequestMapping 的 method 属性指定请求类型 三、扩展:小黄鸭调试法 一、Controller 配置总结 实现 Controller 控制器的方式 实现 Controller 接口,重写 handleRequest 方法实现 控制器实现 …

Markdown编辑器 Mac版Typora功能介绍

Typora mac是一款跨平台的Markdown编辑器,支持Windows、MacOS和Linux操作系统。它具有实时预览功能,能够自动将Markdown文本转换为漂亮的排版效果,让用户专注于写作内容而不必关心格式调整。 Typora Mac版除了支持常见的Markdown语法外&#…

腾讯云轻量服务器测评:2核 2G 4M

腾讯云轻量2核2G4M服务器,4M带宽下载速度可达512KB/秒,系统盘为50GB SSD盘,300GB月流量,地域节点可选上海、广州和北京,腾讯云百科分享腾讯云2核2G4M轻量应用服务器配置性能表: 目录 腾讯云轻量2核2G4M服…

Linux下使用Ffmpeg循环推流

#前台运行 ffmpeg -stream_loop -1 -re -i "/usr/local/mp4/test.mp4" -vcodec h264 -acodec aac -f rtsp -rtsp_transport tcp rtsp://10.55.134.12/live/test#后台运行 nohup ffmpeg -stream_loop -1 -re -i "/usr/local/mp4/test.mp4" -vcodec h264 -ac…

爬虫逆向实战(十五)--阿某某营登录

一、数据接口分析 主页地址:阿某某营 1、抓包 通过抓包可以发现登录接口是Users/Login 2、判断是否有加密参数 请求参数是否加密? 通过查看“载荷”模块可以发现有一个s加密参数 请求头是否加密? 无响应是否加密? 无cookie是…

【LangChain】P1 LangChain 应用程序的核心构建模块 LLMChain 以及其三大部分

LangChain 的核心构建模块 LLMChain LangChain 应用程序的核心构建模块语言模型 - LLMs提示模板 - Prompt templates输出解析器 - Output Parsers LLMChain 组合 LangChain 应用程序的核心构建模块 LangChain 应用程序的核心构建模块 LLMChain 由三部分组成: 语言…

电脑键盘打不了字按哪个键恢复?最新分享!

“有没有朋友知道电脑键盘为什么会莫名其妙就打不了字?明明用得好好的,突然就打不了字了,真的让人很迷惑!有什么方法可以解决吗?” 电脑键盘为我们的办公提供了很大的方便,我们可以利用键盘输入我们需要的文…

安防监控视频云存储平台EasyCVRH.265转码功能更新:新增分辨率配置

安防视频集中存储EasyCVR视频监控综合管理平台可以根据不同的场景需求,让平台在内网、专网、VPN、广域网、互联网等各种环境下进行音视频的采集、接入与多端分发。在视频能力上,视频云存储平台EasyCVR可实现视频实时直播、云端录像、视频云存储、视频存储…

Python文件操作与输入输出:从基础到高级应用

文章目录 🍀引言🍀文件操作基础🍀上下文管理器与文件自动关闭🍀文件的迭代与逐行读取🍀文件的其他常见操作🍀输入输出基础🍀 文件输入输出🍀格式化输出🍀高级文件操作&am…