huggingface的load_dataset()函数

第一种：从huggingface官网加载：

from datasets import load_dataset
dataset = load_dataset(path='squad', split='train')

path等于相关数据集的名字就能下载并加载相关数据集

第二种：从本地加载数据集

用path参数指定数据集格式

json格式，path="json"
csv格式， path="csv"
纯文本格式, path="text"
dataframe格式， path="panda"
图片，path="imagefolder"
然后用data_files指定文件名称，data_files可以是字符串，列表或者字典，data_dir指定数据集目录。如下case：

from datasets import load_dataset
dataset = load_dataset('csv', data_files='my_file.csv')
dataset = load_dataset('csv', data_files=['my_file_1.csv', 'my_file_2.csv', 'my_file_3.csv'])
dataset = load_dataset('csv', data_files={'train':['my_train_file_1.csv','my_train_file_2.csv'],'test': 'my_test_file.csv'})

Tips:

huggingface的load_dataset()函数返回的数据是字典类型的dataset

形如：

Dataset({features: ['label', 'text'],num_rows: 100
})

取数据用：

dataset["input_ids"]

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/840018.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

huggingface的load_dataset()函数

第一种：从huggingface官网加载：

第二种：从本地加载数据集

Tips:

相关文章

OpenCV：入门（五）

剖析并实现C++17新特性的Any类型

中文信息期刊投稿邮箱

Rust：如何使用 Pytorch 深度学习模型？

第2天搭建安全拓展_小迪网络安全笔记

vue2引入brand.vue和brand-add-or-update.vue后重启项目报错解决方案

前端调用浏览器录音功能且生成文件(vue)

【论文阅读】Rank-DETR(NIPS‘23)

Go 生成UUID唯一标识

微信小程序视频怎么保存到本地

SD3303A大功率高精度LED驱动芯片3W低功耗高效率工作温度40c+85%

学生手机管理方案

Log360：护航安全，远离暗网风险

用Visual Studio进行Qt开发的Cmake模板

【Oracle篇】rman工具实用指南：常用命令详解与实践（第二篇，总共八篇）

chatgpt功能真的强大好用吗？

WPF拖放控件

【Webpack】webpack scope hoisting

【Centos7+JDK1.8】Jenkins安装手册

解决远程链接的“Gtk-WARNING **: cannot open display；