文 | Coggle
源 | Coggle数据科学
Colab作为非常强大且优惠的计算平台,一直广受大家喜爱。可以随时随地使用,还有免费的GPU可以薅羊毛。那么如何在Colab中使用外部数据集,来完成竞赛呢,本文将给出几种常见的方法。
方法1:通过Files explorer上传
点击Notebook的Files explorer
面板:然后点击上传按钮:
当上传结束后,就可以直接读取:
方法2:使用Colab files
上传
输入并运行下面代码:
from google.colab import filesuploaded = files.upload()
然后就可以选择对应的文件,完成上传:
方法3:读取Github链接
在github页面找到对应的文件路径,注意是文件的Raw
链接:然后将链接写到对应的位置。
方法4:克隆Github项目
先从命令行下载项目:
!git clone https://github.com/BindiChen/machine-learning.git
然后从对应的路径完成数据读取。
方法5:使用wget/axel下载文件
在Notebook中可以使用Linux系统命令,可以使用wget
或axel
下载数据:
方法6:读取谷歌硬盘数据
挂载了谷歌硬盘后,写好路径完成读取:
方法7:Kaggle API完成数据下载
首先在Kaggle账户的Kaggle API,点击Create New API Token,会下载一个kaggle.json
文件。将
kaggle.json
文件上传后,就可以使用kaggle-api下载比赛数据或者数据集。
!kaggle competitions download -c titanic!kaggle datasets download -d alexanderbader/forbes-billionaires-2021-30
![5b7e37f9a83a0e20b44f1ec0c7046e0b.png](https://img-blog.csdnimg.cn/img_convert/5b7e37f9a83a0e20b44f1ec0c7046e0b.png)
后台回复关键词【入群】
加入卖萌屋NLP/IR/Rec与求职讨论群
后台回复关键词【顶会】
获取ACL、CIKM等各大顶会论文集!