操作平台:colab
由于是在colab,需要先mount google drive
from google.colab import drive
drive.mount('/content/gdrive')
导到当前目录
cd gdrive/My Drive/your path
上传你的kaggle.json; kaggle.json下载方法:kaggle官网-->右上角My Account --> Create new API token
from google.colab import files
files.upload()
上传好后运行
!pip install -q kaggle
!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json
查看自己是否成功接入
!kaggle datasets list
下载你要的数据集
!kaggle datasets download -d vaillant/rsna-str-pe-detection-jpeg-256
数据集的地址可以通过网页地址找到,比如我要的数据集在这个网页:
https://www.kaggle.com/vaillant/rsna-str-pe-detection-jpeg-256, 那么我就取kaggle.com后面的部分就可以了。
除了下载datasets类下的数据,还可以下载其他类的数据
kaggle competitions {list, files, download, submit, submissions, leaderboard}
kaggle datasets {list, files, download, create, version, init}
kaggle kernels {list, init, push, pull, output, status}
kaggle config {view, set, unset}
下载competitions类数据集的方法其实更简单,进入competition的data页面,网页上就有现成的code,比如下图这个:
下载好之后是一个zip文件,可以通过unzip来解压
!unzip -q "rsna-str-pe-detection-jpeg-256.zip"
-q是quiet的简写,这样解压的时候就不会弹出大量文件的名字了。
通过kaggle接口下载数据非常快~是不是很简单呢?科科