从github/gitee下载源文件,本来是22M下载下来只有11k
原因:
Github会提供html页面,包括指定的文件、上下文与相关操作。通过wget或者curl下载时,会下载该页面
解决方式:
github点击Code一栏的raw按钮,获得源文件下载链接。类似https://raw.githubusercontent.com/tatsu-lab/stanford_alpaca/main/alpaca_data.json格式
gitee点击原始数据 得到链接,类似https://gitee.com/jgyong/stanford_alpaca/raw/main/alpaca_data.json格式
之后通过wget或者curl下载。
参考
- https://blog.csdn.net/weixin_50833696/article/details/129251092