已更新您的示例网址:
我刚刚为此编写了一种超级简单的方法(将其略微修改),以将pdfs刮出某个站点。 请注意,由于Powershell无法处理“ \ r”,因此只能在基于UNIX的系统(Linux,Mac OS)上正常运行
import requests
link = "http://indy/abcde1245"
file_name = "download.data"
with open(file_name, "wb") as f:
print "Downloading %s" % file_name
response = requests.get(link, stream=True)
total_length = response.headers.get('content-length')
if total_length is None: # no content length header
f.write(response.content)
else:
dl = 0
total_length = int(total_length)
for data in response.iter_content(chunk_size=4096):
dl += len(data)
f.write(data)
done = int(50 * dl / total_length)
sys.stdout.write("\r[%s%s]" % ('=' * done, ' ' * (50-done)) )
sys.stdout.flush()
它使用了请求库,因此您需要安装它。 这会将类似以下内容的内容输出到您的控制台中:
>下载download.data
> [===============================
脚本中的进度条宽52个字符(2个字符只是[],所以进度条为50个字符)。 每个=代表下载量的2%。