1.什么是wget?
wget是一个强力方便的命令行下的下载工具,可以通过HTTP和FTP协议(两种最广泛的互联网协议)从因特网中检索并获取文件。
此外,wget还具有如下特点:
- 以非交互方式工作,因而能够在用户注销后在后台进行工作(针对Linux command)。
- 在缓慢甚至不稳定的连接中依旧可以正常工作,支持断点续传功能(需要附加命令参数)。
- 支持HTML页面以及FTP站点的递归检索,您可以使用它来获取网站的镜像,或者像网页机器人(网页爬虫)一样遍历网络。
- 使用FTP协议时,支持通配符和目录的递归镜像匹配。
- 在文件获取时可以增加时间标记,因此可以自动识别远程文件自上次检索后是否发生更改,并自动检索新版本。
- 支持代理服务器,以减轻网络负载,加快检索速度。同时还提供了经由防火墙的访问。如果需要使用socks网关,可以获取socks库并编译wget以支持socks。
2.语法
wget [选项]... [URL]...
3.选项
# 启动:-V, --version 显示 Wget 的版本信息并退出-h, --help 打印此帮助-b, --background 启动后转入后台-e, --execute=命令 运行一个“.wgetrc”风格的命令# 日志和输入文件:-o, --output-file=文件 将日志信息写入 FILE-a, --append-output=文件 将信息添加至 FILE-d, --debug 打印大量调试信息-q, --quiet 安静模式 (无信息输出)-v, --verbose 详尽的输出 (此为默认值)-nv, --no-verbose 关闭详尽输出,但不进入安静模式--report-speed=类型 以 <类型> 报告带宽。类型可以是 bits-i, --input-file=文件 下载本地或外部 <文件> 中的 URL-F, --force-html 把输入文件当成 HTML 文件-B, --base=URL 解析相对于 URL 的 HTML 输入文件链接 (-i -F)--config=文件 指定要使用的配置文件--no-cookies 不读取任何配置文件--rejected-log=文件 将拒绝 URL 的原因写入 <文件>。# 下载:-t, --tries=数字 设置重试次数为 <数字> (0 代表无限制)--retry-connrefused 即使拒绝连接也是重试-O, --output-document=文件 将文档写入 FILE-nc, --no-clobber 不要下载已存在将被覆盖的文件--no-netrc don't try to obtain credentials from .netrc-c, --continue 断点续传下载文件--start-pos=偏移量 从由零计数的 <偏移量> 开始下载--progress=类型 选择进度条类型--show-progress 在任意啰嗦状态下都显示进度条-N, --timestamping 只获取比本地文件新的文件--no-if-modified-since 不要在时间戳 (timestamping) 模式下使用if-modified-since get 条件请求--no-use-server-timestamps 不用服务器上的时间戳来设置本地文件-S, --server-response 打印服务器响应--spider 不下载任何文件-T, --timeout=SECONDS 将所有超时设为 SECONDS 秒--dns-timeout=SECS 设置 DNS 查寻超时为 SECS 秒--connect-timeout=SECS 设置连接超时为 SECS 秒--read-timeout=SEC