Linux必备下载命令之wget详解
文章目录
-
-
-
-
-
wget简介
Linux wget是一个用于命令行下下载文件的工具,对于Linux用户尤其是网络管理员而言必不可少。在处理软件下载或从远程服务器恢复备份到本地服务器等事务时,如果使用虚拟主机,以往需先下载到本地磁盘再用ftp工具上传到服务器,而在Linux VPS环境下,wget可直接下载到服务器。
wget工具体积小但功能完善,具有以下功能和特点:
-
-
支持FTP和HTTP下载方式:能满足不同场景的下载需求。
-
-
设置方便简单:尽管命令行操作对于习惯图形界面的用户可能不太友好,但在设置上有诸多优点。
-
wget是在Linux下开发的开源软件,作者是Hrvoje Niksic,后被移植到包括Windows在内的多个平台。
1. 语法
wget [选项]... [URL]...
2. 选项
启动
日志和输入文件
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
把输入文件当成HTML文件,下载本地或外部文件中的URL
|
|
解析相对于URL的HTML输入文件链接(与 -i 一起使用)
|
|
|
|
|
|
|
|
|
下载
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
--no-use-server-timestamps
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
首先连接至指定家族(IPv6,IPv4或none)的地址
|
|
|
|
|
|
|
|
|
|
使用ENC作为IRI(国际化资源标识符)的本地编码
|
|
|
|
|
|
|
|
|
目录
|
|
|
|
|
|
-nH, --no-host-directories
|
|
|
|
-P, --directory-prefix=前缀
|
|
|
|
HTTP选项
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
当选择本地文件名时允许Content-头部(实验中)
|
|
|
|
|
HTTPS (SSL/TLS)选项
|
|
|
选择安全协议,可选值有auto, SSLv2, SSLv3, TLSv1, TLSv1_1, TLSv1_2等
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
用于验证节点的公钥(PEM/DER)文件或码、任何数量的sha256散列值,以base64编码
|
|
|
HSTS选项
FTP选项
FTPS选项
|
|
|
|
--ftps-clear-data-connection
|
|
|
|
|
|
WARC选项
递归下载
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-N -r -l inf --no-remove-listing的缩写形式,用于镜像站点
|
|
|
|
|
递归接受/拒绝
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-I, --include-directories=列表
|
|
|
|
-X, --exclude-directories=列表
|
|
|
|
|
|
3. 实例
-
使用wget下载单个文件:从网络下载一个文件并保存在当前目录,例如:wget http://cn.wordpress.org/wordpress-3.1-zh_CN.zip ,下载过程中会显示进度条。
-
使用wget -O下载并以不同的文件名保存:wget默认以链接中最后一个符合“/”后面的字符命名,可能导致文件名不正确。可使用 -O参数指定文件名,如:wget -O wordpress.zip http://www.centos.bz/download.php?id=1080
-
使用wget –limit -rate限速下载:当下载大文件且还需下载其他文件时,可限速下载,例如:wget –limit-rate=300k http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
-
使用wget -c断点续传:下载大文件中断时,使用 -c参数可继续下载,如:wget -c http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
-
使用wget -b后台下载:下载大文件时可使用 -b参数进行后台下载,如:wget -b http://cn.wordpress.org/wordpress-3.1-zh_CN.zip ,可通过tail -f wget-log查看下载进度。
-
伪装代理名称下载:有些网站会根据代理名称拒绝下载请求,可使用–user-agent参数伪装,如:wget –user-agent=”Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.204 Safari/534.16″ [下载链接]
-
使用wget –spider测试下载链接:在定时下载前或检测网站可用性、检查死链接时,可使用–spider参数,如:wget –spider URL ,链接正确会显示相关成功信息,链接错误则显示错误信息。
-
使用wget –tries增加重试次数:wget默认重试20次连接下载文件,可使用–tries增加重试次数,如:wget –tries=40 URL
-
使用wget -i下载多个文件:先保存下载链接文件,如:
cat > filelist.txt
url1
url2
url3
url4
然后使用wget -i filelist.txt下载。 10. 使用wget –mirror镜像网站:下载整个网站到本地,例如:wget –mirror -p –convert-links -P ./LOCAL URL ,其中–miror开启镜像下载,-p下载所有为了html页面显示正常的文件,–convert-links下载后转换成本地的链接,-P ./LOCAL保存所有文件和目录到本地指定目录。 11. 使用wget –reject过滤指定格式下载:不想下载网站中的图片时,可使用:wget –reject=gif url 12. 使用wget -o把下载信息存入日志文件:不想让下载信息直接显示在终端,可使用:wget -o download.log URL 13. 使用wget -Q限制总下载文件大小:限制递归下载文件总大小,如:wget -Q5m -i filelist.txt ,该参数对单个文件下载不起作用。 14. 使用wget -r -A下载指定格式文件:可用于下载网站的指定格式文件,如下载所有PDF文件:wget -r -A.pdf url 15. 使用wget FTP下载:匿名ftp下载:wget ftp-url ;用户名和密码认证的ftp下载:wget –ftp-user=USERNAME –ftp-password=PASSWORD url
拓展功能
-
下载整个http或者ftp站点:wget http://place.your.url/here可下载首页;wget -r http://place.your.url/here会递归下载整个网站,使用时需谨慎,可通过-l number指定下载层次;制作镜像站点可使用-m参数,如:wget -m http://place.your.url/here 。
-
断点续传:使用 -c参数实现断点续传,如:wget -c http://the.url.of/incomplete/file ,-t参数设置重试次数,-T参数设置超时等待时间。
-
批量下载:生成包含多个URL的文件,如download.txt,使用wget -i download.txt下载文件中的所有URL。
-
选择性的下载:通过–reject=LIST忽略指定类型文件,–accept=LIST指定接受的文件类型,如
原文始发于微信公众号(土拨鼠的安全屋):Linux 下载利器 wget 命令详解及应用实例
评论