curl高级用法之设置代理服务器 网页代理服务器


curl是一个命令行下的web客户端,可以在命令行下执行常见的web访问、自动web请求等操作,之前的文章中虫虫曾经专门介绍过 。本文我们来总结一下curl使用代理服务器的用法 。

curl高级用法之设置代理服务器 网页代理服务器

文章插图
概述curl(cURL)是一个用于传输数据的命令行工具,其诞生于20多年前,最早版本是在1998年 。
curl高级用法之设置代理服务器 网页代理服务器

文章插图
curl支持以多种方式检索和发送数据,并输出到标准输出,可以无缝衔接标准unix管道使用 。在绝大多数的*nix操作系统上都默认安装 。curl支持各种协议,包括 HTTP/HTTPS、FTP和SCP 。
curl高级用法之设置代理服务器 网页代理服务器

文章插图
Web代理服务器充当客户端和目标服务器之间的中介 。客户端首先访问代理,然后代理执行它并将结果返回给客户端 。
curl高级用法之设置代理服务器 网页代理服务器

文章插图
有些Web站点是有限制的,我们无法直接通过当前IP直接访问目标站点;还有一些站点对访问请求是有一定限制,而我们在请求数据时候为了请求速度也需要突破IP限制 。通过使用代理服务,我们就可以突破上述限制 。
curl代理设置为演示需要,本文中示例中使用的代理将设置为本地机器上,使用端口5000 。默认情况下,代理语句中唯一需要的部分是主机,默认端口80 。我们将通过HTTP将数据传输到它,我们将明确指定完整性 。为了方便,我们请求服务为httpbin 。Httpbin是一个开源的标准http服务显示,在请求/ip接口时候可以查看请求IP地址 。
方法一:命令行参数使用代理的第一个也是最简单的选项是使用命令行参数 。Curl代理参数为-x(或者--proxy) 。基本格式为:
-x, --proxy [protocol://]host[:port]
因此,要使用代理访问,可以使用:
curl高级用法之设置代理服务器 网页代理服务器

文章插图
其中,代理服务器的协议头,默认为http可以省略掉:
【curl高级用法之设置代理服务器 网页代理服务器】curl -x 127.0.0.1:5000 httpbin/ip
身份验证
此外,如果HTTP代理服务器也需要身份验证,可以使用 -U标志来指定它 。
curl -U user:password --proxy 127.0.0.1:5000 httpbin/ip
某些代理服务器可能需要不同的身份验证方案 。可以通过--proxy-anyauth指定curl以确定身份验证方案
curl -U user:password --proxy 127.0.0.1:5000 httpbin/ip --proxy-anyauth
如果认证密码中包含特殊字符,需要对其添加加上双引号("") 。
curl -U "user:p@assword" --proxy 127.0.0.1:5000 httpbin/ip
上面命令中直接用密码容易被泄露并且会被记录在history日志中,在命令行中通过只提供用户名,然后可以交互式的,根据curl提示输入密码 。
curl -U user --proxy 127.0.0.1:5000 httpbin/ip> Enter proxy password for user 'user':
方法二:使用环境变量可以使用环境变量配置实现curl使用代理服务器 。curl允许通过设置变量为它支持的每个协议使用环境变量[scheme]_proxy 。如果设置了这些,那么当使用对应协议时,curl将默认引入 。对http和https协议:
export http_proxy="127.0.0.1:5000"export https_proxy="127.0.0.1:5000"
同样可以添加认证参数:
curl高级用法之设置代理服务器 网页代理服务器

文章插图
然后所有,curl http和https请求就会自动使用代理 。
与以这种方式设置的所有环境变量一样,这些只是临时变量,shell会话结束或重新启动系统时删除 。但是,为了使其在所有会话中可用,可以将其附加到profile文件中,或者对于个人可以在.bashrc 或 .zshrc文件添加,实现持久化的代理设置 。

推荐阅读