Python爬虫优雅地自动启用代理
之前有提到过如何使用 Python + Clash,爬取外网数据,然而这样写并不够优雅:
- 代理的IP地址以及端口号是固定的、写死的
- 含有
urllib3.disable_warnings()
这样不优雅的代码
GetProxies
urllib.request
中的getproxies
可以轻松的获取系统Web代理信息。当未开启代理时,返回空字典,开启代理时,返回如下的字典
1 |
|
HTTPX
使用httpx
则不用设置urllib3.disable_warnings()
、verify=False
1 |
|
也可以使用Client
,和requests
的session
基本一致
1 |
|
Python爬虫优雅地自动启用代理
https://zuoguan.netlify.app/2024/04/13/Python爬虫优雅地自动启用代理/