qq:800819103
在线客服,实时响应qq群
在线客服,实时响应客服电话
13318873961如何用php定时验证代理IP是否可用?用php先搭建网络爬虫,今天就利用上次爬到的http代理IP讲一讲代理IP的验证。至于为什么说PHP是世界上最好的语言,我也不知道,听别人说的,我个人比较喜欢java,以后有机会与大家分享我的学习之路。
我们为什么需要对代理IP进行验证呢?要知道我们在网络中抓到的代理IP数量很大,但能用的往往连十之一二都不到,在使用前剔除掉不能用的代理IP就能提高我们的工作效率。
首先说说思路:上次我们已经将抓到的IP和端口都放进了我们的MySQL数据表中,要验证肯定需要取出来,然后通过PHP中curl函数设置代理,再访问百度或者其他能访问到的网站,通过返回的状态码是否等于200来判断代理IP是不是可以正常使用的。
由于代码太长,一些不必要的代码就不贴出来了,下面看看curl验证代理IP的核心代码。
//代理IP验证方法
functionGetHttpStatusCode($proxy){$curl=curl_init();curl_setopt($curl,CURLOPT_PROXY,$proxy);
//使用代理访问
curl_setopt($curl,CURLOPT_URL,"");
//获取内容
urlcurl_setopt($curl,CURLOPT_HEADER,1);
//获取http头信息
curl_setopt($curl,CURLOPT_NOBODY,1);
//不返回html的body信息
curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);
//返回数据流,不直接输出
curl_setopt($curl,CURLOPT_TIMEOUT,5);
//超时时长,单位秒
curl_exec($curl);$rtn=curl_getinfo($curl,CURLINFO_HTTP_CODE);
curl_close($curl);return$rtn;}
调用GetHttpStatusCode(代理IP地址:端口)方法就能返回该代理IP在访问百度首页时所返回的状态码,在需要的地方对状态码进行判断就能加以利用了。
我在数据表中加入了抓取到代理IP的时间和代理IP被验证的时间,已经存活的时间,这样代理IP的稳定性就一目了然了。
这是验证后的结果,整整100个IP,最后就剩下10个左右,看来在使用之前对代理IP进行验证还是很有必要的。
推荐阅读:如何选择更好代理IP?
相关文章内容简介
1 如何用php定时验证代理IP是否可用
如何用php定时验证代理IP是否可用?用php先搭建网络爬虫,今天就利用上次爬到的http代理IP讲一讲代理IP的验证。至于为什么说PHP是世界上最好的语言,我也不知道,听别人说的,我个人比较喜欢java,以后有机会与大家分享我的学习之路。 我们为什么需要对代理IP进行验证呢?要知道我们在网络中抓到的代理IP数量很大,但能用的往往连十之一二都不到... [阅读全文]
最新标签
推荐阅读
15
2019-02
局域网环境下,设置代理IP突破限制上网
由于IP资源有限,基本上在办公区域使用的网络都是局域网的,还有一些企业由于各种的原因限制了员工的网络使用,比如通讯工具是内部的,不能使用类似于QQ和微信之类,又或者限制访问视
24
2019-06
如何查看有没有用代理ip?
有时候即使用了代理ip之后,还是会被对方发现我们使用了代理ip,对方是怎么发现的呢?
16
2018-10
还在手动换ip?黑洞代理ip自动更换器来了!
日常中使用的网络,ip通常是固定的,或者是使用动态ip,但传统的动态ip是通过重启后随机分配ip实现的,这种方式比较耗时间,那么有没有可以自动更换ip的方法呢?
28
2018-12
新手如何学习Python爬虫,能学到真正的技术
在大数据时代,网络爬虫可以做的事情比较多,除了应用于搜索引擎,还可以进行采集数据、数据分析,在数据的抓取方面可以作用巨大!爬虫在电商方面的作用,相信大家都有了解。
热门文章