qq:800819103
在线客服,实时响应qq群
在线客服,实时响应客服电话
13318873961代理ip如何协助爬虫爬取安居客二手房源信息!今天黑洞代理就为大家分享一下爬虫如何爬取安居客二手房源信息的。主要抓取目标是北京二手房信息,在爬取之前,我们先对要爬取的信息进行简单的数据分析。首先打开二手房信息的页面,右键检查,查找我们需要的信息所在的位置,然后进行抓取。
代码如下:
import requests,time,random
from bs4 import BeautifulSoup
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'}
for i in range(1,30):
url='https://beijing.anjuke.com/sale/p{}/'.format(i)
print(i)
#print(url)
respomse=requests.get(url,headers=headers)
time.sleep(random.randint(0,5)) #防止反爬
#print(respomse.text)
soup=BeautifulSoup(respomse.text,'lxml')
house_list = soup.find_all('li', class_="list-item")
for house in house_list:
title=house.find('div',class_='house-title').a.text.strip()
price=house.find('span',class_='price-det').text.strip()
#带增加
print('title:'+title+ ' price: '+price)
通过上述代码,我们就可以获取到安居客北京二手房源信息了,黑洞代理为您提供安全稳定、高效便捷的爬虫代理IP服务,更多问题请点击官网咨询客服。
相关文章内容简介
1 代理ip如何协助爬虫爬取安居客二手房源信息
代理ip如何协助爬虫爬取安居客二手房源信息!今天黑洞代理就为大家分享一下爬虫如何爬取安居客二手房源信息的。主要抓取目标是北京二手房信息,在爬取之前,我们先对要爬取的信息进行简单的数据分析。首先打开二手房信息的页面,右键检查,查找我们需要的信息所在的位置,然后进行抓取。 代码如下: import∵requests,time,random from∵bs4∵imp... [阅读全文]
最新标签
推荐阅读
21
2019-01
分享几个防止DDOS攻击的方法
互联网的高速增长,线上企业办公,线上游戏娱乐越来越多,也带来极大的经济收益,但有经济利益的地方,就有人想非法会去从中盈利,最直接的方法就是去攻击这些网站的服务器了。
31
2019-05
IP代理的作用是什么?
代理服务器收到远程服务器提供的信息存储到自己的硬盘上,假若有大量用户同时使用这个代理服务器,那么他们对因特网站点全部的要求都是经过这一台代理服务器,当有人浏览过某一个站点
31
2019-05
怎样高效的使用代理IP
代理服务器的功能就是代理网络用户去取得网络信息,也可以比喻为是网络信息的中转站。如果你想要突破访问限制,代理服务器可以帮助你,如果你想要隐藏自己的IP地址,代理
23
2019-08
爬虫代理IP怎么分类?
众所周知,没有大量的IP支撑,爬虫工作者寸步难行。那么爬虫代理IP从何而来呢?以下是我们总结的一些代理IP的解决方案。
热门文章