
qq:800819103
在线客服,实时响应
qq群
在线客服,实时响应
客服电话
13318873961爬虫如何爬取京东上的手机图片?今天黑洞代理ip就为大家分享一下爬虫是如何爬取京东上的手机图片的。首先我们先打开京东,输入要爬取的商品,比如手机。然后分析页面和网址,查看我们要爬取的信息位置和网址的变化。
代码如下:
import re
import urllib.request
def craw(url,page):
#获取网页源代码
html1 = urllib.request.urlopen(url).read()
html1 = str(html1)
#对网页源码进行过滤,只保留和产品列表相关的信息
pat1 = '<div id="plist".+?
'
result1 = re.compile(pat1).findall(html1)
result1 = result1[0]
#print(result1)
#再次过滤,提取网页中图片的链接,并将链接地址存储在列表中
pat2 = ''
imagelist = re.compile(pat2).findall(result1)
x = 1
#遍历列表,将链接存储到本地
for imageurl in imagelist:
imagename = "D:/jd/img1/" + str(page) + str(x) + ".jpg"
imageurl = "http://" + imageurl
try:
urllib.request.urlretrieve(imageurl,filename=imagename)
except urllib.error.URLError as e:
if hasattr(e,"code"):
x+=1
if hasattr(e,"reason"):
x+=1
x+=1
#通过for循环,将该分类下的所有网页都爬取一遍
for i in range(1,88):
url = "https://list.jd.com/list.html?cat=9987,653,655&page="+str(i)
craw(url,i)
以上就是关于爬虫如何爬取京东上的手机图片的介绍了,黑洞代理ip可为您提供海量IP资源,助您不间断获取行业数据,赢在大数据时代!
相关文章内容简介
1 爬虫如何爬取京东上的手机图片?
爬虫如何爬取京东上的手机图片?今天黑洞代理ip就为大家分享一下爬虫是如何爬取京东上的手机图片的。首先我们先打开京东,输入要爬取的商品,比如手机。然后分析页面和网址,查看我们要爬取的信息位置和网址的变化。 代码如下: import∵re import∵urllib.request def∵craw(url,page): #获取网页源代码 html1∵=∵urllib.request.urlopen(url).rea... [阅读全文]
最新标签
推荐阅读
15
2019-04
哪些因素影响网页使用代理IP的效果
不同的人去同一个地方,会发出不同的感慨。不同的用户使用同一款软件,也会有褒贬不一的评价。下面随小编解析下究竟有哪些因素影响网页换IP软件的使用效果。
02
2019-07
浅谈爬虫的工作原理及三大模块
传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂,
03
2019-01
动态ip不能获取到ip地址怎么解决?
虽说互联网无处不在,但许多人都不知晓不能上网如何解决,例如如何设置网络连接,读取不到IP该怎么办,如何修改ip地址等等。这些难题可能和线路联接、IP发生冲突、服务提供商绑定及其WA
09
2019-05
代理IP软件有哪些好处
生活中很多人都没有听说过代理IP软件,更不知道它有什么用途,但是对于很多网络推销员或者专门的网上投票公司,以及一些喜欢玩网络游戏的的朋友们,应该就对代理IP软件比较熟悉了,享
热门文章