第一句子网 > 花瓣网爬虫Python

花瓣网爬虫Python

时间：2024-05-26 12:47:22

相关推荐

花瓣网爬虫Python

花瓣主页

可爱头像

F12查看源码 script脚本中有很多链接

果然放的是宝宝图片

正则表达式匹配，get地址，大功告成。

import urllib.request import re import os dir = "E:/space/python/Request/huaban/pic/"url_re=pile(r'"(https://img2..+?)"') url='/explore/ertongtouxiang/' def url_open(url): html=urllib.request.urlopen(url).read() return html def get_img_adds(html): img_addrs=url_re.findall(html) img_addrs=list(set(img_addrs)) return img_addrs def save_img(dir,img_addrs,filename=0): for each in img_addrs: print("正在下载" + str(filename) + ".jpg") with open(dir + str(filename)+'.jpg','wb') as f: filename+=1 img=url_open(each) f.write(img) def download_huaban_img():foler = os.path.exists(dir)if not foler:os.mkdir(foler) os.chdir(foler) html=url_open(url) img_addrs=get_img_adds(html.decode('utf-8')) save_img(dir,img_addrs) if __name__=='__main__': download_huaban_img()

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。