最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

2021年最新Python爬蟲教程+實戰(zhàn)項目案例(新增scarpy部分+分布式爬

2023-02-16 15:43 作者:qjqjj  | 我要投稿

p31 去除爬取子頁面的代碼直接爬取圖片。 精簡了代碼,減少了requests的請求。

import requests
from bs4 import BeautifulSoup
import os

os.mkdir(r"D:\\python_homework\\src\\爬取內(nèi)容\\")

url = 'https://www.umei.cc/weimeitupian/xiaoqingxintupian/'
url_2 = 'https://www.umei.cc'

headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 SLBrowser/8.0.0.9071 SLBChan/105'
}

response = requests.get(url)
response.encoding = 'utf-8'
mian_page = BeautifulSoup(response.text, "html.parser")
imglist = mian_page.find("div", class_='item_list infinite_scroll').find_all("img", class_="lazy")

for i in imglist:
    img = requests.get(i.get("data-original"), headers=headers).content
    name = i.get("data-original").split("/")[-1]
    with open('D:\\python_homework\\src\\爬取內(nèi)容\\plcture\\{}'.format(name), 'wb')as fp:
        fp.write(img)
        print(name + "下載完成!")
fp.close()


2021年最新Python爬蟲教程+實戰(zhàn)項目案例(新增scarpy部分+分布式爬的評論 (共 條)

分享到微博請遵守國家法律
延吉市| 红安县| 兰州市| 台江县| 开阳县| 中超| 霍山县| 德安县| 昌乐县| 瑞昌市| 东山县| 额济纳旗| 杭锦旗| 清原| 旺苍县| 江西省| 九台市| 尼勒克县| 仁化县| 敦化市| 炉霍县| 江都市| 阳原县| 剑川县| 谷城县| 本溪市| 丹巴县| 吴堡县| 南靖县| 舟曲县| 道孚县| 泸水县| 通化市| 来宾市| 车致| 长葛市| 华池县| 瓦房店市| 东港市| 京山县| 横峰县|