最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【爬蟲(chóng)完整版】學(xué)完可以接任何爬蟲(chóng)副業(yè)單!來(lái)者不拒!目前B站最完整的python學(xué)

2023-02-28 01:55 作者:カクイ  | 我要投稿

P31 最新代碼來(lái)了,大家可以用我的代碼試試

目前只抓取1-10頁(yè)的,如何有需要大家自己改,但是不是惡意抓取,僅供學(xué)習(xí)!謝謝!

import dic as dic
import requests
import re
from io import StringIO
import json
from bs4 import BeautifulSoup
import lxml

if __name__ == "__main__":
    for i in range(1, 11):
        url = 'https://www.umei.cc/bizhitupian/meinvbizhi/'
        if i > 1:
            url = 'https://www.umei.cc/bizhitupian/meinvbizhi/' + 'index_' + str(i) + '.htm'
        print(url)
        headers = {
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.'
        }
        dic = {
            'href': ''
        }
        response = requests.get(url=url, headers=headers, stream=True)
        response.encoding = 'utf-8'
        page_text = BeautifulSoup(response.text, 'html.parser')
        d_list = page_text.find('div', {'id': 'infinite_scroll'}).find_all('div', class_='title')
        for d in d_list:
            href = 'https://www.umei.cc/' + d.find('a').get('href')
            url1 = href
            headers1 = {
                'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.'
            }
            response1 = requests.get(url=url1, headers=headers1, stream=True)
            response1.encoding = 'utf-8'
            page_text1 = BeautifulSoup(response1.text, 'html.parser')
            big = page_text1.find('div', class_='big-pic')
            big_src = big.find('img').get('src')
            print(big_src)


【爬蟲(chóng)完整版】學(xué)完可以接任何爬蟲(chóng)副業(yè)單!來(lái)者不拒!目前B站最完整的python學(xué)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
正安县| 安西县| 东安县| 盱眙县| 万山特区| 策勒县| 横山县| 上饶县| 龙泉市| 临汾市| 本溪| 东源县| 合山市| 军事| 赣州市| 普安县| 浦县| 徐水县| 普格县| 青浦区| 越西县| 奇台县| 池州市| 华坪县| 玉环县| 应城市| 图木舒克市| 靖远县| 乐安县| 翁源县| 和政县| 嘉荫县| 正镶白旗| 平江县| 福贡县| 迁西县| 建德市| 太康县| 赫章县| 丹江口市| 内江市|