最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

小象學(xué)院爬蟲實(shí)戰(zhàn)課

2023-05-26 16:45 作者:31775301  | 我要投稿

爬蟲的基本流程:

用戶獲取網(wǎng)絡(luò)數(shù)據(jù)的方式:


方式1:瀏覽器提交請(qǐng)求--->下載網(wǎng)頁代碼--->解析成頁面


方式2:模擬瀏覽器發(fā)送請(qǐng)求(獲取網(wǎng)頁代碼)->提取有用的數(shù)據(jù)->存放于數(shù)據(jù)庫或文件中


爬蟲要做的就是方式2;

爬蟲的基本流程:

用戶獲取網(wǎng)絡(luò)數(shù)據(jù)的方式:


方式1:瀏覽器提交請(qǐng)求--->下載網(wǎng)頁代碼--->解析成頁面


方式2:模擬瀏覽器發(fā)送請(qǐng)求(獲取網(wǎng)頁代碼)->提取有用的數(shù)據(jù)->存放于數(shù)據(jù)庫或文件中


爬蟲要做的就是方式2;

1、發(fā)起請(qǐng)求


使用http庫向目標(biāo)站點(diǎn)發(fā)起請(qǐng)求,即發(fā)送一個(gè)Request


Request包含:請(qǐng)求頭、請(qǐng)求體等


Request模塊缺陷:不能執(zhí)行JS 和CSS 代碼


2、獲取響應(yīng)內(nèi)容


如果服務(wù)器能正常響應(yīng),則會(huì)得到一個(gè)Response


Response包含:html,json,圖片,視頻等


3、解析內(nèi)容


解析html數(shù)據(jù):正則表達(dá)式(RE模塊),第三方解析庫如Beautifulsoup,pyquery等


解析json數(shù)據(jù):json模塊


解析二進(jìn)制數(shù)據(jù):以wb的方式寫入文件


4、保存數(shù)據(jù)


數(shù)據(jù)庫(MySQL,Mongdb、Redis)


文件


小象學(xué)院爬蟲實(shí)戰(zhàn)課的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
揭东县| 隆尧县| 惠水县| 石台县| 皋兰县| 静宁县| 本溪| 杂多县| 北京市| 武清区| 垣曲县| 大化| 康马县| 宝兴县| 高州市| 长沙县| 巩义市| 旌德县| 桃园市| 莫力| 祁门县| 丰台区| 凯里市| 崇仁县| 平山县| 和平县| 丰县| 于田县| 柳州市| 岚皋县| 海阳市| 秦皇岛市| 苗栗县| 双城市| 威远县| 长宁区| 雷山县| 满城县| 邹城市| 和硕县| 淮阳县|