如何用Python抓取上海美團火鍋的數(shù)據(jù)?
2020-12-18 09:24
Python進階學習交流
關注
最近有個小伙伴在群里問美團數(shù)據(jù)怎么獲取,而且她只要火鍋數(shù)據(jù),她在上海,只要求抓上海美團火鍋的數(shù)據(jù),而且要求也不高,只要100條,想做個簡單的分析,相關的字段如下圖所示。
乍一看,這個問題還真的是蠻難的,畢竟美團也不是那么好抓,什么驗證碼,模擬登陸等一大堆拂面而來,嚇得小伙伴都倒地了。
通過F12查看,抓包,分析URL,找規(guī)律,等等操作。
不過白慌,今天小編給大家介紹一個小技巧,另辟蹊徑去搞定美團的數(shù)據(jù),這里需要用到抓包工具Fiddler。講道理,之前我開始接觸網(wǎng)絡爬蟲的時候也沒有聽過這個東東,后來就慢慢知道了,而且它真的蠻實用的,建議大家都能學會用它。這個工具專門用于抓包,而且其安裝包也非常小,如下圖所示。
接下來,我們開始進行抓取信息。
1、在Fiddler的左側找到meituan網(wǎng)站的鏈接,如下圖所示。鏈接的左邊返回的response(響應)的文件類型,可以看到是JSON文件,爾后雙擊這一行鏈接。

聲明:
本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。
請輸入評論內容...
請輸入評論/評論長度6~500個字