小編給大家分享一下python爬蟲抓取網(wǎng)頁數(shù)據(jù)的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
成都創(chuàng)新互聯(lián)主要從事成都網(wǎng)站制作、網(wǎng)站設(shè)計(jì)、網(wǎng)頁設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)孝感,十年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專業(yè),歡迎來電咨詢建站服務(wù):18980820575
python簡(jiǎn)單網(wǎng)絡(luò)爬蟲獲取網(wǎng)頁數(shù)據(jù)
下面以獲取智聯(lián)招聘上一線及新一線城市所有與BIM相關(guān)的工作信息以便做一些數(shù)據(jù)分析為列
1、首先通過chrome在智聯(lián)招聘上搜索BIM的職位信息,跳出頁面后ctrl+u查看網(wǎng)頁源代碼,如沒有找到當(dāng)前頁面的職位信息。然后快捷鍵F12打開開發(fā)者工具窗口,刷新頁面,通過關(guān)鍵字過濾文件,找到一個(gè)包含職位的數(shù)據(jù)包。
2、查看這個(gè)文件的請(qǐng)求URL,分析其構(gòu)造發(fā)現(xiàn)數(shù)據(jù)包的請(qǐng)求URL由
‘https://fe-api.zhaopin.com/c/i/sou?’+請(qǐng)求參數(shù)組成,那么根據(jù)格式構(gòu)造了一個(gè)新的url( ‘https://fe-api.zhaopin.com/c/i/sou?pageSize=60&cityId=763&workExperience=-1&education=-1&companyType=-1&employmentType=-1&jobWelfareTag=-1&kw=造價(jià)員&kt=3’)
復(fù)制到瀏覽器進(jìn)行訪問測(cè)試,成功獲得相應(yīng)數(shù)據(jù)
3、取得的為json格式數(shù)據(jù),先將數(shù)據(jù)格式化,分析構(gòu)造,確定代碼中數(shù)據(jù)的解析方法。
4、 請(qǐng)求URL及數(shù)據(jù)結(jié)構(gòu)都清楚后,剩下的就是在代碼中實(shí)現(xiàn)URL的構(gòu)造、數(shù)據(jù)解析及導(dǎo)出。最后獲得1215個(gè)數(shù)據(jù),還需進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行整理,以便進(jìn)行數(shù)據(jù)分析。
看完了這篇文章,相信你對(duì)python爬蟲抓取網(wǎng)頁數(shù)據(jù)的方法有了一定的了解,想了解更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!