真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯網站制作重慶分公司

Python爬蟲--個人微博發(fā)布的全部照片、視頻

1、我們的目標是獲取微博某博主的全部圖片、視頻

作為一家“創(chuàng)意+整合+營銷”的成都網站建設機構,我們在業(yè)內良好的客戶口碑。創(chuàng)新互聯建站提供從前期的網站品牌分析策劃、網站設計、成都網站設計、網站建設、創(chuàng)意表現、網頁制作、系統開發(fā)以及后續(xù)網站營銷運營等一系列服務,幫助企業(yè)打造創(chuàng)新的互聯網品牌經營模式與有效的網絡營銷方法,創(chuàng)造更大的價值。

2、拿到網址后 我們先觀察 打開F12隨著下滑我們發(fā)現加載出來了一個叫mymblog的東西,展開響應發(fā)現需要的東西就在里面

3、重點來了!??!

通過觀察發(fā)現第二頁比第一頁多了參數since_id 而第二頁的since_id參數剛好在上一頁中能獲取到,往下翻頁同理 第二頁帶著第三頁需要的參數

4、因為是get請求 接下來就是設置params對下面網址進行請求然后提取bloghttps://weibo.com/ajax/statuses/mymblog

5、不會翻頁的我還發(fā)現了個簡單的方法 不用帶since_id參數,只需要給page來個循環(huán)也可實現循環(huán) 具體如下:
  5.1、把網址設置成這樣,

https://weibo.com/ajax/statuses/mymblog?uid=&page=2&feature=0&since_id=

  5.2、去掉params 具體為啥不帶參數也能出來 我也不清楚 反正是發(fā)現這么設置url可以實現翻頁

6、最后看看出來結果(部分照片屬于會員可見,但是依然可以拿到高清原圖。未顯示出來的是因為0擦邊嚴重被微博封了)

7、具體代碼如下

 1 import requests
 2 
 3 headres = {
 4 '你的': '微博cookie',
 5 'referer': 'https://weibo.com/u/',
 6 '你的': 'UA',
 7 'x-requested-with': 'XMLHttpRequest',
 8 'x-xsrf-token': '1_g5J4kMvprJh8xD1YgaHWmv'
 9 }
10 
11 shipindizhi = './陳佩琪個人微博視頻/'
12 tupiandizhi = './陳佩琪個人微博照片/'
13 n = 1
14 x = 1
15 for g in range(1, 11):
16 url = f'https://weibo.com/ajax/statuses/mymblog?uid=&page={g}&feature=0&since_id='
17 
18 rsp_fanye = requests.get(url=url, headers=headres).json()
19 since_id = rsp_fanye['data']['since_id']
20 print(since_id)
21 neirong = rsp_fanye['data']['list']
22 # 獲得圖片(獲得文本,有圖片獲得圖片)
23 for i in neirong:
24 text = i['text_raw'].replace('\n','')
25 if 'pic_infos' in i:
26 tupian = i['pic_infos']
27 # print(tupian)
28 for j in tupian:
29 # print(j)
30 tupian_url = i['pic_infos'][j]['mw2000'].get('url')
31 # print(tupian_url)
32 pinjie = tupiandizhi + 'tupian_%s' % x + '.' + '.jpg'
33 f = open(pinjie, mode='wb')
34 f.write(requests.get(url=tupian_url).content)
35 x += 1
36 print(pinjie+'圖片保存成功!??!')
37 
38 # 獲得視頻
39 for j in neirong:
40 if 'page_info' in j:
41 shiping = j['page_info']
42 if 'media_info' in shiping:
43 media_info = shiping['media_info']['mp4_720p_mp4']
44 # print(media_info)
45 pinjie = shipindizhi + 'shiping_%s' % n + '.' + '.mp4'
46 f = open(pinjie, mode='wb')
47 f.write(requests.get(url=media_info).content)
48 n += 1
49 print(pinjie+'圖片保存成功?。?!')

網頁題目:Python爬蟲--個人微博發(fā)布的全部照片、視頻
本文鏈接:http://weahome.cn/article/dsogigi.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部