真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網站制作重慶分公司

python爬下來的數(shù)據(jù)如何保存-創(chuàng)新互聯(lián)

小編給大家分享一下python爬下來的數(shù)據(jù)如何保存,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

成都創(chuàng)新互聯(lián)公司致力于互聯(lián)網網站建設與網站營銷,提供成都網站設計、成都網站建設、網站開發(fā)、seo優(yōu)化、網站排名、互聯(lián)網營銷、重慶小程序開發(fā)公司、公眾號商城、等建站開發(fā),成都創(chuàng)新互聯(lián)公司網站建設策劃專家,為不同類型的客戶提供良好的互聯(lián)網應用定制解決方案,幫助客戶在新的全球化互聯(lián)網環(huán)境中保持優(yōu)勢。

python數(shù)據(jù)爬下來保存在本地,一般是文件或數(shù)據(jù)庫中,但是文件形式相比要更加簡單,如果只是自己寫爬蟲玩,可以用文件形式來保存數(shù)據(jù)。

#coding=utf-8
import urllib.request
import re
import os
 
'''
Urllib 模塊提供了讀取web頁面數(shù)據(jù)的接口,我們可以像讀取本地文件一樣讀取www和ftp上的數(shù)據(jù)
urlopen 方法用來打開一個url
read方法 用于讀取Url上的數(shù)據(jù)
'''
 
def getHtml(url):
    page = urllib.request.urlopen(url);
    html = page.read();
    return html;
 
def getImg(html):
    imglist = re.findall('img src="(http.*?)"',html)
    return imglist
 
html = getHtml("https://www.zhihu.com/question/34378366").decode("utf-8");
imagesUrl = getImg(html);
 
if os.path.exists("D:/imags") == False:
    os.mkdir("D:/imags");
    
count = 0;
for url in imagesUrl:
    print(url)
    if(url.find('.') != -1):
        name = url[url.find('.',len(url) - 5):];
        bytes = urllib.request.urlopen(url);
        f = open("D:/imags/"+str(count)+name, 'wb');
        f.write(bytes.read());
        f.flush();
        f.close();
        count+=1;

經測試,基本功能還是可以實現(xiàn)的?;ǖ妮^多的時間就是正則匹配哪里,因為自己對正則表達式也不是非常熟悉。所以還是花了點時間。

注:上面的程序基于 python 3.5。python3 和 python2 還是有些區(qū)別的。我剛開始看基礎語法的時候就栽了一些坑里。

以上是python爬下來的數(shù)據(jù)如何保存的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注創(chuàng)新互聯(lián)成都網站設計公司行業(yè)資訊頻道!

另外有需要云服務器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。


網站題目:python爬下來的數(shù)據(jù)如何保存-創(chuàng)新互聯(lián)
URL標題:http://weahome.cn/article/isejp.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部