這篇文章主要講解了Python實時檢測自身內(nèi)存占用的方法,內(nèi)容清晰明了,對此有興趣的小伙伴可以學(xué)習(xí)一下,相信大家閱讀完之后會有幫助。
創(chuàng)新互聯(lián)建站主要從事成都網(wǎng)站制作、做網(wǎng)站、網(wǎng)頁設(shè)計、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)淶源,十多年網(wǎng)站建設(shè)經(jīng)驗,價格優(yōu)惠、服務(wù)專業(yè),歡迎來電咨詢建站服務(wù):13518219792前言
最近在做文本統(tǒng)計,用 Python 實現(xiàn),遇到了一個比較有意思的難題——如何保存統(tǒng)計結(jié)果。
直接寫入內(nèi)存實在是放不下,十幾個小時后內(nèi)存耗盡,程序被迫關(guān)閉。如果直接寫入數(shù)據(jù)庫吧,每次寫入又太慢了,本來就十幾個小時了,這樣下去就要往星期上數(shù)了,也不是個辦法。
解決方案
最后,我想到了一個兩者兼顧的方案——用內(nèi)存做緩沖,達到一定量之后一次性將當(dāng)前所有數(shù)據(jù)合并到硬盤里。
但這樣就有一個閾值,如何確定同步硬盤的時機,通??梢园凑瘴募6冗M行處理,比如處理一個語料文件同步一次……但我的語料有大有小,大的有10GB,根本等不到那一刻內(nèi)存就爆炸了,后來我想用統(tǒng)計數(shù)據(jù)量進行判斷……可這又有點難以估計,小了吧頻繁寫入,緩存的意義就不大了,大了吧還沒等到條目數(shù)量達到,內(nèi)存就已經(jīng)爆滿。另外考慮到將來程序會運行在不同配置的設(shè)備上,讓其他開發(fā)者根據(jù)自身情況計算這個閾值也有點太不友好,于是我想到了一個辦法——不如讓 Python 自己檢測自己的內(nèi)存占用,如果快滿了(或者達到閾值),就同步寫入硬盤一次。
對于其他開發(fā)者來說,自身設(shè)備的內(nèi)存多大是很容易查看的,根據(jù)系統(tǒng)運行狀況設(shè)置一個合理的閾值,相當(dāng)方便。
要用 Python 監(jiān)控自身內(nèi)存占用,要使用 psutil 這個庫來和系統(tǒng)進行交互,基本邏輯就是先拿到自己的 pid ,然后根據(jù)這個 pid 去跟系統(tǒng)獲取進程信息。
def get_current_memory_gb() -> int: # 獲取當(dāng)前進程內(nèi)存占用。 pid = os.getpid() p = psutil.Process(pid) info = p.memory_full_info() return info.uss / 1024. / 1024. / 1024.