pandas在DataFrame中通過索引高效獲取數(shù)據(jù)的方法

pandas在DataFrame中通過索引高效獲取數(shù)據(jù)的方法？這個(gè)問題可能是我們?nèi)粘W(xué)習(xí)或工作經(jīng)常見到的。希望通過這個(gè)問題能讓你收獲頗深。下面是小編給大家?guī)淼膮⒖純?nèi)容，讓我們一起來看看吧！

成都創(chuàng)新互聯(lián)公司是一家網(wǎng)站設(shè)計(jì)公司，集創(chuàng)意、互聯(lián)網(wǎng)應(yīng)用、軟件技術(shù)為一體的創(chuàng)意網(wǎng)站建設(shè)服務(wù)商，主營產(chǎn)品：自適應(yīng)網(wǎng)站建設(shè)、成都品牌網(wǎng)站建設(shè)、成都全網(wǎng)營銷推廣。我們專注企業(yè)品牌在網(wǎng)站中的整體樹立，網(wǎng)絡(luò)互動(dòng)的體驗(yàn)，以及在手機(jī)等移動(dòng)端的優(yōu)質(zhì)呈現(xiàn)。網(wǎng)站建設(shè)、成都網(wǎng)站設(shè)計(jì)、移動(dòng)互聯(lián)產(chǎn)品、網(wǎng)絡(luò)運(yùn)營、VI設(shè)計(jì)、云產(chǎn)品.運(yùn)維為核心業(yè)務(wù)。為用戶提供一站式解決方案，我們深知市場(chǎng)的競爭激烈，認(rèn)真對(duì)待每位客戶，為客戶提供賞析悅目的作品，網(wǎng)站的價(jià)值服務(wù)。

數(shù)據(jù)對(duì)齊

我們可以計(jì)算兩個(gè)DataFrame的加和，pandas會(huì)自動(dòng)將這兩個(gè)DataFrame進(jìn)行數(shù)據(jù)對(duì)齊，如果對(duì)不上的數(shù)據(jù)會(huì)被置為Nan（not a number）。

首先我們來創(chuàng)建兩個(gè)DataFrame：

import numpy as npimport pandas as pddf1 = pd.DataFrame(np.arange(9).reshape((3, 3)), columns=list('abc'), index=['1', '2', '3'])df2 = pd.DataFrame(np.arange(12).reshape((4, 3)), columns=list('abd'), index=['2', '3', '4', '5'])復(fù)制代碼

得到的結(jié)果和我們?cè)O(shè)想的一致，其實(shí)只是通過numpy數(shù)組創(chuàng)建DataFrame，然后指定index和columns而已，這應(yīng)該算是很基礎(chǔ)的用法了。

然后我們將兩個(gè)DataFrame相加，會(huì)得到：

我們發(fā)現(xiàn)pandas將兩個(gè)DataFrame加起來合并了之后，凡是沒有在兩個(gè)DataFrame都出現(xiàn)的位置就會(huì)被置為Nan。這其實(shí)是很有道理的，實(shí)際上不只是加法，我們可以計(jì)算兩個(gè)DataFrame的加減乘除的四則運(yùn)算都是可以的。如果是計(jì)算兩個(gè)DataFrame相除的話，那么除了對(duì)應(yīng)不上的數(shù)據(jù)會(huì)被置為Nan之外，除零這個(gè)行為也會(huì)導(dǎo)致異常值的發(fā)生（可能不一定是Nan，而是inf）。

fill_value

如果我們要對(duì)兩個(gè)DataFrame進(jìn)行運(yùn)算，那么我們當(dāng)然不會(huì)希望出現(xiàn)空值。這個(gè)時(shí)候就需要對(duì)空值進(jìn)行填充了，我們直接使用運(yùn)算符進(jìn)行運(yùn)算是沒辦法傳遞參數(shù)進(jìn)行填充的，這個(gè)時(shí)候我們需要使用DataFrame當(dāng)中為我們提供的算術(shù)方法。

DataFrame當(dāng)中常用的運(yùn)算符有這么幾種：

add、sub、p這些我們都很好理解，那么這里的radd、rsub方法又是什么意思呢，為什么前面要加上一個(gè)r呢？

看起來費(fèi)解，但是說白了一文不值，radd是用來翻轉(zhuǎn)參數(shù)的。舉個(gè)例子，比如說我們希望得到DataFrame當(dāng)中所有元素的倒數(shù)，我們可以寫成1 / df。由于1本身并不是一個(gè)DataFrame，所以我們不能用1來呼叫DataFrame當(dāng)中的方法，也就不能傳遞參數(shù)，為了解決這種情況，我們可以把1 / df寫成df.rp(1)，這樣我們就可以在其中傳遞參數(shù)了。

由于在算除法的過程當(dāng)中發(fā)生了除零，所以我們得到了一個(gè)inf，它表示無窮大。

我們可以在add、p這些方法當(dāng)中傳入一個(gè)fill_value的參數(shù)，這個(gè)參數(shù)可以在計(jì)算之前對(duì)于一邊出現(xiàn)缺失值的情況進(jìn)行填充。也就是說對(duì)于對(duì)于只在一個(gè)DataFrame中缺失的位置會(huì)被替換成我們指定的值，如果在兩個(gè)DataFrame都缺失，那么依然還會(huì)是Nan。

我們對(duì)比下結(jié)果就能發(fā)現(xiàn)了，相加之后的(1, d), (4, c)以及(5, c)的位置都是Nan，因?yàn)閐f1和df2兩個(gè)DataFrame當(dāng)中這些位置都是空值，所以沒有被填充。

fill_value這個(gè)參數(shù)在很多api當(dāng)中都有出現(xiàn)，比如reindex等，用法都是一樣的，我們?cè)诓殚哸pi文檔的時(shí)候可以注意一下。

那么對(duì)于這種填充了之后還出現(xiàn)的空值我們應(yīng)該怎么辦呢？難道只能手動(dòng)找到這些位置進(jìn)行填充嗎？當(dāng)然是不現(xiàn)實(shí)的，pandas當(dāng)中還為我們提供了專門解決空值的api。

空值api

在填充空值之前，我們首先要做的是發(fā)現(xiàn)空值。針對(duì)這個(gè)問題，我們有isna這個(gè)api，它會(huì)返回一個(gè)bool型的DataFrame，DataFrame當(dāng)中的每一個(gè)位置表示了原DataFrame對(duì)應(yīng)的位置是否是空值。

dropna

當(dāng)然只是發(fā)現(xiàn)是否是空值肯定是不夠的，我們有時(shí)候會(huì)希望不要空值的出現(xiàn)，這個(gè)時(shí)候我們可以選擇drop掉空值。針對(duì)這種情況，我們可以使用DataFrame當(dāng)中的dropna方法。

我們發(fā)現(xiàn)使用了dropna之后，出現(xiàn)了空值的行都被拋棄了。只保留了沒有空值的行，有時(shí)候我們希望拋棄是的列而不是行，這個(gè)時(shí)候我們可以通過傳入axis參數(shù)進(jìn)行控制。

這樣我們得到的就是不含空值的列，除了可以控制行列之外，我們還可以控制執(zhí)行drop的嚴(yán)格程度。我們可以通過how這個(gè)參數(shù)來判斷，how支持兩種值傳入，一種是'all'，一種是'any'。all表示只有在某一行或者是某一列全為空值的時(shí)候才會(huì)拋棄，any與之對(duì)應(yīng)就是只要出現(xiàn)了空值就會(huì)拋棄。默認(rèn)不填的話認(rèn)為是any，一般情況下我們也用不到這個(gè)參數(shù)，大概有個(gè)印象就可以了。

fillna

pandas除了可以drop含有空值的數(shù)據(jù)之外，當(dāng)然也可以用來填充空值，事實(shí)上這也是最常用的方法。

我們可以很簡單地傳入一個(gè)具體的值用來填充：

fillna會(huì)返回一個(gè)新的DataFrame，其中所有的Nan值會(huì)被替換成我們指定的值。如果我們不希望它返回一個(gè)新的DataFrame，而是直接在原數(shù)據(jù)進(jìn)行修改的話，我們可以使用inplace參數(shù)，表明這是一個(gè)inplace的操作，那么pandas將會(huì)在原DataFrame上進(jìn)行修改。

df3.fillna(3, inplace=True)復(fù)制代碼

除了填充具體的值以外，我們也可以和一些計(jì)算結(jié)合起來算出來應(yīng)該填充的值。比如說我們可以計(jì)算出某一列的均值、最大值、最小值等各種計(jì)算來填充。fillna這個(gè)函數(shù)不僅可以使用在DataFrame上，也可以使用在Series上，所以我們可以針對(duì)DataFrame中的某一列或者是某些列進(jìn)行填充：

除了可以計(jì)算出均值、最大最小值等各種值來進(jìn)行填充之外，還可以指定使用缺失值的前一行或者是后一行的值來填充。實(shí)現(xiàn)這個(gè)功能需要用到method這個(gè)參數(shù)，它有兩個(gè)接收值，ffill表示用前一行的值來進(jìn)行填充，bfill表示使用后一行的值填充。

我們可以看到，當(dāng)我們使用ffill填充的時(shí)候，對(duì)于第一行的數(shù)據(jù)來說由于它沒有前一行了，所以它的Nan會(huì)被保留。同樣當(dāng)我們使用bfill的時(shí)候，最后一行也無法填充。

感謝各位的閱讀！看完上述內(nèi)容，你們對(duì)pandas在DataFrame中通過索引高效獲取數(shù)據(jù)的方法大概了解了嗎？希望文章內(nèi)容對(duì)大家有所幫助。如果想了解更多相關(guān)文章內(nèi)容，歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

網(wǎng)站標(biāo)題：pandas在DataFrame中通過索引高效獲取數(shù)據(jù)的方法
路徑分享：http://weahome.cn/article/pehcpo.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

pandas在DataFrame中通過索引高效獲取數(shù)據(jù)的方法

數(shù)據(jù)對(duì)齊

fill_value

空值api

dropna

fillna

其他資訊

網(wǎng)站制作

企業(yè)服務(wù)

網(wǎng)站建設(shè)

服務(wù)器托管