這篇文章主要介紹pandas DataFrame行列索引及值的獲取方法是什么,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!
成都創(chuàng)新互聯(lián)專(zhuān)注于黃陵網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠(chéng)為您提供黃陵?duì)I銷(xiāo)型網(wǎng)站建設(shè),黃陵網(wǎng)站制作、黃陵網(wǎng)頁(yè)設(shè)計(jì)、黃陵網(wǎng)站官網(wǎng)定制、重慶小程序開(kāi)發(fā)公司服務(wù),打造黃陵網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供黃陵網(wǎng)站排名全網(wǎng)營(yíng)銷(xiāo)落地服務(wù)。pandas DataFrame是二維的,所以,它既有列索引,又有行索引
列索引:
import pandas as pd df = pd.DataFrame({'A': [0, 1, 2], 'B': [3, 4, 5]}) print df # 結(jié)果: A B 0 0 3 1 1 4 2 2 5
行索引自動(dòng)生成了 0,1,2
如果要自己指定行索引和列索引,可以使用 index 和 column 參數(shù):
這個(gè)數(shù)據(jù)是5個(gè)車(chē)站10天內(nèi)的客流數(shù)據(jù):
ridership_df = pd.DataFrame( data=[[ 0, 0, 2, 5, 0], [1478, 3877, 3674, 2328, 2539], [1613, 4088, 3991, 6461, 2691], [1560, 3392, 3826, 4787, 2613], [1608, 4802, 3932, 4477, 2705], [1576, 3933, 3909, 4979, 2685], [ 95, 229, 255, 496, 201], [ 2, 0, 1, 27, 0], [1438, 3785, 3589, 4174, 2215], [1342, 4043, 4009, 4665, 3033]], index=['05-01-11', '05-02-11', '05-03-11', '05-04-11', '05-05-11', '05-06-11', '05-07-11', '05-08-11', '05-09-11', '05-10-11'], columns=['R003', 'R004', 'R005', 'R006', 'R007'] )
data 參數(shù)為一個(gè)numpy二維數(shù)組, index 參數(shù)為行索引, column 參數(shù)為列索引
生成的數(shù)據(jù)以表格形式顯示:
R003 R004 R005 R006 R007 05-01-11 0 0 2 5 0 05-02-11 1478 3877 3674 2328 2539 05-03-11 1613 4088 3991 6461 2691 05-04-11 1560 3392 3826 4787 2613 05-05-11 1608 4802 3932 4477 2705 05-06-11 1576 3933 3909 4979 2685 05-07-11 95 229 255 496 201 05-08-11 2 0 1 27 0 05-09-11 1438 3785 3589 4174 2215 05-10-11 1342 4043 4009 4665 3033
下面說(shuō)下如何獲取DataFrame里的值:
1.獲取某一列: 直接 ['key']
print(ridership_df['R003']) # 結(jié)果: 05-01-11 0 05-02-11 1478 05-03-11 1613 05-04-11 1560 05-05-11 1608 05-06-11 1576 05-07-11 95 05-08-11 2 05-09-11 1438 05-10-11 1342 Name: R003, dtype: int64
2.獲取某一行: .loc['key']
print(ridership_df.loc['05-01-11']) # 或者 print(ridership_df.iloc[0]) # 結(jié)果: R003 0 R004 0 R005 2 R006 5 R007 0 Name: 05-01-11, dtype: int64
3.獲取某一行某一列的某個(gè)值:
print(ridership_df.loc['05-05-11','R003']) # 或者 print(ridership_df.iloc[4,0]) # 結(jié)果: 1608
4.獲取原始的numpy二維數(shù)組:
print(ridership_df.values) # 結(jié)果: [[ 0 0 2 5 0] [1478 3877 3674 2328 2539] [1613 4088 3991 6461 2691] [1560 3392 3826 4787 2613] [1608 4802 3932 4477 2705] [1576 3933 3909 4979 2685] [ 95 229 255 496 201] [ 2 0 1 27 0] [1438 3785 3589 4174 2215] [1342 4043 4009 4665 3033]]
*注意在這過(guò)程中,數(shù)據(jù)格式如果不一致,會(huì)發(fā)生轉(zhuǎn)換.
一個(gè)綜合栗子:
從 ridership_df 找出第一天里客流量最多的車(chē)站,然后返回這個(gè)車(chē)站的日平均客流,以及返回所有車(chē)站的平均日客流,作為對(duì)比:
def mean_riders_for_max_station(ridership): max_index = ridership.iloc[0].argmax() mean_for_max = ridership[max_index].mean() overall_mean = ridership.values.mean() return (overall_mean, mean_for_max) print mean_riders_for_max_station(ridership_df) # 結(jié)果: (2342.6, 3239.9)
以上是“pandas DataFrame行列索引及值的獲取方法是什么”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!