本篇文章為大家展示了如何在python中操作dataframe,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。
實(shí)例如下所示:
# -*- coding: utf-8 -*- import numpy as np import pandas as pd from pandas import * from numpy import * data = DataFrame(np.arange(16).reshape(4,4),index = list("ABCD"),columns=list('wxyz')) print data print data[0:2] #取前兩行數(shù)據(jù) print'+++++++++++++' print len(data ) #求出一共多少行 print data.columns.size #求出一共多少列 print'+++++++++++++' print data.columns #列索引名稱 print data.index #行索引名稱 print'+++++++++++++' print data.ix[1] #取第2行數(shù)據(jù) print data.iloc[1] #取第2行數(shù)據(jù) print'+++++++++++++' print data['x'] #取列索引為x的一列數(shù)據(jù) print data.loc['A'] #取第行索引為”A“的一行數(shù)據(jù), print'+++++++++++++' print data.loc[:,['x','z'] ] #表示選取所有的行以及columns為a,b的列; print data.loc[['A','B'],['x','z']] #表示選取'A'和'B'這兩行以及columns為x,z的列的并集; print'+++++++++++++' print data.iloc[1:3,1:3] #數(shù)據(jù)切片操作,切連續(xù)的數(shù)據(jù)塊 print data.iloc[[0,2],[1,2]] #即可以自由選取行位置,和列位置對(duì)應(yīng)的數(shù)據(jù),切零散的數(shù)據(jù)塊 print'+++++++++++++' print data[data>2] #表示選取數(shù)據(jù)集中大于0的數(shù)據(jù) print data[data.x>5] #表示選取數(shù)據(jù)集中x這一列大于5的所有的行 print'+++++++++++++' a1=data.copy() print a1[a1['y'].isin(['6','10'])] #表顯示滿足條件:列y中的值包含'6','8'的所有行。 print data.mean() #默認(rèn)對(duì)每一列的數(shù)據(jù)求平均值;若加上參數(shù)a.mean(1)則對(duì)每一行求平均值; print data['x'].value_counts() #統(tǒng)計(jì)某一列x中各個(gè)值出現(xiàn)的次數(shù): print data.describe() #對(duì)每一列數(shù)據(jù)進(jìn)行統(tǒng)計(jì),包括計(jì)數(shù),均值,std,各個(gè)分位數(shù)等。 data.to_excel(r'E:\pypractice\Yun\doc\2.xls',sheet_name='Sheet1') #數(shù)據(jù)輸出至Excel
上述內(nèi)容就是如何在python中操作dataframe,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。