這篇文章主要為大家詳細(xì)介紹了在python中如何使用pandas處理excel,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下。
成都創(chuàng)新互聯(lián)公司堅(jiān)持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:成都網(wǎng)站建設(shè)、網(wǎng)站建設(shè)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿足客戶于互聯(lián)網(wǎng)時(shí)代的柞水網(wǎng)站設(shè)計(jì)、移動(dòng)媒體設(shè)計(jì)的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!在python中如何使用pandas處理excel
一、配置環(huán)境
1、pandas依賴(lài)處理Excel的xlrd模塊,安裝命令是:
pip install xlrd
2、安裝pandas模塊還需要一定的編碼環(huán)境,確保你的電腦有這些環(huán)境:Net.4 、VC-Compiler以及winsdk_web。
3、開(kāi)始安裝pandas,安裝命令是:
pip install pandas
二、pandas操作Excel表單
注意:加密文件是無(wú)法正常讀寫(xiě)的
首先需準(zhǔn)備一個(gè)表單
1、讀取excel文件的方式一:默認(rèn)讀取第一個(gè)表單:
import pandas as pd # 方法一:默認(rèn)讀取第一個(gè)表單 df = pd.read_excel("C:\\文件路徑\\文件名.xlsx") # 直接默認(rèn)讀取到Excel的第一個(gè)表單 data = df.head() # 默認(rèn)讀取前5行的數(shù)據(jù) print("獲取到所有的值:\n{0}".format(data)) # 格式化輸出
得到的結(jié)果是一個(gè)二維矩陣,如下圖所示:
2、讀取excel文件的方式二:通過(guò)制定表單名的方式讀?。?/strong>
import pandas as pd # 方法一:通過(guò)指定表單名的方式來(lái)讀取 df = pd.read_excel("C:\\文件路徑\\文件名.xlsx ", sheet_name='測(cè)試用例') # 直接默認(rèn)讀取到Excel的第一個(gè)表單 data = df.head() # 默認(rèn)讀取前5行的數(shù)據(jù) print("獲取到所有的值:\n{0}".format(data)) # 格式化輸出
得到的結(jié)果是一個(gè)二維矩陣,如下圖所示:
3、讀取excel文件的方法三:通過(guò)表單索引來(lái)指定要訪問(wèn)的表單,0表示第一個(gè)表單
import pandas as pd # df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ']) # 可以通過(guò)表單名同時(shí)指定多個(gè) df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ', sheet_name=0) # 可以通過(guò)表單索引來(lái)指定讀取的表單 # df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ', sheet_name=['功能模塊', 1]) # 可以混合的方式來(lái)指定 # df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ', sheet_name=[1, 2]) # 可以通過(guò)索引 同時(shí)指定多個(gè) data = df.values # 獲取所有的數(shù)據(jù),注意這里不能用head()方法哦~ print("獲取到所有的值:\n{0}".format(data)) # 格式化輸出
三、pandas操作Excel的行列
1:讀取指定的單行,數(shù)據(jù)會(huì)存在列表里面
import pandas as pd df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ') data = df.ix[0].values # 0表示第一行 這里讀取數(shù)據(jù)并不包含表頭,要注意哦! print("獲取到所有的值:\n{0}".format(data)) # 格式化輸出
2:讀取指定的多行,數(shù)據(jù)會(huì)存在嵌套的列表里面:
import pandas as pd df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ') data = df.ix[[1, 2]].values # 讀取指定多行的話,就要在ix[]里面嵌套列表指定行數(shù) print("獲取到所有的值:\n{0}".format(data)) # 格式化輸出
3:讀取指定的行列:
import pandas as pd df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ') data = df.ix[1, 2] # 讀取第一行第二列的值,這里不需要嵌套列表 print("獲取到所有的值:\n{0}".format(data)) # 格式化輸出
4:讀取指定的多行多列值:
import pandas as pd df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ') data = df.ix[[1, 2], ['序號(hào)', '功能劃分']].values # 讀取第一行第二行的序號(hào)以及功能劃分列的值,這里需要嵌套列表 print("獲取到所有的值:\n{0}".format(data)) # 格式化輸出
5:獲取所有行的指定列
import pandas as pd df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ') data = df.ix[:, ['序號(hào)', '功能劃分']].values # 讀所有行的“序號(hào)”以及“功能劃分”列的值,這里需要嵌套列表 print("獲取到所有的值:\n{0}".format(data)) # 格式化輸出
6:獲取行號(hào)并打印輸出
import pandas as pd df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ') print("輸出行號(hào)列表", df.index.values)
7:獲取列名并打印輸出
import pandas as pd df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ') print("輸出列標(biāo)題", df.columns.values)
8:獲取指定行數(shù)的值:
import pandas as pd df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ') print("輸出值:\n", df.sample(3).values) # 這個(gè)方法類(lèi)似于head()方法以及df.values方法
9:獲取指定列的值:
import pandas as pd df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ') print("輸出值\n", df['功能劃分'].values)
四、pandas處理Excel數(shù)據(jù)成為字典
import pandas as pd df = pd.read_excel(' C:\\文件路徑\\文件名.xlsx ') test_data = [] for i in df.index.values: # 獲取行號(hào)的索引,并對(duì)其進(jìn)行遍歷: # 根據(jù)i來(lái)獲取每一行指定的數(shù)據(jù) 并利用to_dict轉(zhuǎn)成字典 row_data = df.ix[i, ['序號(hào)', '功能劃分', '備注']].to_dict() test_data.append(row_data) print("最終獲取到的數(shù)據(jù)是:\n{0}".format(test_data))
以上就是在python中如何使用pandas處理excel的詳細(xì)內(nèi)容了,看完之后是否有所收獲呢?如果想了解更多相關(guān)內(nèi)容,歡迎來(lái)創(chuàng)新互聯(lián)建站行業(yè)資訊!