這篇文章主要介紹Python如何讀取xlsx文件,文中介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們一定要看完!
成都創(chuàng)新互聯(lián)公司公司2013年成立,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項目網(wǎng)站設(shè)計制作、網(wǎng)站設(shè)計網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元錫林郭勒盟做網(wǎng)站,已為上家服務(wù),為錫林郭勒盟各地企業(yè)和個人服務(wù),聯(lián)系電話:13518219792Python是一種編程語言,內(nèi)置了許多有效的工具,Python幾乎無所不能,該語言通俗易懂、容易入門、功能強(qiáng)大,在許多領(lǐng)域中都有廣泛的應(yīng)用,例如最熱門的大數(shù)據(jù)分析,人工智能,Web開發(fā)等。
腳本如下:
from openpyxl import load_workbook workbook = load_workbook(u'/tmp/test.xlsx') #找到需要xlsx文件的位置 booksheet = workbook.active #獲取當(dāng)前活躍的sheet,默認(rèn)是第一個sheet #如果想獲取別的sheet頁采取下面這種方式,先獲取所有sheet頁名,在通過指定那一頁。 # sheets = workbook.get_sheet_names() # 從名稱獲取sheet # booksheet = workbook.get_sheet_by_name(sheets[0]) #獲取sheet頁的行數(shù)據(jù) rows = booksheet.rows #獲取sheet頁的列數(shù)據(jù) columns = booksheet.columns i = 0 # 迭代所有的行 for row in rows: i = i + 1 line = [col.value for col in row] cell_data_1 = booksheet.cell(row=i, column=3).value #獲取第i行1 列的數(shù)據(jù) cell_data_2 = booksheet.cell(row=i, column=4).value #獲取第i行 2 列的數(shù)據(jù) cell_data_3 = booksheet.cell(row=i, column=8).value #獲取第i行 3 列的數(shù)據(jù) cell_data_4 = booksheet.cell(row=i, column=18).value #獲取第i行 4 列的數(shù)據(jù) print (cell_data_1, cell_data_2, cell_data_3, cell_data_4)
實例:python讀取excel數(shù)據(jù)做分類統(tǒng)計
某excel中記錄了某個人的通話記錄,下面程序?qū)凑胀ㄔ挼攸c,通話類型等統(tǒng)計通話時間
# -*- coding:utf-8 -*- import xlrd import datetime infos=[] info_file=xlrd.open_workbook('src.xls')#打開excel文件 info_sheet=info_file.sheets()[0]#通過索引順序獲取工作表 row_count=info_sheet.nrows#獲取行數(shù),列數(shù)ncols for row in range(1,row_count): time_string=info_sheet.cell(row,3).value time_s_sp=time_string.split(':') infos.append(#該數(shù)組里放了row_count個字典 { 'type':info_sheet.cell(row,2).value,#獲取單元格,通話類型,主叫被叫 'other_cellphone':info_sheet.cell(row,0).value,#對方號碼, 'timespan':datetime.timedelta(seconds=int(time_s_sp[2]),minutes=int(time_s_sp[1]),hours=int(time_s_sp[0])), 'gpscity':info_sheet.cell(row,5).value#通話是本地還是外地 } ) time_all=datetime.timedelta(seconds=0)#初始化 time_types={} time_classes={} time_numbers={} for infor in infos:#取出該數(shù)組里的字典 time_all +=infor['timespan']#求總通話次數(shù) infor_type=infor['type'] if infor_type in time_types: time_types[infor_type]+=infor['timespan'] else: time_types[infor_type]=infor['timespan']#按通話類型統(tǒng)計通話時間 infor_class=infor['gpscity'] if infor_class in time_classes: time_classes[infor_class]+=infor['timespan'] else: time_classes[infor_class]=infor['timespan']#這里相當(dāng)于先分類賦值再++,按歸屬地統(tǒng)計通話時間 infor_number=infor['other_cellphone'] if infor_number in time_numbers: time_numbers[infor_number]+=infor['timespan'] else: time_numbers[infor_number]=infor['timespan']#根據(jù)號碼統(tǒng)計通話時間 print '總通話時間:%s' % time_all print print '總通話方式分類' for k,v in time_types.items(): print k.encode('utf-8'),v print print '通話類型分類:' for k,v in time_classes.items(): print k.encode('utf-8'),v print print '對方號碼分類:' for k,v in time_numbers.items(): print k,v
再優(yōu)化下代碼
# -*- coding:utf-8 -*- import xlrd from datetime import timedelta def read_excel(file_excel):#讀excel并將需要的數(shù)據(jù)分類放在數(shù)組里 infos=[] info_file=xlrd.open_workbook(file_excel) info_sheet=info_file.sheets()[0] row_count=info_sheet.nrows for row in range(1,row_count): time_string=info_sheet.cell(row,3).value time_s_sp=time_string.split(':') infos.append( { 'type':info_sheet.cell(row,2).value, 'other_cellphone':info_sheet.cell(row,0).value, 'timespan':timedelta(seconds=int(time_s_sp[2]),minutes=int(time_s_sp[1]),hours=int(time_s_sp[0])), 'gpscity':info_sheet.cell(row,5).value } ) return infos def count_cell(list_dirs,infotype):#統(tǒng)計總通話及分類統(tǒng)計結(jié)果,存在字典里 result_dir={} time_all=timedelta(seconds=0) for list_dir in list_dirs: time_all +=list_dir['timespan'] info_type = list_dir[infotype] if info_type not in result_dir: result_dir[info_type]=list_dir['timespan'] else: result_dir[info_type]+=list_dir['timespan'] return time_all,result_dir def print_result(result_dir):#打印數(shù)據(jù) for k,v in result_dir.items(): print k.encode('utf-8'),v if __name__=="__main__": list_dirs=read_excel('src.xls') time_all,result_type=count_cell(list_dirs,'type') result_cell=count_cell(list_dirs,'other_cellphone') result_gpscity = count_cell(list_dirs, 'gpscity') print '總通話時間:%s' % time_all print '按照通話類型分類:' print_result(result_type) print '按照號碼分類:' print_result(result_cell[1]) print '按照歸屬地分類:' print_result(result_gpscity[1])
以上是“Python如何讀取xlsx文件”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計公司行業(yè)資訊頻道!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。