利用Python的pandas數(shù)據(jù)結(jié)構(gòu)來讀取excel表格的數(shù)據(jù),部分代碼如下:
創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),振安企業(yè)網(wǎng)站建設(shè),振安品牌網(wǎng)站建設(shè),網(wǎng)站定制,振安網(wǎng)站建設(shè)報(bào)價(jià),網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,振安網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競(jìng)爭(zhēng)力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時(shí)我們時(shí)刻保持專業(yè)、時(shí)尚、前沿,時(shí)刻以成就客戶成長自我,堅(jiān)持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。
#-*- coding:utf-8 -*-
import pandas as pd
import matplotlib.pyplot as plt
catering_data="catering_sale.xls"
data=pd.read_excel(catering_data,index_col=u'日期')
#讀取數(shù)據(jù),指定"日期"列為索引列
大多數(shù)書上都是這樣寫的,但是在Python2.7上運(yùn)行時(shí)出現(xiàn)錯(cuò)誤。(沒有在Python3.x版本試過)
出現(xiàn)了如下問題:
這里寫圖片描述
使用help(pd.read_excel)發(fā)現(xiàn)參數(shù)中有必選參數(shù)sheetname,加入到函數(shù)中,代碼如下:
#-*- coding:utf-8 -*-
import pandas as pd
import matplotlib.pyplot as plt
catering_data="catering_sale.xls"
data=pd.read_excel(catering_data,sheetname=0,index_col=u'日期')
運(yùn)行成功。
sheetname=0 的意思是:讀取xls文件中的第一個(gè)表格。(假設(shè)文件中有很多個(gè)表格)
另外,也可以將文件轉(zhuǎn)換成csv格式,就不需要這個(gè)參數(shù)了。代碼如下:
catering_data="catering_sale.csv"
data=pd.read_csv(catering_data)
import?pandas?as?pd
Python中import的as語法,pd作為pandas的簡(jiǎn)寫,
后續(xù)對(duì)pandas的引用,可以直接使用pd
pd.DataFrame()函數(shù)是創(chuàng)建一個(gè)二維表
傳入的兩個(gè)參數(shù):
第一個(gè)是所存放的數(shù)據(jù)
np.random.rand(100,4) 這個(gè)的意思是生成指定維度的的[0,1)范圍之間的隨機(jī)數(shù),生成為維度100行4列的二維數(shù)組,下面的例子你可以作為參照
請(qǐng)點(diǎn)擊輸入圖片描述
而之后的
cumsum()其實(shí)第一個(gè)參數(shù)本來傳入的需要是數(shù)組,然后計(jì)算軸向元素累加和,
而你的例子中進(jìn)行了簡(jiǎn)化,即np.cumsum(a, 0) == a.cumsum(0)
其中的傳入?yún)?shù)0表示axis=0,即按照行累加,例子中即隨機(jī)數(shù)的累加
舉個(gè)例子a =[ [(1,2,3)],
? ? ? ? ? ? ? ?[(4,5,6)] ]
a.cumsum(0)就是
[ [(1,2,3)],
[(5,7,9)] ]~~~~~~~~(1+4)(2+5)(3+6)
第二個(gè)參數(shù)columns是DataFrame的列名分別為ABCD