這篇文章主要介紹使用python的statsmodels模塊擬合ARIMA模型,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
在利辛等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供做網(wǎng)站、成都網(wǎng)站制作 網(wǎng)站設(shè)計制作按需設(shè)計網(wǎng)站,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),成都品牌網(wǎng)站建設(shè),成都營銷網(wǎng)站建設(shè),成都外貿(mào)網(wǎng)站建設(shè),利辛網(wǎng)站建設(shè)費用合理。導入必要包和模塊
from scipy import statsimport pandas as pdimport matplotlib.pyplot as pltimport statsmodels.api as smfrom statsmodels.tsa.arima.model import ARIMAfrom statsmodels.graphics.tsaplots import plot_predict plt.rcParams['font.sans-serif']=['simhei']#用于正常顯示中文標簽plt.rcParams['axes.unicode_minus']=False#用于正常顯示負號
1.讀取數(shù)據(jù)并畫圖
data=pd.read_csv('數(shù)據(jù)/客運量.csv',index_col=0)data.index = pd.Index(sm.tsa.datetools.dates_from_range('1949', '2008'))#將時間列改為專門時間格式,方便后期操作data.plot(figsize=(12,8),marker='o',color='black',ylabel='客運量')#畫圖
#本文所使用的客流量時間序列數(shù)據(jù):https://download.csdn.net/download/weixin_45590329/14143811
#時間序列折線圖如下所示,顯然數(shù)據(jù)有遞增趨勢,初步判斷數(shù)據(jù)不平穩(wěn)
2.平穩(wěn)性檢驗
sm.tsa.adfuller(data,regression='c')sm.tsa.adfuller(data,regression='nc')sm.tsa.adfuller(data,regression='ct')
進行三種形式的ADF單位根檢驗,如部分結(jié)果所示,發(fā)現(xiàn)序列不平穩(wěn)
3.對數(shù)據(jù)作一階差分處理
diff=data.diff(1)diff.dropna(inplace=True)diff.plot(figsize=(12,8),marker='o',color='black')#畫圖
作出數(shù)據(jù)一階差分后折線圖,初步判斷平穩(wěn)
4.對一階差分數(shù)據(jù)進行平穩(wěn)性檢驗
sm.tsa.adfuller(diff,regression='c')sm.tsa.adfuller(diff,regression='nc')sm.tsa.adfuller(diff,regression='ct')
如圖所示,說明序列平穩(wěn)
5.確定ARIMA(p,d,q)階數(shù)
fig = plt.figure(figsize=(12,8))ax1 = fig.add_subplot(211)fig = sm.graphics.tsa.plot_acf(diff.values.squeeze(), lags=12, ax=ax1)#自相關(guān)系數(shù)圖1階截尾,決定MA(1)ax2 = fig.add_subplot(212)fig = sm.graphics.tsa.plot_pacf(diff, lags=12, ax=ax2)#偏相關(guān)系數(shù)圖1階截尾,決定AR(1)
根據(jù)自相關(guān)系數(shù)圖ACF和偏自相關(guān)系數(shù)圖PACF,將原始數(shù)據(jù)確定為ARIMA(1,1,1)模型
6.參數(shù)估計
model = ARIMA(data, order=(1, 1, 1)).fit()#擬合模型model.summary()#統(tǒng)計信息匯總#系數(shù)檢驗params=model.params#系數(shù)tvalues=model.tvalues#系數(shù)t值bse=model.bse#系數(shù)標準誤pvalues=model.pvalues#系數(shù)p值#繪制殘差序列折線圖resid=model.resid#殘差序列fig = plt.figure(figsize=(12,8))ax = fig.add_subplot(111)ax = model.resid.plot(ax=ax)#計算模型擬合值fit=model.predict(exog=data[['TLHYL']])
7.模型檢驗
#8.1.檢驗序列自相關(guān)sm.stats.durbin_watson(model.resid.values)#DW檢驗:靠近2——正常;靠近0——正自相關(guān);靠近4——負自相關(guān)#8.2.AIC和BIC準則model.aic#模型的AIC值model.bic#模型的BIC值#8.3.殘差序列正態(tài)性檢驗stats.normaltest(resid)#檢驗序列殘差是否為正態(tài)分布#最終檢驗結(jié)果顯示無法拒絕原假設(shè),說明殘差序列為正態(tài)分布,模型擬合良好#8.4.繪制殘差序列自相關(guān)圖和偏自相關(guān)圖fig = plt.figure(figsize=(12,8))ax1 = fig.add_subplot(211)fig = sm.graphics.tsa.plot_acf(resid.values.squeeze(), lags=12, ax=ax1)ax2 = fig.add_subplot(212)fig = sm.graphics.tsa.plot_pacf(resid, lags=12, ax=ax2)#如果兩圖都零階截尾,這說明模型擬合良好
8.預(yù)測
#預(yù)測至2016年的數(shù)據(jù)。由于ARIMA模型有兩個參數(shù),至少需要包含兩個初始數(shù)據(jù),因此從2006年開始預(yù)測predict = model.predict('2006', '2016', dynamic=True)print(predict)#畫預(yù)測圖及置信區(qū)間圖fig, ax = plt.subplots(figsize=(10,8))fig = plot_predict(model, start='2002', end='2006', ax=ax)legend = ax.legend(loc='upper left')
以上是“使用python的statsmodels模塊擬合ARIMA模型”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!