常用的27個Stata命令
成都創(chuàng)新互聯(lián)公司專注于三都網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供三都營銷型網(wǎng)站建設(shè),三都網(wǎng)站制作、三都網(wǎng)頁設(shè)計、三都網(wǎng)站官網(wǎng)定制、重慶小程序開發(fā)服務(wù),打造三都網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供三都網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。【1】直接導(dǎo)入csv格式數(shù)據(jù)
insheet using name.csv, clear
【2】修改變量長度
format var %20.2g
【3】刪除重復(fù)值
sort var1 var2
duplicatesdrop var1 var2, force
【4】數(shù)據(jù)合并
use data1, clear
merge m:m var1var2 using data2
drop if _merge==2
drop if _merge==1
drop _merge
【5】生成一期滯后項
tsset stkcd accper
gen newvarname=L.varname
【6】將文字轉(zhuǎn)化為數(shù)字變量
genBigN=0
replaceBigN=1 if strmatch(dadtunit,"普華永道*")
【7】刪除有缺失值的記錄
egen mis=rowmiss(_all)
drop if mis
drop mis
【8】行業(yè)劃分
clonevarsic2=ind
order stkcd accper sic2
replace sic2=substr(sic2,1,1) if substr(sic2,1,1)!=”C”
replace sic2=substr(sic2,1,2) if substr(sic2,1,1)==”C”
tabulate sic2 accper
【9】日期只保留年份
drop if substr( reptdt ,6,2)!="12"
replace reptdt=substr(reptdt,1,4)
gen accper=real(reptdt)
【10】數(shù)據(jù)分列
split date ,parse(-) destring ignor("-")
【11】求兩個日期之間的間隔天數(shù)
g td=date(trading_date,"YMD")
g ed=date(eventdate,"YMD")
form td ed %td
g d=ed-td
【12】生成行業(yè)、年份啞變量
tab year, gen(year)
tab industry, gen(industry)
【13】對數(shù)據(jù)進(jìn)行Winsorize處理
findit winsor2
winsor2 varname, replace cut(1 99)
【14】描述性統(tǒng)計
tabstat var1var2, stat(n min mean median p25 p75 max sd),? if groupvar==0 or 1
logout, save(name) word replace: tabstat var, stat(n min mean p50 max sd) col(stat)f(%9.2g)
【15】兩變量列聯(lián)表
tabulate var1 var2, row chi2 taub gamma
【16】兩樣本間的均值T檢驗
ttest var, by(groupvar)
【17】兩樣本中位數(shù)Z檢驗
ranksum var, by(groupvar)
【18】Pearson/Spearman系數(shù)
spearmanx
n mata
x=st_data(.,"x")
c=correlation(x)
n=rows(c)
b=strofreal(lowertriangle(c)+uppertriangle(st_matrix("r(Rho)")),"%9.3f")
p=st_matrix("r(P)")
for (i=2; i<=n; i++) {
for (j=1; j<=i-1; j++) {
p[i,j]=2*ttail(rows(x)-2,abs(c[i,j]/sqrt((1-c[i,j]^2)/(rows(x)-2))))
b[i,j]=b[i,j]+(p[i,j]<0.01?"":(p[i,j]<0.05?"":(p[i,j]<0.1?"":"")))
b[j,i]=b[j,i]+(p[j,i]<0.01?"":(p[j,i]<0.05?"":(p[j,i]<0.1?"":"")))
}
}
c=editvalue(b, "2.000", "1")
c
end
直接導(dǎo)出結(jié)果
logout, save(pw) word replace:pwcorr_avars, star1(0.01) star5(0.05) star10(0.1)
【19】按年度按中位數(shù)分組
方法一
bysort year: egen g=xtile(var), n(2)
方法二
bys accper: cumul icindex, g(g) eq
levelsof accper, local(id)
display "`r(levels)'"
local cut1 = 1/2
foreach x of local id {
recode g (min/cut1'=0)(
cut1'/max=1) if accper==`x'
}
分三組
bys accper:cumul icindex, g(g) eq
levelsof accper, local(id)
display "`r(levels)'"
local cut1 = 1/3
local cut2 = 2/3
foreach x of local id {
recode g (min/cut1'=1)(
cut1'/cut2'=2)(
cut2'/max=3)if accper==`x'
}
【20】輸出回歸結(jié)果
安裝
ssc install estout, replace
單個回歸
reg
esttab using name.rtf, compress nogap r2 ar2 star( 0.1 0.05 0.01)
多個回歸一起
reg
est store m1
reg
est store m2
esttab m1 m2 using name.rtf, compress nogap r2 ar2 star( 0.1 0.05 0.01)
連續(xù)運行tobit模型結(jié)果導(dǎo)出:
esttab m1 m2, b(%9.4f) t scalars(N ll Fchi2 type), using name.rtf, compress nogap
連續(xù)運行OLS模型結(jié)果導(dǎo)出:
esttab m1m2, b(%9.4f) tscalars(N r2 F p), using name.rtf, compress nogap
【21】異方差檢驗及處理
檢驗:懷特檢驗
ssc install whitetst
reg
estat imtest, white
處理:“OLS+穩(wěn)健標(biāo)準(zhǔn)差”
reg y x1 x2 x3, robust
【22】DW檢驗(序列相關(guān)性一階)
gen id=_n
tsset id
estat dwatson
【23】多重共線性
reg y x1 x2 x3
vif
【24】是否遺漏高次項
例如,檢驗y對x的線性回歸有沒有遺漏高次項
reg y x
estat ovtest
或者estat ovtest, rhs
【25】逐步回歸
stepwise, pe(0.1): reg y x
【26】Maddala(1983)兩階段處理效應(yīng)模型
treatreg yx1-xn, tr(z=w1-wm)two
【27】Justified Jones Model
statsby _b, by(ind accper)saving(*.dta,replace):reg yx, noconstant
merge m:m indaccper using *.dta
gen yhat=y-_b*x
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。