怎樣用Python代碼實現(xiàn)數(shù)據(jù)分析,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。sweetviz是一個基于Python編寫的數(shù)據(jù)分析軟件,只要掌握3種函數(shù)用法,一行Python代碼就能實現(xiàn)數(shù)據(jù)集可視化、分析與比較。
創(chuàng)新互聯(lián)公司專注于企業(yè)網(wǎng)絡(luò)營銷推廣、網(wǎng)站重做改版、柘榮網(wǎng)站定制設(shè)計、自適應(yīng)品牌網(wǎng)站建設(shè)、HTML5建站、商城開發(fā)、集團公司官網(wǎng)建設(shè)、外貿(mào)網(wǎng)站建設(shè)、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計等建站業(yè)務(wù),價格優(yōu)惠性價比高,為柘榮等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。
以Titanic數(shù)據(jù)集為例,輸入一行代碼:
一個1080p的清晰網(wǎng)頁界面就出現(xiàn)在了眼前。
不僅根據(jù)性別、年齡等不同欄目縱向分析數(shù)據(jù),每個欄目下還有眾數(shù)、最大值、最小值等橫向?qū)Ρ取?/p>
所有輸入的數(shù)值、文本信息都會被自動檢測,并進行數(shù)據(jù)分析、可視化和對比,最后幫你進行數(shù)據(jù)總結(jié)。
在這樣的數(shù)據(jù)分析下,結(jié)果一目了然。
這樣的效果,是基于3個主函數(shù)實現(xiàn)的。
數(shù)據(jù)分析函數(shù)中,有4個參數(shù)source,target_feat,feat_cfg和pairwise_analysis需要被設(shè)置。
source:以pandas中的DataFrame數(shù)據(jù)結(jié)構(gòu)、或是DataFrame中的某一類字符串作為分析對象。
target_feat:需要被標(biāo)記為目標(biāo)對象的字符串。
feat_cfg:需要被跳過、或是需要被強制轉(zhuǎn)換為某種數(shù)據(jù)類型的特征。
pairwise_analysis:相關(guān)性和其他類型的數(shù)據(jù)關(guān)聯(lián)可能需要花費較長時間。如果超過了某個閾值,就需要設(shè)置這個參數(shù)為on或者off,以判斷是否需要分析數(shù)據(jù)相關(guān)性。
如果想要對兩個數(shù)據(jù)集進行對比分析,就使用這個比較函數(shù)。
例子中的my_dataframe和test_df是兩個數(shù)據(jù)集,分別被命名為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)。
除了這個被插入的數(shù)據(jù)集,剩余的參數(shù)與analyze中的一致。
想要對數(shù)據(jù)集中某個欄目下的參數(shù)進行分析,就采用這個函數(shù)進行。
例如,如果需要比較“性別”欄目下的“男性”和“女性”,就可以采用這個函數(shù)。
理解這幾種函數(shù)的變量后,一行代碼就能實現(xiàn)Python數(shù)據(jù)分析。
sweetviz支持Python 3.6+和Pandas0.25.3+環(huán)境,配置好環(huán)境后,使用萬能的pip下載安裝包:
但有一個條件需要注意:sweetviz需要用到基礎(chǔ)「os」模塊。所以,如果你在使用類似于Google Colab的自定義環(huán)境,可能會無法使用sweetviz,目前開發(fā)者也在探索解決方案。
下載好后,使用import快速導(dǎo)入sweetviz,就可以開始使用了~
sweetviz使用的原理是,使用一行代碼,生成一個數(shù)據(jù)報告的對象(其中,my_dataframe是pandas中的DataFrame,一種表格型數(shù)據(jù)結(jié)構(gòu)):
在這里,analyze函數(shù)可以被替換為compare或compare_intra函數(shù),使用方法在上面已經(jīng)給出,全看你需要什么類型的數(shù)據(jù)報告了。
最后,用show一鍵輸出。(結(jié)果會以SWEETVIZ_REPORT.html網(wǎng)頁形式展示)
由于在這個過程中,實際上真正需要編寫的只有第二行的生成對象代碼,可以說是名副其實的1行代碼生成數(shù)據(jù)分析。
展示界面也非常簡潔,只要鼠標(biāo)停留在感興趣的欄目上,右側(cè)就會自動顯示出數(shù)據(jù)分析的圖表和報告。
看完上述內(nèi)容,你們掌握怎樣用Python代碼實現(xiàn)數(shù)據(jù)分析的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!