這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)碛嘘P(guān)數(shù)據(jù)查詢與篩選中如何進(jìn)行Excel、SQL、PowerBI、Python的對比,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
專注于為中小企業(yè)提供成都網(wǎng)站建設(shè)、網(wǎng)站制作服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)仁化免費(fèi)做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動(dòng)了成百上千企業(yè)的穩(wěn)健成長,幫助中小企業(yè)通過網(wǎng)站建設(shè)實(shí)現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。
之前有網(wǎng)友留言說:
“SQL從來不是工具,它是語言!”
說實(shí)話,我很吃驚。在我的理解中,語言的本質(zhì)就是工具,而百度百科也是這樣定義的:
語言即傳遞信息的聲音。是人類最重要的交際工具,是人們進(jìn)行溝通的主要表達(dá)方式
自然語言也好、計(jì)算機(jī)語言、數(shù)據(jù)庫語言也好,就是人與人、人與機(jī)之間溝通的一種編碼解碼工具。語言作為一種溝通工具,通常需要通過一定的實(shí)體載體來記錄和傳達(dá),不能獨(dú)立存在。
就如英語是門語言,也是溝通工具,而聽、說、讀、寫是它的傳達(dá)方式,是工具化的載體。
SQL也是一樣,它是語言工具,而MySQL、HiveSQL等等數(shù)據(jù)庫工具都是它的設(shè)計(jì)表達(dá)載體。
回頭看我們?yōu)槭裁匆獙W(xué)英語?,為什么要學(xué)Python?,為什么要學(xué)SQL?
相信你的理由,絕對不僅僅它是一門語言或者文化,否則只會(huì)像高中應(yīng)試外語那么難受!
更多的時(shí)候是出于實(shí)現(xiàn)某種目的,而刺激我們主動(dòng)去尋找這樣一種可以實(shí)現(xiàn)思考溝通的工具
總之,語言即是工具。凡是工具,不拘一格,皆為所用!
還有網(wǎng)友留言說:
“Power BI 只是可視化厲害一點(diǎn)兒,其他都不行”
OK,我們來看看這幾年P(guān)owerBI發(fā)展趨勢,你會(huì)發(fā)現(xiàn)它比Tableau更加強(qiáng)大,與其他BI產(chǎn)品的差異也是越來越大,這與微軟本身的用戶環(huán)境和軟件家族存在很大關(guān)系。
再來看看招聘網(wǎng)站上的要求,PowerBI近幾年開始逐步成為主力工具,比如運(yùn)營部門、財(cái)務(wù)部門、商業(yè)分析等覆蓋的業(yè)務(wù)范圍越來越廣。
以前Python一直是我的主力工具,可是現(xiàn)在老海強(qiáng)推Power BI,甚至建議首選它來做商業(yè)分析
一個(gè)公式:Power BI 數(shù)據(jù)分析流程 = PQ + PP + PV
即PowerQuery數(shù)據(jù)處理查詢、PowerPivot數(shù)據(jù)結(jié)構(gòu)建模、PowerView數(shù)據(jù)圖表可視化
這個(gè)流程順序,也是所有分析工具都通用的套路,使用起來自然相當(dāng)順手舒服。
而且Power BI可以徹底解決很多在Python或者Excel中讓人煩透了的問題,比如:
做個(gè)圖表再也不用寫Python幾十甚至上百行的代碼,也不用調(diào)整N多了Excel圖表參數(shù)。
做個(gè)表格直接星型連接,再也不用pandas來回join、也不用Excel迷之效果的VLOOKUP函數(shù)
做個(gè)分析,前期用Python處理數(shù)據(jù),后期用Excel出圖表,現(xiàn)在直接PowerBI搞定!
具體的這里不多說了,感興趣的可以看看我的問答,里面專門有寫到。
總之,老海認(rèn)為:Power BI絕非只有可視化,相信隨著版本迭代,未來足可代替Exce甚至是Python
OK,我們回過來繼續(xù)對比Excel、SQL、PowerBI與Python
今天涉及數(shù)據(jù)的查看與篩選,廢話不多說直接上操作演示:
當(dāng)使用Excel時(shí):
第一步:可以先觀察一下數(shù)據(jù)情況,比如行數(shù)、列數(shù),首行以及尾行,
可以使用shift + ctrl + 方向鍵 ↓ ,直接拉到底部查看
使用shift + ctrl + 方向鍵 ↑,來查看最前面的數(shù)據(jù)情況
第二步:也可以選中整個(gè)列來查看特定字段的數(shù)據(jù)情況
第三步:或者查看前10行數(shù)據(jù)
第四步:查看最大或者最小的前10行數(shù)據(jù)
第五步:查看不同數(shù)據(jù)列的空值情況
第六步:查看符合某個(gè)條件的數(shù)據(jù)情況
第7步:選擇“篩選”中的“高級”,可以進(jìn)行多條件篩選數(shù)據(jù),比如同時(shí)滿足天津市購買量大于2、武漢市購買量大于3
第8步:高級篩選也可以實(shí)現(xiàn)多條件或關(guān)系篩選數(shù)據(jù),即滿足其中一個(gè)條件即可。
第9步:查看特定列名去重的數(shù)據(jù)情況,可以選擇“數(shù)據(jù)”中的“刪除重復(fù)項(xiàng)”來實(shí)現(xiàn)
也可以通過“數(shù)據(jù)”中“篩選”下的“高級”來完成,此處注意勾選“不重復(fù)的記錄”
第10步:查看去重后數(shù)據(jù)的統(tǒng)計(jì)情況,此方法類似于python的value_couts
當(dāng)使用SQL時(shí):
第1步:查看數(shù)據(jù)情況
第2步:查看前10行數(shù)據(jù)
第3步:查看某個(gè)條件的數(shù)據(jù),比如查看門店城市為天津的數(shù)據(jù)
第4步:查看滿足多個(gè)條件中任一個(gè)的數(shù)據(jù),比如查看天津或者武漢的數(shù)據(jù)
第5步:查看特定列名數(shù)據(jù)
第6步:查看特定列名的去重后數(shù)據(jù)的統(tǒng)計(jì)數(shù)量。比如門店城市共計(jì)多少
第7步:查看特定列名去重?cái)?shù)據(jù),查看去重后的具體城市名稱
第8步:查看非空值記錄與空值記錄
當(dāng)使用Power BI時(shí):
第1步:查看數(shù)據(jù)基本情況,在“主頁”下選擇“轉(zhuǎn)換數(shù)據(jù)”,進(jìn)入PQ編輯器,查看數(shù)據(jù)。
第2步:選中某個(gè)字段,在左下角可以查看非重復(fù)值的數(shù)量
第3步:在PQ編輯器中,可以使用各類查看功能,比如保留最前幾行、最后幾行等等
第4步:查看特定的字段列數(shù)據(jù),點(diǎn)擊“選擇列”來篩選特定的字段列即可
第5步:查看符合某個(gè)條件的數(shù)據(jù)情況,可點(diǎn)擊字段右側(cè)的下拉箭頭來篩選
第6步:查看去重后的數(shù)量統(tǒng)計(jì)情況,可以使用PQ編輯器中“轉(zhuǎn)換”下的“統(tǒng)計(jì)信息”中的“對非重復(fù)值進(jìn)行計(jì)數(shù)”
第7步:查看不同數(shù)據(jù)值的統(tǒng)計(jì)情況,點(diǎn)擊字段右側(cè)箭頭,選擇“分組依據(jù)”,設(shè)置分組字段以及計(jì)算的方式,即可完成分組統(tǒng)計(jì)。
當(dāng)使用Python時(shí):
第1步:查看數(shù)據(jù)情況,主要看看是否存在亂碼,以及數(shù)據(jù)的整體規(guī)模是否正確
第2步:查看數(shù)據(jù)前10行情況,主要查看不同字段下的數(shù)據(jù)格式情況,當(dāng)然還可使用.dtypes查看當(dāng)前字段的數(shù)據(jù)類型是否合理。
第3步:查看特定列的數(shù)據(jù),一般建議使用loc、iloc進(jìn)行切片操作。
第4步:查看滿足某個(gè)條件的數(shù)據(jù),一般使用loc,配合條件篩選
第5步:查看滿足多個(gè)條件中任一條件的數(shù)據(jù),除了isin,還可以使用或與非的關(guān)系組合
第6步:查看是否存在空值,關(guān)于空值NULL,Nan的內(nèi)容,可翻閱老海之前的文章
第7步:查看特定列去重后的數(shù)據(jù),以及統(tǒng)計(jì)個(gè)數(shù)。
上述就是小編為大家分享的數(shù)據(jù)查詢與篩選中如何進(jìn)行Excel、SQL、PowerBI、Python的對比了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。