本篇內(nèi)容主要講解“數(shù)據(jù)分析師怎么應(yīng)對(duì)數(shù)據(jù)庫(kù)取數(shù)后的離線分析”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“數(shù)據(jù)分析師怎么應(yīng)對(duì)數(shù)據(jù)庫(kù)取數(shù)后的離線分析”吧!
創(chuàng)新互聯(lián)公司是一家專(zhuān)注于成都做網(wǎng)站、成都網(wǎng)站建設(shè)與策劃設(shè)計(jì),奈曼網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)公司做網(wǎng)站,專(zhuān)注于網(wǎng)站建設(shè)十多年,網(wǎng)設(shè)計(jì)領(lǐng)域的專(zhuān)業(yè)建站公司;建站業(yè)務(wù)涵蓋:奈曼等地區(qū)。奈曼做網(wǎng)站價(jià)格咨詢:18982081108
因?yàn)槿狈糜霉ぞ叩闹С?,?shù)據(jù)分析人員的離線分析動(dòng)作總是先由一個(gè)事先寫(xiě)好的復(fù)雜查詢或經(jīng)多步驟處理后臨時(shí)表導(dǎo)出的數(shù)據(jù),之后在 Excel 中用 vlookup(),過(guò)濾器等來(lái)完成,當(dāng)數(shù)據(jù)更新或范圍擴(kuò)大后又要重新取數(shù),重新在 Excel 中操作。如果能有一個(gè)桌面工具每次會(huì)實(shí)時(shí)讀取單表數(shù)據(jù),既能完成上述復(fù)雜查詢和多步驟處理到臨時(shí)表的計(jì)算,又能取代在 Excel 中的計(jì)算動(dòng)作,免除重復(fù)勞動(dòng),將會(huì)是很多數(shù)據(jù)分析人員的福音。
如果你會(huì)寫(xiě) SQL 或 VBA,非常在意獲取數(shù)據(jù)后能夠靈活的多次計(jì)算,而不是想用一個(gè)圖形界面工具完成有限的計(jì)算,又不想花費(fèi)很多時(shí)間去學(xué)習(xí) Python,集算器或許是一個(gè)不錯(cuò)的選擇。
比如,數(shù)據(jù)庫(kù)里有以下 3 張表:
SQL Query 1 result: (T1)
Col1 Col2 A 1 B 2
Query 2 result: (T2)
Col3 Col4 1 # 2 *
Query 3 result: (T3)
Col5 1 3
需要對(duì)上面 T1,T2,T3 三張表,完成類(lèi)似下面 SQL 的關(guān)聯(lián)操作:
Select T1.col1,T2.col4 from T1,T2 where T1.col2=T2.col3 and T1.col2 in (Select T3.col5 from T3)
結(jié)果是:
Col1 Col4 A #
如果數(shù)據(jù)量不大,直接內(nèi)存計(jì)算,集算器 SPL 代碼如下:
T1=DB.query("select Col1,Col2 from T1") T2=DB.query("select Col3,Col4 from T2") T3=DB.query("select Col5 from T3") Result=T1.join@i(Col2,T2:Col3,Col1,Col4).select(T3.(Col5).contain(Col2)).new(Col1,Col4)
T1,T2,T3 也可以分別來(lái)自不同的數(shù)據(jù)庫(kù)或者數(shù)據(jù)文件
如果數(shù)據(jù)量比較大,可以用集算器的游標(biāo),和數(shù)據(jù)庫(kù)游標(biāo)類(lèi)似,代碼如下:
CS1=DB.cursor("select Col1,Col2 from T1 orderby Col2") CS2=DB.cursor("select Col3,Col4 from T2 orderby Col3") S3=DB.query@i("select Col5 from T3") Result=joinx(CS1,Col2;CS2,Col3).select(S3.contain(#1.Col2)).new(#1.Col1,#2.Col4).fetch()
如果想利用最終計(jì)算后的結(jié)果在 Excel 中做圖表,導(dǎo)出到 Excel 也很方便
file("Result.xlsx").xlsexport(Result)
集算器即裝即用,應(yīng)對(duì)上述問(wèn)題非常得心應(yīng)手。集算器也支持先將大數(shù)據(jù)保存成本地文件,然后讀取這些類(lèi)型已確定、已壓縮的數(shù)據(jù)做高效計(jì)算,這樣可以減輕數(shù)據(jù)庫(kù)的負(fù)載,也能讓本地計(jì)算效率更高。
到此,相信大家對(duì)“數(shù)據(jù)分析師怎么應(yīng)對(duì)數(shù)據(jù)庫(kù)取數(shù)后的離線分析”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!