非編程篇/可直接上手的工具
站在用戶的角度思考問(wèn)題,與客戶深入溝通,找到日土網(wǎng)站設(shè)計(jì)與日土網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類(lèi)型包括:網(wǎng)站制作、成都網(wǎng)站建設(shè)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、空間域名、雅安服務(wù)器托管、企業(yè)郵箱。業(yè)務(wù)覆蓋日土地區(qū)。
1. Excel
Excel是最容易上手的圖表工具,善于處理快速少量的數(shù)據(jù)。結(jié)合數(shù)據(jù)透視表,VBA語(yǔ)言,可制作高大上的可視化分析和dashboard儀表盤(pán)。
單表或單圖用Excel制作是不二法則,它能快速地展現(xiàn)結(jié)果。但是越到復(fù)雜的報(bào)表,excel無(wú)論在模板制作還是數(shù)據(jù)計(jì)算性能上都稍顯不足,任何大型的企業(yè)也不會(huì)用Excel作為數(shù)據(jù)分析的主要工具。
2. 可視化 BI(Power BI \Tableau \ 帆軟FineBI等等)
也許是Excel也意識(shí)到自己在數(shù)據(jù)分析領(lǐng)域的限制和眼下自助分析的趨勢(shì),微軟在近幾年推出了BI工具Power BI。同可視化工具Tableau和國(guó)內(nèi)帆軟的BI工具一樣,封裝了所有可能分析操作的編程代碼,操作上都是以點(diǎn)擊和拖拽來(lái)實(shí)現(xiàn),幾款工具的定位稍有不同。
Power BI
最大的明顯是提供了可交互、鉆取的儀表板,利用Power Pivot可直接生產(chǎn)數(shù)據(jù)透視報(bào)告,省去了數(shù)據(jù)透視表。
Tableau
可視化圖表較為豐富,堪稱(chēng)一等, 操作更為簡(jiǎn)單。
帆軟FineBI
企業(yè)級(jí)的BI應(yīng)用,實(shí)用性較強(qiáng),因2B市場(chǎng)的大熱受到關(guān)注。千萬(wàn)億級(jí)的數(shù)據(jù)性能可以得到保證,業(yè)務(wù)屬性較重,能與各類(lèi)業(yè)務(wù)掛鉤。
對(duì)于個(gè)人,上手簡(jiǎn)單,可以騰出更多的時(shí)間去學(xué)習(xí)業(yè)務(wù)邏輯的分析。
編程篇
對(duì)于尋求更高境界數(shù)據(jù)分析師或數(shù)據(jù)科學(xué)家,如果掌握可視化的編程技巧,就可以利用數(shù)據(jù)做更多的事情。熟練掌握一些編程技巧,賦予數(shù)據(jù)分析工作更加靈活的能力,各種類(lèi)型的數(shù)據(jù)都能適應(yīng)。大多數(shù)設(shè)計(jì)新穎、令人驚艷的數(shù)據(jù)圖幾乎都可以通過(guò)代碼或繪圖軟件來(lái)實(shí)現(xiàn)。
與任何語(yǔ)言一樣,你不可能立刻就開(kāi)始進(jìn)行對(duì)話。要從基礎(chǔ)開(kāi)始,然后逐步建立自己的學(xué)習(xí)方式。很可能在你意識(shí)到之前,你就已經(jīng)開(kāi)始寫(xiě)代碼了。關(guān)于編程最酷的事情在于,一旦你掌握了一門(mén)語(yǔ)言,學(xué)習(xí)其他語(yǔ)言就會(huì)更加容易,因?yàn)樗鼈兊倪壿嬎悸肥枪餐ǖ摹?/p>
1. Python語(yǔ)言
Python 語(yǔ)言最大的優(yōu)點(diǎn)在于善于處理大批量的數(shù)據(jù),性能良好不會(huì)造成宕機(jī)。尤其適合繁雜的計(jì)算和分析工作,而且,Python的語(yǔ)法干凈易讀,可以利用很多模塊來(lái)創(chuàng)建數(shù)據(jù)圖形比較受IT人員的歡迎。
利用 Python 生成的圖表
2. PHP語(yǔ)言
PHP這個(gè)語(yǔ)言松散卻很有調(diào)理,用好了功能很強(qiáng)大。在數(shù)據(jù)分析領(lǐng)域可以用php做爬蟲(chóng),爬取和分析百萬(wàn)級(jí)別的網(wǎng)頁(yè)數(shù)據(jù),也可與Hadoop結(jié)合做大數(shù)據(jù)量的統(tǒng)計(jì)分析。
因?yàn)榇蟛糠?Web 服務(wù)器都事先安裝了 PHP 的開(kāi)源軟件,省去了部署之類(lèi)的工作,可直接上手寫(xiě)。
比如 Sparkline(微線表)庫(kù),它能讓你在文本中嵌入小字號(hào)的微型圖表,或者在數(shù)字表格中添加視覺(jué)元素,就像下面這張圖一樣:
利用 PHP 圖形函數(shù)庫(kù)生成的微線表
一般 PHP會(huì)和 MySQL 數(shù)據(jù)庫(kù)結(jié)合使用,這使它能物盡其用,處理大型的數(shù)據(jù)集。
3. HTML、JavaScript 和 CSS語(yǔ)言
很多可視化軟件都是基于web端的,可視化的開(kāi)發(fā),這幾類(lèi)語(yǔ)言功不可沒(méi)。而且隨著人們對(duì)瀏覽器工作越來(lái)越多的依賴,Web 瀏覽器的功能也越來(lái)越完善,借助 HTML、JavaScript 和 CSS,可直接運(yùn)行可視化展現(xiàn)的程序。
可交互日歷,同時(shí)也是用戶使用 your.flowingdata 的熱度圖
不過(guò)還是有幾點(diǎn)需要注意。由于相關(guān)的軟件和技術(shù)還比較新,在不同瀏覽器中你的設(shè)計(jì)可能在顯示上會(huì)有所差別。在 Internet Explorer 6 這類(lèi)老舊的瀏覽器中,有些工具可能無(wú)法正常運(yùn)行。比如一些銀行單位仍舊使用著IE,無(wú)論是自己使用還是開(kāi)發(fā)的時(shí)候都要考慮這樣的問(wèn)題。
4. R語(yǔ)言
R語(yǔ)言是絕大多數(shù)統(tǒng)計(jì)學(xué)家最中意的分析軟件,開(kāi)源免費(fèi),圖形功能很強(qiáng)大。
談到R語(yǔ)言的歷史,它是專(zhuān)為數(shù)據(jù)分析而設(shè)計(jì)的,面向的也是統(tǒng)計(jì)學(xué)家,數(shù)據(jù)科學(xué)家。但是由于數(shù)據(jù)分析越來(lái)越熱門(mén),R語(yǔ)言的使用也不瘦那么多限制了。
R的使用流程很簡(jiǎn)潔,支持 R 的工具包也有很多,只需把數(shù)據(jù)載入到 R 里面,寫(xiě)一兩行代碼就可以創(chuàng)建出數(shù)據(jù)圖形。比如利用 Portfolio 工具包快速創(chuàng)建出如下的板塊層級(jí)圖。
比如熱度圖
Go語(yǔ)言主要用作服務(wù)器端開(kāi)發(fā),其定位是用來(lái)開(kāi)發(fā)“大型軟件”的,適合于很多程序員一起開(kāi)發(fā)大型軟件,并且開(kāi)發(fā)周期長(zhǎng),支持云計(jì)算的網(wǎng)絡(luò)服務(wù)。Go語(yǔ)言能夠讓程序員快速開(kāi)發(fā),并且在軟件不斷的增長(zhǎng)過(guò)程中,它能讓程序員更容易地進(jìn)行維護(hù)和修改。它融合了傳統(tǒng)編譯型語(yǔ)言的高效性和腳本語(yǔ)言的易用性和富于表達(dá)性。
Go語(yǔ)言作為服務(wù)器編程語(yǔ)言,很適合處理日志、數(shù)據(jù)打包、虛擬機(jī)處理、文件系統(tǒng)、分布式系統(tǒng)、數(shù)據(jù)庫(kù)代理等;網(wǎng)絡(luò)編程方面,Go語(yǔ)言廣泛應(yīng)用于Web應(yīng)用、API應(yīng)用、下載應(yīng)用等;除此之外,Go語(yǔ)言還可用于內(nèi)存數(shù)據(jù)庫(kù)和云平臺(tái)領(lǐng)域,目前國(guó)外很多云平臺(tái)都是采用Go開(kāi)發(fā)。
類(lèi)型 在變量名后邊
也可不顯式聲明類(lèi)型, 類(lèi)型推斷, 但是是靜態(tài)語(yǔ)言, name一開(kāi)始放字符串就不能再賦值數(shù)字
方法,屬性 分開(kāi) 方法名首字母大寫(xiě)就是就是外部可調(diào)的
面向?qū)ο笤O(shè)計(jì)的一個(gè)重要原則:“優(yōu)先使用組合而不是繼承”
Dog 也是Animal , 要復(fù)用Animal 的屬性和方法,
只需要在結(jié)構(gòu)體 type 里面寫(xiě) Animal
入口也是main, 用用試試
多態(tài), 有這個(gè)方法就是這個(gè)接口的實(shí)現(xiàn), 具體的類(lèi) 不需要知道自己實(shí)現(xiàn)了什么接口,
使用: 在一個(gè)函數(shù)調(diào)用之前加上關(guān)鍵字go 就啟動(dòng)了一個(gè)goroutine
創(chuàng)建一個(gè)goroutine,它會(huì)被加入到一個(gè)全局的運(yùn)行隊(duì)列當(dāng)中,
調(diào)度器 會(huì)把他們分配給某個(gè) 邏輯處理器 的隊(duì)列,
一個(gè)邏輯處理器 綁定到一個(gè) 操作系統(tǒng)線程 ,在上面運(yùn)行g(shù)oroutine,
如果goroutine需要讀寫(xiě)文件, 阻塞 ,就脫離邏輯處理器 直接 goroutine - 系統(tǒng)線程 綁定
編譯成同名.exe 來(lái)執(zhí)行, 不通過(guò)虛擬機(jī), 直接是機(jī)器碼, 和C 一樣, 所以非常快
但是也有自動(dòng)垃圾回收,每個(gè)exe文件當(dāng)中已經(jīng)包含了一個(gè)類(lèi)似于虛擬機(jī)的runtime,進(jìn)行g(shù)oroutine的調(diào)度
默認(rèn)是靜態(tài)鏈接的,那個(gè)exe會(huì)把運(yùn)行時(shí)所需要的所有東西都加進(jìn)去,這樣就可以把exe復(fù)制到任何地方去運(yùn)行了, 因此 生成的 .exe 文件非常大
1. 部署簡(jiǎn)單
Go
編譯生成的是一個(gè)靜態(tài)可執(zhí)行文件,除了glibc外沒(méi)有其他外部依賴。這讓部署變得異常方便:目標(biāo)機(jī)器上只需要一個(gè)基礎(chǔ)的系統(tǒng)和必要的管理、監(jiān)控工具,完全不需要操心應(yīng)用所需的各種包、庫(kù)的依賴關(guān)系,大大減輕了維護(hù)的負(fù)擔(dān)。
2. 并發(fā)性好
Goroutine和channel使得編寫(xiě)高并發(fā)的服務(wù)端軟件變得相當(dāng)容易,很多情況下完全不需要考慮鎖機(jī)制以及由此帶來(lái)的各種問(wèn)題。單個(gè)Go應(yīng)用也能有效的利用多個(gè)CPU核,并行執(zhí)行的性能好。
3. 良好的語(yǔ)言設(shè)計(jì)
從學(xué)術(shù)的角度講Go語(yǔ)言其實(shí)非常平庸,不支持許多高級(jí)的語(yǔ)言特性;但從工程的角度講,Go的設(shè)計(jì)是非常優(yōu)秀的:規(guī)范足夠簡(jiǎn)單靈活,有其他語(yǔ)言基礎(chǔ)的程序員都能迅速上手。更重要的是
Go 自帶完善的工具鏈,大大提高了團(tuán)隊(duì)協(xié)作的一致性。
4. 執(zhí)行性能好
雖然不如 C 和 Java,但相比于其他編程語(yǔ)言,其執(zhí)行性能還是很好的,適合編寫(xiě)一些瓶頸業(yè)務(wù),內(nèi)存占用也非常省。