最近,IT行業(yè)專家在參加相關(guān)會議時發(fā)現(xiàn)了一個隱藏的主題,那就是雖然很多人將關(guān)注的重點轉(zhuǎn)移到基于云計算的架構(gòu)(混合云)以及所需要的云管理平臺,但會議的報告表明,很多人都承認并沒有密切關(guān)注全球數(shù)字數(shù)據(jù)量的巨大增長。
登封網(wǎng)站制作公司哪家好,找成都創(chuàng)新互聯(lián)!從網(wǎng)頁設(shè)計、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、響應(yīng)式網(wǎng)站設(shè)計等網(wǎng)站項目制作,到程序開發(fā),運營維護。成都創(chuàng)新互聯(lián)2013年開創(chuàng)至今到現(xiàn)在10年的時間,我們擁有了豐富的建站經(jīng)驗和運維經(jīng)驗,來保證我們的工作的順利進行。專注于網(wǎng)站建設(shè)就選成都創(chuàng)新互聯(lián)。存儲供應(yīng)商PureStorage公司的演講報告引用了其他兩家供應(yīng)商的兩個數(shù)據(jù)點:首先,思科公司2017年6月發(fā)布的白皮書“Zettabyte時代:趨勢與分析”推斷了互聯(lián)網(wǎng)帶寬的增長。其次是由希捷公司委托IDC公司進行研究的調(diào)查報告“數(shù)據(jù)時代2025”推測了全球數(shù)據(jù)增長的趨勢。PureStorage公司結(jié)合了這兩家公司的推斷,得出了結(jié)論。如下圖所示。
PureStorage公司的報告描述了全球數(shù)據(jù)增長和全球互聯(lián)網(wǎng)帶寬增長之間的沖突
如果這些趨勢成為現(xiàn)實,并且有足夠的理由認為這些預(yù)測是合理的,那么這些趨勢將在未來幾年對計算和數(shù)據(jù)格局產(chǎn)生重大影響。并將對云計算的應(yīng)用產(chǎn)生特別的影響。注意:云計算是真實的,將成為未來IT環(huán)境的重要組成部分,但是IT部門認為它是一種靈丹妙藥這種簡單化的想法,會讓人想起當初網(wǎng)絡(luò)熱潮的破滅。而人們知道將會有什么樣的結(jié)果。
不能回避的問題
無論如何,所有IT都有兩個核心要素:數(shù)據(jù)與數(shù)據(jù)的邏輯。每個使用大數(shù)據(jù)的人都知道:要使用大量的數(shù)據(jù),首先需要對數(shù)據(jù)進行處理,而其處理都會產(chǎn)生一個傳輸瓶頸,并嚴重影響其性能,并且這種邏輯的任何功能都變成純粹的理論。
即使有少量的數(shù)據(jù),這也可能是因為延遲而發(fā)生。例如,企業(yè)將其應(yīng)用程序服務(wù)器遷移到云端,同時將數(shù)據(jù)庫服務(wù)器保留在本地,這可能在理論上可行,但是當應(yīng)用程序?qū)?shù)據(jù)庫與數(shù)據(jù)庫之間的網(wǎng)絡(luò)延遲敏感時,就根本不起作用。對于少量的數(shù)據(jù)來說,情況就是如此。這就是為什么許多組織都在嘗試調(diào)整軟件的原因,使其對延遲的敏感度降低,從而能夠進入云端。但是,如果數(shù)據(jù)量很大,則需要將數(shù)據(jù)處理和數(shù)據(jù)彼此靠近,否則就無法工作。企業(yè)增加對大量并行性的需求來處理這些數(shù)據(jù),并獲得Hadoop和其他處理大量數(shù)據(jù)問題的體系結(jié)構(gòu)。
現(xiàn)在,全球的數(shù)據(jù)量呈指數(shù)增長。如果IDC公司的推測成為事實的話,那么在幾年的時間里,全世界將存儲大約50ZB的數(shù)據(jù)。另一方面,雖然互聯(lián)網(wǎng)傳輸數(shù)據(jù)的總?cè)萘恳苍谠鲩L,但增長速度更為緩慢。在全球數(shù)據(jù)量增長到50ZB的同一時期,互聯(lián)網(wǎng)總帶寬將達到每年2.5ZB(如果思科的推斷成為事實的話)。
從這兩個推斷(并不是不合理的)中得出的結(jié)論是,全球可用的互聯(lián)網(wǎng)帶寬遠遠不能滿足移動大量數(shù)據(jù)的需求。而且這也忽略了目前大約80%的帶寬用于流媒體視頻的事實。因此,即使企業(yè)已經(jīng)針對核心應(yīng)用程序中的延遲問題編寫了代碼,對于數(shù)據(jù)量較大的情況,也會出現(xiàn)帶寬問題。
現(xiàn)在這個隱患實際上成為了一個問題嗎?如果處理或使用這些數(shù)據(jù)在本地部署的數(shù)據(jù)中心發(fā)生的話,也就是說在同一個數(shù)據(jù)中心中存儲數(shù)據(jù)。但是,一方面,數(shù)據(jù)量呈指數(shù)增長,另一方面,全球各行業(yè)也在積極尋求云戰(zhàn)略,就是把將所有類型的工作負載都遷移到云端,即使是“無服務(wù)器”(例如,AWS Lambda),這樣的做法也是絕對極端的。
假設(shè)只有小規(guī)模的結(jié)果(從龐大的數(shù)據(jù)集中計算出來)也許會有所幫助,因為大量數(shù)據(jù)的實際價值來自它們的結(jié)合。這可能意味著將來自不同所有者的數(shù)據(jù)(例如企業(yè)的客戶記錄與來自Twitter的數(shù)據(jù))結(jié)合起來。而這所有不同的集合將會成為一個難題。
所以,人們看到的是兩個相反的事態(tài)發(fā)展。一方面,人們都忙于適應(yīng)基于云的體系結(jié)構(gòu),這種體系結(jié)構(gòu)最終是基于分布式數(shù)據(jù)的分布式處理。另一方面,人們使用的數(shù)據(jù)量越來越大,必須將數(shù)據(jù)和處理整合到一個物理位置。
那么這意味著什么?
人們可以預(yù)期,Hadoop在應(yīng)用程序架構(gòu)層面所做的工作也將在全球范圍內(nèi)發(fā)生:龐大的數(shù)據(jù)集將成為使數(shù)據(jù)的邏輯具有意義的吸引力。而那些龐大的數(shù)據(jù)集將會被吸引到一起。
舉個例子:許多公司現(xiàn)在都在努力減少移動數(shù)據(jù)的需求。因此,在物聯(lián)網(wǎng)領(lǐng)域有很多關(guān)于邊緣計算的討論:本地處理傳感器和其他物聯(lián)網(wǎng)設(shè)備的數(shù)據(jù)。當然,這也意味著處理過程也必須是本地化的,可以放心地假設(shè)一下,企業(yè)不會在一組傳感器中擁有同樣的計算能力,而不是在大分析中可以做到的設(shè)置?;蛘撸阂苍S自主駕駛汽車的數(shù)據(jù)很可能不會再采用Hadoop集群,而可以通過這種方式來最小化數(shù)據(jù)流量,但以計算量為代價。
這個問題還有另一個解決方案:與數(shù)據(jù)中心結(jié)合在一起。數(shù)據(jù)中心托管提供商提供的服務(wù)正在崛起。他們提供具有優(yōu)化內(nèi)部流量功能的大型數(shù)據(jù)中心,云計算提供商和大型云用戶的服務(wù)器都在一起。從邏輯上講,用戶的業(yè)務(wù)可能在云端,但實際上與云計算服務(wù)提供商在同一處所。
企業(yè)不僅想在AWS或Azure上運行其邏輯數(shù)據(jù),也想在數(shù)據(jù)中心這樣做,企業(yè)也有自己的私有數(shù)據(jù)湖,所以所有的數(shù)據(jù)都在本地處理,數(shù)據(jù)聚合也在本地。但是數(shù)據(jù)中心托管模式是另一種可能的解決方案,用于解決因數(shù)據(jù)呈指數(shù)級增長而帶來的帶寬和延遲問題。
情況可能不像那兩個調(diào)查報告描述的那樣可怕。例如,所有數(shù)據(jù)的實際平均波動率最終將非常低。另一方面,企業(yè)不希望在陳舊的數(shù)據(jù)上運行分析。但是可以得出一個結(jié)論:簡單地假設(shè)企業(yè)可以將其工作負載分配給不同的云提供商是有風(fēng)險的,尤其是如果同時處理的數(shù)據(jù)量(如果企業(yè)都想把他們自己的數(shù)據(jù)與來自Twitter、Facebook的數(shù)據(jù)流結(jié)合起來,那么更不用說這些組合產(chǎn)生了各種各樣的新數(shù)據(jù)流)。
因此,企業(yè)對數(shù)據(jù)和處理的位置做出良好的戰(zhàn)略設(shè)計決策是成功的關(guān)鍵。