這篇文章給大家分享的是有關(guān)互聯(lián)網(wǎng)運(yùn)維數(shù)字化轉(zhuǎn)型的示例的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考。一起跟隨小編過來看看吧。
我們擁有10余年網(wǎng)頁設(shè)計(jì)和網(wǎng)站建設(shè)經(jīng)驗(yàn),從網(wǎng)站策劃到網(wǎng)站制作,我們的網(wǎng)頁設(shè)計(jì)師為您提供的解決方案。為企業(yè)提供成都網(wǎng)站制作、網(wǎng)站建設(shè)、外貿(mào)網(wǎng)站建設(shè)、微信開發(fā)、成都小程序開發(fā)、手機(jī)網(wǎng)站制作設(shè)計(jì)、H5響應(yīng)式網(wǎng)站、等業(yè)務(wù)。無論您有什么樣的網(wǎng)站設(shè)計(jì)或者設(shè)計(jì)方案要求,我們都將富于創(chuàng)造性的提供專業(yè)設(shè)計(jì)服務(wù)并滿足您的需求。
我們先從數(shù)字化轉(zhuǎn)型說起,這幾年整個(gè)行業(yè)或者整個(gè)大的環(huán)境上都在談數(shù)字化。什么是數(shù)字化?在我來看,數(shù)字化就是一個(gè)企業(yè)的轉(zhuǎn)型,可能會帶來更快的效率,也會帶來用戶更好的體驗(yàn)。順豐在前幾年就在做數(shù)字化的轉(zhuǎn)型。
順豐收件派件下單,這是大家用得比較多的。這后面有很多的環(huán)節(jié),包括分點(diǎn)部、陸運(yùn)、中轉(zhuǎn)、航空,這是物理上的路徑。
數(shù)據(jù)流更加復(fù)雜,有任務(wù)分發(fā)、路由分發(fā)和運(yùn)單生成以及分發(fā)等等。我們這幾年在做的事情就是把這些東西全部數(shù)字化和線上化,這些做好會對后續(xù)的路徑規(guī)劃、收派規(guī)劃做優(yōu)化。在人力成本上和運(yùn)輸成本上會有很大的節(jié)省。
大家有沒有留意到,在2017年之前所有用順豐寄快遞時(shí),都會給你一張紙?zhí)罴呢泦?。?017年以后有變化了,順豐做了一個(gè)融合項(xiàng)目,把所有紙質(zhì)面單全部線上化,這就是現(xiàn)在所有的下單全部是掃二維碼。
這是業(yè)務(wù)發(fā)展趨勢,從3月份到5月份是慢慢推廣試運(yùn)行的階段,5到9月份的時(shí)候我們進(jìn)行了全網(wǎng)快速的推廣,把紙質(zhì)面單全部替換掉,經(jīng)過大半年的時(shí)間,現(xiàn)在順豐所有的單量全部是線上化和電子化,到12月份該項(xiàng)目完結(jié)。對于整個(gè)項(xiàng)目來看是非常成功的,業(yè)務(wù)量也是一直漲。但是,這背后真的是這樣一帆風(fēng)順的嗎?3月份到10月份我們遇到很多問題,心里有苦不能說。
上面這張圖是拔河,這里面有很多人,類似于我們很多不同的崗位在一個(gè)項(xiàng)目當(dāng)中或者在一個(gè)企業(yè)當(dāng)中,運(yùn)維、開發(fā)、產(chǎn)品、業(yè)務(wù)、推廣,想把一件事情做好,第一件事情要做的就是目標(biāo)一定要統(tǒng)一。
因此以項(xiàng)目的維度來看,項(xiàng)目成功了我們就成功了。很多時(shí)候我們要打破一些部門墻,站在不同的視角或者把自己拔高到另外一個(gè)視角上去考慮問題。
在項(xiàng)目初期我們就遇到了上述三個(gè)問題。這里面涉及到的不僅是純技術(shù)上的,還涉及到一些組織架構(gòu)流程,這會動(dòng)到很多人長期以來的一些工作方式,是最麻煩的一件事情。這件事情要怎么搞定?其實(shí)很簡單,就是你的老板。
很多搞技術(shù)方面的不是很擅長利用我們已有的資源,如果碰到上面的問題,能夠搞定的只有你的老板。你把你的老板搞定,老板可以給你很多的資源,才能把這件事情推動(dòng)下去,不然只會卡殼在那。業(yè)務(wù)的壓力推著你,把事情升級到老板并且說服他,讓他幫你協(xié)調(diào)各種資源。
爆發(fā)期也就是6月到9月份的時(shí)候,業(yè)務(wù)量從最開始的100萬爆發(fā)到800萬甚至1000萬。這過程會出現(xiàn)很多問題,如性能問題,詭異的問題頻現(xiàn)。在項(xiàng)目上前期是快速推廣和試錯(cuò),會忽略或者不太考慮一些技術(shù)上的風(fēng)險(xiǎn),會留下有很多的技術(shù)債,這在整個(gè)業(yè)務(wù)量增長起來后頻發(fā)的暴露出來。
隨著整個(gè)業(yè)務(wù)上的強(qiáng)制往上堆和業(yè)務(wù)量的持續(xù)增長,壓力會傳導(dǎo)到研發(fā)和運(yùn)維,如果經(jīng)常出現(xiàn)故障,每個(gè)層面面對的壓力非常大。
工程師文化就是專業(yè)、高效、開放、技術(shù)和擔(dān)當(dāng),而且一定要認(rèn)為這事我們是可以做到的。
彈性是我們的一個(gè)救命稻草,隨著業(yè)務(wù)量的增長彈性化擴(kuò)展。彈性會分兩個(gè)架構(gòu):一個(gè)是應(yīng)用架構(gòu),另一個(gè)是基礎(chǔ)架構(gòu)。應(yīng)用架構(gòu)偏研發(fā)多一點(diǎn),基礎(chǔ)架構(gòu)偏運(yùn)維多一點(diǎn)。
應(yīng)用架構(gòu):
基礎(chǔ)架構(gòu):
左邊這個(gè)圖是大體一個(gè)草圖,用戶端的請求過來會經(jīng)過多種鏈路,如防火墻、網(wǎng)關(guān)負(fù)載均衡器、數(shù)據(jù)庫等等。這一串長的鏈路要支持橫向和快速擴(kuò)容。橫向涉及到技術(shù)標(biāo)準(zhǔn)的選型,快速是考驗(yàn)技術(shù)架構(gòu)能力,在做推廣的時(shí)候,服務(wù)器可能從一百臺擴(kuò)到上千臺,能不能快速地交付還是需要人工去搞定,這就是快速。
這是我們內(nèi)部做的一個(gè)運(yùn)維平臺叫做維石。這里我們把很多資源分成很多層,最底下一層是硬件的,上一層就是虛擬化層,再到上面一層是一些組件層,專業(yè)組會把自己的組件層做成很多服務(wù),再以編排的形式把它們?nèi)看?lián)起來,對外做交付,使得我們一些技術(shù)資源的申請可以很方便地實(shí)施。
發(fā)布版本就涉及到灰度,很多敏捷迭代,會有一堆試錯(cuò)的在里面,版本上線非常頻繁,我們的系統(tǒng)必須要支持灰度。
對于業(yè)務(wù)有一個(gè)新的功能,灰度可以先切個(gè)10%或者5%的流量過去試用下。對于運(yùn)維層考慮的東西更直觀,切5%的流量和10%流量的時(shí)候,服務(wù)器的CPU負(fù)載有沒有變化,如果流量切到20%,數(shù)據(jù)庫的QPS比以前翻了20%到30%,可以立馬發(fā)現(xiàn)問題并去解決?;叶鹊淖饔檬墙o業(yè)務(wù)層試錯(cuò),也給IT層留下了很大的空間去保證試錯(cuò),如果出現(xiàn)問題我們能夠快速地把流量切換回來。
右邊是一些灰度切換的規(guī)則,我們需要根據(jù)環(huán)境來切換、根據(jù)某個(gè)系統(tǒng)來切換,根據(jù)UIL服務(wù)串或者版本號來切換,規(guī)則做得越細(xì),切換的力度就會越細(xì),比較更加有保障。
服務(wù)保護(hù)一般有三種模式:限流、熔斷和隔離。
監(jiān)控分兩個(gè)維度:一個(gè)是基礎(chǔ)架構(gòu),一個(gè)是業(yè)務(wù)監(jiān)控。
左邊是微服務(wù)化后的圖,單體應(yīng)用根據(jù)某種業(yè)務(wù)規(guī)則拆分得很細(xì),分布在不同的節(jié)點(diǎn)上,一個(gè)微服務(wù)可能幾百上千個(gè)節(jié)點(diǎn),這時(shí)定位故障就困難了。我們需要鏈路追蹤和非常完備的日志系統(tǒng),才能很好地處理問題。
對于微服務(wù),有一些自己的觀點(diǎn)。第一個(gè)是拆分的規(guī)則,拆分沒做好好就會亂七八糟,最后就沒有規(guī)則了。第二個(gè)是做微服務(wù)化需要組織架構(gòu)的支撐,否則整個(gè)微服務(wù)化有點(diǎn)像打著技術(shù)的幌子,把簡單的事情做得復(fù)雜化。
任何系統(tǒng)是不能保證100%不出任何問題的,因此需要應(yīng)急預(yù)案。在系統(tǒng)上做一些降級或者關(guān)閉的開關(guān)。在業(yè)務(wù)上最好也有線下的應(yīng)急預(yù)案。
演練就是針對應(yīng)急預(yù)案是否有效進(jìn)行驗(yàn)證。演練有兩種環(huán)境:一種是直接在生產(chǎn)環(huán)境做,另一種是以模擬環(huán)境做。不管何種環(huán)境要有真實(shí)現(xiàn)場的感覺,要給參加演練的人壓力。在演練的過程中也可以鍛煉人員能力。
業(yè)務(wù)有推廣的需求,但是,服務(wù)器是否能夠支撐的住并無把握,最簡單的辦法就是壓測。壓測分為三種情況:單接口壓測、生產(chǎn)流量回放和模擬流量回放。單接口壓測并不能準(zhǔn)確的反應(yīng)實(shí)際情況。
這時(shí)需要生產(chǎn)流量的回放,把生產(chǎn)上面的所有操作全部拉下來,通過回放工具,對整個(gè)的環(huán)境做一些壓測?;胤殴ぞ弑仨氁С直稊?shù)上的回放,驗(yàn)證業(yè)務(wù)預(yù)估的量進(jìn)行檢測。也必須要支持能夠自己造數(shù)據(jù),現(xiàn)有的生產(chǎn)上面的流量數(shù)據(jù)還是跟實(shí)際推廣時(shí)是有差別的。
最開始做雙活的目的有兩個(gè):第一個(gè)是保證系統(tǒng)更加可靠,第二個(gè)是容災(zāi)資源合理的利用起來避免浪費(fèi)。做雙活最麻煩的一件事情是需要把整個(gè)大部分的請求或者某一個(gè)單元中的請求盡可能在同一個(gè)機(jī)房中解決。
跨機(jī)房的流量互串會出現(xiàn)問題,當(dāng)某個(gè)機(jī)房宕掉了更加麻煩。還有redis、DB等數(shù)據(jù)同步保證集群數(shù)據(jù)一致性的問題。通過kafka模塊,根據(jù)分流規(guī)則分流到對應(yīng)的機(jī)房里。
以分流來說,我們必須支持用戶請求到前端就能夠做正常的分流操作。分流操作的做法是在APP或?yàn)g覽器中,在http請求中打上城市代碼的標(biāo)記,根據(jù)這個(gè)標(biāo)記規(guī)則進(jìn)行分流將流量轉(zhuǎn)發(fā)到對應(yīng)的機(jī)房中。
這個(gè)圖是切換,如果某一個(gè)機(jī)房出現(xiàn)問題的話,我們在OPS平臺上做配置,將整個(gè)流量切換到其它機(jī)房。
運(yùn)維的價(jià)值在哪里呢?
第一個(gè)質(zhì)量。質(zhì)量無非是一些可用率、故障數(shù)、平均故障時(shí)長和用戶滿意率,這是運(yùn)維必須要達(dá)到的。
第二個(gè)成本。我們效果是拒絕浪費(fèi),有多個(gè)維度,資源是否得到充分合理的利用,容量評估是否數(shù)字化。流程是否與工具相結(jié)合。人力方面是否優(yōu)化,把重復(fù)的勞動(dòng)想辦法替掉。
第三個(gè)效率。傳統(tǒng)型的運(yùn)維要有所轉(zhuǎn)型,往IT運(yùn)營方向轉(zhuǎn)型解決方案的提供者。另一個(gè)方向是往運(yùn)維開發(fā)轉(zhuǎn)型,從重復(fù)勞動(dòng)中解放出來。
第四個(gè)數(shù)據(jù)運(yùn)營。運(yùn)維人員是最了解整個(gè)公司的業(yè)務(wù)流程和數(shù)據(jù)模式的走勢,要做很多數(shù)據(jù)方面的分析,包括數(shù)據(jù)運(yùn)營能力方面的體現(xiàn),為公司創(chuàng)造更大的價(jià)值。
感謝各位的閱讀!關(guān)于互聯(lián)網(wǎng)運(yùn)維數(shù)字化轉(zhuǎn)型的示例就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!