前言
成都創(chuàng)新互聯(lián)公司專注于泗縣網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供泗縣營銷型網(wǎng)站建設(shè),泗縣網(wǎng)站制作、泗縣網(wǎng)頁設(shè)計、泗縣網(wǎng)站官網(wǎng)定制、小程序設(shè)計服務(wù),打造泗縣網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供泗縣網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。一個成熟的大型網(wǎng)站(如淘寶、京東等)的系統(tǒng)架構(gòu)并不是開始設(shè)計就具備完整的高性能、高可用、安全等特性,它總是隨著用戶量的增加,業(yè)務(wù)功能的擴展逐漸演變完善的,在這個過程中,開發(fā)模式、技術(shù)架構(gòu)、設(shè)計思想也發(fā)生了很大的變化,就連技術(shù)人員也從幾個人發(fā)展到一個部門甚至一條產(chǎn)品線。所以成熟的系統(tǒng)架構(gòu)是隨業(yè)務(wù)擴展而完善出來的,并不是一蹴而就;不同業(yè)務(wù)特征的系統(tǒng),會有各自的側(cè)重點,例如淘寶,要解決海量的商品信息的搜索、下單、支付,例如騰訊,要解決數(shù)億的用戶實時消息傳輸,百度它要處理海量的搜索請求,他們都有各自的業(yè)務(wù)特性,系統(tǒng)架構(gòu)也有所不同。盡管如此我們也可以從這些不同的網(wǎng)站背景下,找出其中共用的技術(shù),這些技術(shù)和手段可以廣泛運行在大型網(wǎng)站系統(tǒng)的架構(gòu)中,下面就通過介紹大型網(wǎng)站系統(tǒng)的演化過程,來認(rèn)識這些技術(shù)和手段。
一、最開始的網(wǎng)站架構(gòu)
最初的架構(gòu),應(yīng)用程序、數(shù)據(jù)庫、文件都部署在一臺服務(wù)器上,如圖:
二、應(yīng)用、數(shù)據(jù)、文件分離
隨著業(yè)務(wù)的擴展,一臺服務(wù)器已經(jīng)不能滿足性能需求,故將應(yīng)用程序、數(shù)據(jù)庫、文件各自部署在獨立的服務(wù)器上,并且根據(jù)服務(wù)器的用途配置不同的硬件,達(dá)到最佳的性能效果。
三、利用緩存改善網(wǎng)站性能
在硬件優(yōu)化性能的同時,同時也通過軟件進(jìn)行性能優(yōu)化,在大部分的網(wǎng)站系統(tǒng)中,都會利用緩存技術(shù)改善系統(tǒng)的性能,使用緩存主要源于熱點數(shù)據(jù)的存在,大部分網(wǎng)站訪問都遵循28原則(即80%的訪問請求,最終落在20%的數(shù)據(jù)上),所以我們可以對熱點數(shù)據(jù)進(jìn)行緩存,減少這些數(shù)據(jù)的訪問路徑,提高用戶體驗。
緩存實現(xiàn)常見的方式是本地緩存、分布式緩存。當(dāng)然還有CDN、反向代理等,這個后面再講。本地緩存,顧名思義是將數(shù)據(jù)緩存在應(yīng)用服務(wù)器本地,可以存在內(nèi)存中,也可以存在文件,OSCache就是常用的本地緩存組件。本地緩存的特點是速度快,但因為本地空間有限所以緩存數(shù)據(jù)量也有限。分布式緩存的特點是,可以緩存海量的數(shù)據(jù),并且擴展非常容易,在門戶類網(wǎng)站中常常被使用,速度按理沒有本地緩存快,常用的分布式緩存是Memcached、Redis。
四、使用集群改善應(yīng)用服務(wù)器性能
應(yīng)用服務(wù)器作為網(wǎng)站的入口,會承擔(dān)大量的請求,我們往往通過應(yīng)用服務(wù)器集群來分擔(dān)請求數(shù)。應(yīng)用服務(wù)器前面部署負(fù)載均衡服務(wù)器調(diào)度用戶請求,根據(jù)分發(fā)策略將請求分發(fā)到多個應(yīng)用服務(wù)器節(jié)點。
常用的負(fù)載均衡技術(shù)硬件的有F5,價格比較貴,軟件的有LVS、Nginx、HAProxy。LVS是四層負(fù)載均衡,根據(jù)目標(biāo)地址和端口選擇內(nèi)部服務(wù)器,Nginx是七層負(fù)載均衡和HAProxy支持四層、七層負(fù)載均衡,可以根據(jù)報文內(nèi)容選擇內(nèi)部服務(wù)器,因此LVS分發(fā)路徑優(yōu)于Nginx和HAProxy,性能要高些,而Nginx和HAProxy則更具配置性,如可以用來做動靜分離(根據(jù)請求報文特征,選擇靜態(tài)資源服務(wù)器還是應(yīng)用服務(wù)器)。
五、數(shù)據(jù)庫讀寫分離和分庫分表
隨著用戶量的增加,數(shù)據(jù)庫成為大的瓶頸,改善數(shù)據(jù)庫性能常用的手段是進(jìn)行讀寫分離以及分表,讀寫分離顧名思義就是將數(shù)據(jù)庫分為讀庫和寫庫,通過主備功能實現(xiàn)數(shù)據(jù)同步。分庫分表則分為水平切分和垂直切分,水平切換則是對一個數(shù)據(jù)庫特大的表進(jìn)行拆分,例如用戶表。垂直切分則是根據(jù)業(yè)務(wù)不同來切換,如用戶業(yè)務(wù)、商品業(yè)務(wù)相關(guān)的表放在不同的數(shù)據(jù)庫中。
六、使用CDN和反向代理提高網(wǎng)站性能
假如我們的服務(wù)器都部署在成都的機房,對于四川的用戶來說訪問是較快的,而對于北京的用戶訪問是較慢的,這是由于四川和北京分別屬于電信和聯(lián)通的不同發(fā)達(dá)地區(qū),北京用戶訪問需要通過互聯(lián)路由器經(jīng)過較長的路徑才能訪問到成都的服務(wù)器,返回路徑也一樣,所以數(shù)據(jù)傳輸時間比較長。對于這種情況,常常使用CDN解決,CDN將數(shù)據(jù)內(nèi)容緩存到運營商的機房,用戶訪問時先從最近的運營商獲取數(shù)據(jù),這樣大大減少了網(wǎng)絡(luò)訪問的路徑。比較專業(yè)的CDN運營商有藍(lán)汛、網(wǎng)宿。
而反向代理,則是部署在網(wǎng)站的機房,當(dāng)用戶請求達(dá)到時首先訪問反向代理服務(wù)器,反向代理服務(wù)器將緩存的數(shù)據(jù)返回給用戶,如果沒有沒有緩存數(shù)據(jù)才會繼續(xù)走應(yīng)用服務(wù)器獲取,也減少了獲取數(shù)據(jù)的成本。反向代理有Squid,Nginx。
七、使用分布式文件系統(tǒng)
用戶一天天增加,業(yè)務(wù)量越來越大,產(chǎn)生的文件越來越多,單臺的文件服務(wù)器已經(jīng)不能滿足需求。需要分布式的文件系統(tǒng)支撐。常用的分布式文件系統(tǒng)有NFS。
八、使用NoSql和搜索引擎
對于海量數(shù)據(jù)的查詢,我們使用nosql數(shù)據(jù)庫加上搜索引擎可以達(dá)到更好的性能。并不是所有的數(shù)據(jù)都要放在關(guān)系型數(shù)據(jù)中。常用的NOSQL有mongodb和redis,搜索引擎有l(wèi)ucene。
九、將應(yīng)用服務(wù)器進(jìn)行業(yè)務(wù)拆分
隨著業(yè)務(wù)進(jìn)一步擴展,應(yīng)用程序變得非常臃腫,這時我們需要將應(yīng)用程序進(jìn)行業(yè)務(wù)拆分,如百度分為新聞、網(wǎng)頁、圖片等業(yè)務(wù)。每個業(yè)務(wù)應(yīng)用負(fù)責(zé)相對獨立的業(yè)務(wù)運作。業(yè)務(wù)之間通過消息進(jìn)行通信或者同享數(shù)據(jù)庫來實現(xiàn)。
十、搭建分布式服務(wù)
這時我們發(fā)現(xiàn)各個業(yè)務(wù)應(yīng)用都會使用到一些基本的業(yè)務(wù)服務(wù),例如用戶服務(wù)、訂單服務(wù)、支付服務(wù)、安全服務(wù),這些服務(wù)是支撐各業(yè)務(wù)應(yīng)用的基本要素。我們將這些服務(wù)抽取出來利用分部式服務(wù)框架搭建分布式服務(wù)。淘寶的Dubbo是一個不錯的選擇。
小結(jié)
大型網(wǎng)站的架構(gòu)是根據(jù)業(yè)務(wù)需求不斷完善的,根據(jù)不同的業(yè)務(wù)特征會做特定的設(shè)計和考慮,本文只是講述一個常規(guī)大型網(wǎng)站會涉及的一些技術(shù)和手段。
讀者福利
加微信:haolagui521備注51CTO領(lǐng)取附送學(xué)習(xí)進(jìn)階架構(gòu)資料、PDF書籍文檔、面試資料
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。