在大數(shù)據(jù)高速發(fā)展的今天,數(shù)據(jù)量在不斷的增加,特別是互聯(lián)網(wǎng)web2.0應(yīng)用的興起及云計算所需要的海量存儲和海量計算發(fā)展,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫暴露了很多難以克服的問題,已無法滿足這方面的需求。而非關(guān)系類型的數(shù)據(jù)庫(NOSQL=Not Only SQL,意即“不僅僅是SQL”)則由于其本身的特點從而得到了非常迅速的發(fā)展,因為它的產(chǎn)生就是為了解決大規(guī)模集合和多重數(shù)據(jù)的存儲和計算方面的大數(shù)據(jù)應(yīng)用難題。
根據(jù)國際數(shù)據(jù)公司IDC檢測統(tǒng)計,2011年全球數(shù)據(jù)總量已達(dá)1.8ZB (1ZB 等于1萬億GB), 且數(shù)據(jù)總量增長每兩年翻一番,預(yù)計到2020年全球總量將達(dá)到40 ZB,地球上人均數(shù)據(jù)預(yù)計將達(dá)到5247GB.據(jù)統(tǒng)計,現(xiàn)在的谷歌搜索引擎每秒使用用戶量已超過200萬,Twitter每天就會生成超過10TB的數(shù)據(jù),F(xiàn)acebook的數(shù)據(jù)為幾十TB,一些特殊的企業(yè)在每小時就會產(chǎn)生TB級別的數(shù)據(jù)。
但是,如何利用這些數(shù)據(jù) 從中產(chǎn)生最大的商業(yè)價值,是所有公司和機構(gòu)共同面臨的挑戰(zhàn)。這個問題比較復(fù)雜,雖然技術(shù)人員在技能提升和專業(yè)工具的幫助下,對數(shù)據(jù)越來越了解,但由于數(shù)據(jù)的增長速度越來越快,積累量越來越大,公司和機構(gòu)可以利用的數(shù)據(jù)比例正在迅速下降。
我們知道sql數(shù)據(jù)庫可以存儲數(shù)據(jù)和處理數(shù)據(jù),但是NOSQL最大的一個優(yōu)勢就是在處理大數(shù)據(jù)這方面,能夠深度處理大數(shù)據(jù),分析數(shù)據(jù),從大量的數(shù)據(jù)中獲取有用的資源。
公司主營業(yè)務(wù):網(wǎng)站設(shè)計、網(wǎng)站制作、移動網(wǎng)站開發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競爭能力。創(chuàng)新互聯(lián)是一支青春激揚、勤奮敬業(yè)、活力青春激揚、勤奮敬業(yè)、活力澎湃、和諧高效的團隊。公司秉承以“開放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對我們的高要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團隊有機會用頭腦與智慧不斷的給客戶帶來驚喜。創(chuàng)新互聯(lián)推出昌江黎族免費做網(wǎng)站回饋大家。
而傳統(tǒng)的關(guān)系數(shù)據(jù)庫在大數(shù)據(jù)處理方面就顯得力不從心,暴露出了很多難以克服的問題,例如:
1、對數(shù)據(jù)庫高并發(fā)讀寫的需求
Web2.0應(yīng)用要根據(jù)用戶個性化信息來實時生成動態(tài)頁面和提供動態(tài)信息,所以基本上無法使用動態(tài)頁面靜態(tài)化技術(shù),因此數(shù)據(jù)庫并發(fā)負(fù)載非常高,往往要達(dá)到每秒上萬次讀寫請求。關(guān)系數(shù)據(jù)庫應(yīng)付上萬次SQL查詢還勉強頂?shù)米?,但是?yīng)付上萬次SQL寫數(shù)據(jù)請求,硬盤IO就已經(jīng)無法承受了。其實對于普通的BBS網(wǎng)站,往往也存在對高并發(fā)寫請求的需求,例如像一些網(wǎng)站的實時統(tǒng)計在線用戶狀態(tài),記錄熱門帖子的點擊次數(shù),投票計數(shù)等,因此這是一個相當(dāng)普遍的需求。
2、對海量數(shù)據(jù)的高效率存儲和訪問的需求
類似Facebook,twitter,F(xiàn)riendfeed這樣的SNS網(wǎng)站,每天用戶產(chǎn)生海量的用戶動態(tài),以Friendfeed為例,一個月就達(dá)到了2.5億條用戶動態(tài),對于關(guān)系數(shù)據(jù)庫來說,在一張2.5億條記錄的表里面進(jìn)行SQL查詢,效率是極其低下乃至不可忍受的。再例如大型web網(wǎng)站的用戶登錄系統(tǒng),例如百度、阿里、騰訊,動輒數(shù)以億計的帳號,關(guān)系數(shù)據(jù)庫也很難應(yīng)付。
3、對數(shù)據(jù)庫的高可擴展性和高可用性的需求
在基于web的架構(gòu)當(dāng)中,數(shù)據(jù)庫是最難進(jìn)行橫向擴展的,當(dāng)一個應(yīng)用系統(tǒng)的用戶量和訪問量與日俱增的時候,你的數(shù)據(jù)庫卻沒有辦法像web server和app server那樣簡單的通過添加更多的硬件和服務(wù)節(jié)點來擴展性能和負(fù)載能力。對于很多需要提供24小時不間斷服務(wù)的網(wǎng)站來說,對數(shù)據(jù)庫系統(tǒng)進(jìn)行升級和擴展是非常痛苦的事情,往往需要停機維護(hù)和數(shù)據(jù)遷移,為什么數(shù)據(jù)庫不能通過不斷的添加服務(wù)器節(jié)點來實現(xiàn)擴展呢?
因此,數(shù)聚傳媒技術(shù)部門采用了非關(guān)系數(shù)據(jù)庫中的MongoDB來存儲數(shù)據(jù)。MongoDB的優(yōu)點正是傳統(tǒng)的關(guān)系數(shù)據(jù)庫力不能及的。我們利用MongoDB解決了大規(guī)模集合和多重數(shù)據(jù)的存儲和計算方面的大數(shù)據(jù)應(yīng)用難題。
數(shù)聚傳媒擁有精準(zhǔn)的人群數(shù)據(jù)庫,強大的人群cookie模型,通過分析,可以直接定位目標(biāo)受眾;近六千的用戶標(biāo)簽,讓廣告智能的找用戶;多重優(yōu)化機制,渲染釋放出最佳投放效果,得以構(gòu)建全場景數(shù)據(jù)營銷模式, 最后經(jīng)過智能的算法以及競價原理,實現(xiàn)廣告投放效果最大化;合理的競價模式使得廣告主的廣告投放即精準(zhǔn)又有性價比。