大數(shù)據(jù)的概念起源其實就和時間聯(lián)系得非常緊密,一方面是單位時間內(nèi)的數(shù)據(jù)種類和數(shù)據(jù)量,另一方面是歷史時間內(nèi)的數(shù)據(jù)積累,這兩方面的交叉復(fù)合增長才使得數(shù)據(jù)可能被稱為大。
成都創(chuàng)新互聯(lián)公司是一家專注于網(wǎng)站設(shè)計、網(wǎng)站制作與策劃設(shè)計,澄邁網(wǎng)站建設(shè)哪家好?成都創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設(shè)十載,網(wǎng)設(shè)計領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:澄邁等地區(qū)。澄邁做網(wǎng)站價格咨詢:028-86922220
從古至今,人類個體在單位時間內(nèi)創(chuàng)造的數(shù)據(jù)本來是一樣多的,但內(nèi)在差別卻很大。
第一種差別可以稱做數(shù)據(jù)質(zhì)量的差別。以前人們在單位時間內(nèi)做的事情種類很少,可以很簡單的做歸類聚合。而現(xiàn)代人的任務(wù)切換太頻繁了,因此需要更多的數(shù)據(jù)來進行描述。姑且不論做事質(zhì)量的好壞,我們可以說以前的數(shù)據(jù)單一,質(zhì)量差,現(xiàn)在在的數(shù)據(jù)豐富,質(zhì)量好。
第二種差別涉及到可用性的概念,包括可獲取性,可處理性,處理結(jié)果有無意義等。我們說以前的數(shù)據(jù)可用性差。最大的原因是收集方式匱乏,沒有有效的手段獲取數(shù)據(jù)。而另一個重要的原因就是大量個體產(chǎn)生的數(shù)據(jù)趨同,英雄才造時勢,英雄又很少,因此針對歷史的大量研究都趨向于統(tǒng)計群體的數(shù)據(jù),而不是個體。
但現(xiàn)代社會有很大的不同,物質(zhì)的豐富加上精神的多彩使得人類個體對于如何生活有了更多的選擇。人民群眾造時勢,時勢造英雄,人人又都是英雄。把我們?nèi)祟愖约嚎闯蓴?shù)據(jù)的生產(chǎn)者,生活中更多的選擇實質(zhì)上生產(chǎn)出了更多種類的數(shù)據(jù)。以前是千人一面,現(xiàn)在則可能一人千面,人類社會的發(fā)展本質(zhì)上是一個熵增的過程。
人與動物的一個重要區(qū)別就是人會制造和使用工具?,F(xiàn)代人擁有足夠多的工具,相比我們的祖先,我們可以在更少的時間中做更多的事。這個說法聽上去太具有誘惑力了,從極限上來說,人類可以在有限時間內(nèi)做無限的事務(wù),雖然我們的感覺反而是現(xiàn)代人越來越?jīng)]有時間了:(。那么反過來對于數(shù)據(jù)來說,它們就擁有了我們越來越多的時間,也至于無限。從這個角度來說,不是我們擁有了數(shù)據(jù),而是數(shù)據(jù)擁有了我們。
繼續(xù)深入,則應(yīng)該能想到大數(shù)據(jù)發(fā)展的一個方向可以是"個人的大數(shù)據(jù)",即這種應(yīng)用的目的是為單個人創(chuàng)建他自己的數(shù)據(jù)庫和分析系統(tǒng)。因為單個人的數(shù)據(jù)量都已經(jīng)大到可稱為大數(shù)據(jù)的地步了。
目前來看,要想獲得一個人的數(shù)據(jù),最根本的是掌控他的時間。一個人最寶貴的也就是他的時間。各種APP應(yīng)用本質(zhì)上作為數(shù)據(jù)收集器,首要任務(wù)就是吸引人們沉浸其中,因為數(shù)據(jù)量大小取決于人們在某個應(yīng)用上耗費的時間。
然而,當(dāng)一個應(yīng)用占用人們過多的時間時,情況又發(fā)生變化。一個顯而易見的的例子是,各種自詡精準(zhǔn)推送的應(yīng)用,往往推薦的東西并不是用戶想要的,或者說正是應(yīng)用"培養(yǎng)"了用戶,而用戶本來并非如此。那么這種屁股決定腦袋的數(shù)據(jù)及其分析顯然是不準(zhǔn)確的。
大數(shù)據(jù)是我們的工具,用來輔助決策,節(jié)省決策的時間。一方面是通過大數(shù)據(jù)系統(tǒng)組件的發(fā)展升級以及越來越快的硬件,此所謂工具的工具。一方面是大數(shù)據(jù)的應(yīng)用,搜索,電商,金融,醫(yī)療,以至生活的方方面面。
數(shù)據(jù)雖然多了,但是處理快了,節(jié)省了人們的思考時間。能否思考是活人與死人的唯一區(qū)別。在2015年,人類總共創(chuàng)造了4.4ZB(44億TB)的數(shù)據(jù),而這個數(shù)字大約每兩年就會翻倍,但每年只有不到10%的數(shù)據(jù)會被分析處理。人們又是否為了節(jié)省決策的時間而在搜集和處理數(shù)據(jù)上花費了更多的時間?所謂的“資源詛咒”會不會在大數(shù)據(jù)領(lǐng)域出現(xiàn)呢?