本篇內(nèi)容介紹了“大數(shù)據(jù)對(duì)科學(xué)研究的影響有哪些”的有關(guān)知識(shí),在實(shí)際案例的操作過(guò)程中,不少人都會(huì)遇到這樣的困境,接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
創(chuàng)新互聯(lián)公司作為成都網(wǎng)站建設(shè)公司,專(zhuān)注網(wǎng)站建設(shè)公司、網(wǎng)站設(shè)計(jì),有關(guān)企業(yè)網(wǎng)站設(shè)計(jì)方案、改版、費(fèi)用等問(wèn)題,行業(yè)涉及成都玻璃鋼坐凳等多個(gè)領(lǐng)域,已為上千家企業(yè)服務(wù),得到了客戶(hù)的尊重與認(rèn)可。著名數(shù)據(jù)庫(kù)專(zhuān)家吉姆·格雷(Jim Gray)博士觀察并總結(jié)認(rèn)為,人類(lèi)自古以來(lái)在科學(xué)研究上先后歷經(jīng)了實(shí)驗(yàn)、理論、計(jì)算和數(shù)據(jù)四種范式,具體如下:
?。?)第一種范式:實(shí)驗(yàn)
在最初的科學(xué)研究階段,人類(lèi)采用實(shí)驗(yàn)來(lái)解決一些科學(xué)問(wèn)題,著名的比薩斜塔實(shí)驗(yàn)就是一個(gè)典型實(shí)例。1590年,伽利略在比薩斜塔上做了“兩個(gè)鐵球同時(shí)落地”的實(shí)驗(yàn),得出了重量不同的兩個(gè)鐵球同時(shí)下落的結(jié)論,從此推翻了亞里士多德“物體下落速度和重量成比例”的學(xué)說(shuō),糾正了這個(gè)持續(xù)了1 900年之久的錯(cuò)誤結(jié)論。
(2)第二種范式:理論
隨著科學(xué)的進(jìn)步,人類(lèi)開(kāi)始采用各種數(shù)學(xué)、幾何、物理等理論,構(gòu)建問(wèn)題模型和解決方案。比如牛頓第一定律、牛頓第二定律、牛頓第三定律構(gòu)成了牛頓力學(xué)的完整體系,奠定了經(jīng)典力學(xué)的概念基礎(chǔ),它的廣泛傳播和運(yùn)用對(duì)人們的生活和思想產(chǎn)生了重大影響,在很大程度上推動(dòng)了人類(lèi)社會(huì)的發(fā)展與進(jìn)步。
?。?)第三種范式:計(jì)算
隨著1946年人類(lèi)歷史上第一臺(tái)計(jì)算機(jī)ENIAC的誕生,人類(lèi)社會(huì)開(kāi)始步入計(jì)算機(jī)時(shí)代,科學(xué)研究也進(jìn)入了一個(gè)以“計(jì)算”為中心的全新時(shí)期。通過(guò)設(shè)計(jì)算法并編寫(xiě)相應(yīng)程序輸入計(jì)算機(jī)運(yùn)行,人類(lèi)可以借助于計(jì)算機(jī)的高速運(yùn)算能力去解決各種問(wèn)題。計(jì)算機(jī)具有存儲(chǔ)容量大、運(yùn)算速度快、精度高、可重復(fù)執(zhí)行等特點(diǎn),是科學(xué)研究的利器,推動(dòng)了人類(lèi)社會(huì)的飛速發(fā)展
?。?)第四種范式:數(shù)據(jù)
隨著數(shù)據(jù)的不斷累積,其寶貴價(jià)值日益得到體現(xiàn),物聯(lián)網(wǎng)和云計(jì)算的出現(xiàn),更是促成了事物發(fā)展從量變到質(zhì)變的轉(zhuǎn)變,使人類(lèi)社會(huì)開(kāi)啟了全新的大數(shù)據(jù)時(shí)代。在大數(shù)據(jù)環(huán)境下,一切將以數(shù)據(jù)為中心,從數(shù)據(jù)中發(fā)現(xiàn)問(wèn)題、解決問(wèn)題,真正體現(xiàn)數(shù)據(jù)的價(jià)值。大數(shù)據(jù)將成為科學(xué)工作者的寶藏,從數(shù)據(jù)中可以挖掘未知模式和有價(jià)值的信息,服務(wù)于生產(chǎn)和生活,推動(dòng)科技創(chuàng)新和社會(huì)進(jìn)步。
2 大數(shù)據(jù)對(duì)思維方式的影響
維克托·邁爾·舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書(shū)中明確指出,大數(shù)據(jù)時(shí)代大的轉(zhuǎn)變就是思維方式的3種轉(zhuǎn)變:全樣而非抽樣、效率而非精確、相關(guān)而非因果。
(1)全樣而非抽樣
過(guò)去,由于數(shù)據(jù)存儲(chǔ)和處理能力的限制,在科學(xué)分析中,通常采用抽樣的方法,即從全集數(shù)據(jù)中抽取一部分樣本數(shù)據(jù),通過(guò)對(duì)樣本數(shù)據(jù)的分析,來(lái)推斷全集數(shù)據(jù)的總體特征。通常,樣本數(shù)據(jù)規(guī)模要比全集數(shù)據(jù)小很多,因此,可以在可控的代價(jià)內(nèi)實(shí)現(xiàn)數(shù)據(jù)分析的目的?,F(xiàn)在,我們已經(jīng)迎來(lái)大數(shù)據(jù)時(shí)代,大數(shù)據(jù)技術(shù)的核心就是海量數(shù)據(jù)的存儲(chǔ)和處理,分布式文件系統(tǒng)和分布式數(shù)據(jù)庫(kù)技術(shù),提供了理論上近乎無(wú)限的數(shù)據(jù)存儲(chǔ)能力,分布式并行編程框架MapReduce提供了強(qiáng)大的海量數(shù)據(jù)并行處理能力。因此,有了大數(shù)據(jù)技術(shù)的支持,科學(xué)分析完全可以直接針對(duì)全集數(shù)據(jù)而不是抽樣數(shù)據(jù),并且可以在短時(shí)間內(nèi)迅速得到分析結(jié)果,速度之快,超乎我們的想象。就像前面我們已經(jīng)提到過(guò)的,谷歌公司的Dremel可以在2~3秒內(nèi)完成PB級(jí)別數(shù)據(jù)的查詢(xún)。
?。?)效率而非精確
過(guò)去,我們?cè)诳茖W(xué)分析中采用抽樣分析方法,就必須追求分析方法的精確性,因?yàn)椋闃臃治鲋皇轻槍?duì)部分樣本的分析,其分析結(jié)果被應(yīng)用到全集數(shù)據(jù)以后,誤差會(huì)被放大,這就意味著,抽樣分析的微小誤差,被放大到全集數(shù)據(jù)以后,可能會(huì)變成一個(gè)很大的誤差。因此,為了保證誤差被放大到全集數(shù)據(jù)時(shí)仍然處于可以接受的范圍,就必要確保抽樣分析結(jié)果的精確性。正是由于這個(gè)原因,傳統(tǒng)的數(shù)據(jù)分析方法往往更加注重提高算法的精確性,其次才是提高算法效率。現(xiàn)在,大數(shù)據(jù)時(shí)代采用全樣分析而不是抽樣分析,全樣分析結(jié)果就不存在誤差被放大的問(wèn)題,因此,追求高精確性已經(jīng)不是其首要目標(biāo);相反,大數(shù)據(jù)時(shí)代具有“秒級(jí)響應(yīng)”的特征,要求在幾秒內(nèi)就迅速給出針對(duì)海量數(shù)據(jù)的實(shí)時(shí)分析結(jié)果,否則就會(huì)喪失數(shù)據(jù)的價(jià)值,因此,數(shù)據(jù)分析的效率成為關(guān)注的核心。
?。?)相關(guān)而非因果
過(guò)去,數(shù)據(jù)分析的目的,一方面是解釋事物背后的發(fā)展機(jī)理,比如,一個(gè)大型超市在某個(gè)地區(qū)的連鎖店在某個(gè)時(shí)期內(nèi)凈利潤(rùn)下降很多,這就需要IT部門(mén)對(duì)相關(guān)銷(xiāo)售數(shù)據(jù)進(jìn)行詳細(xì)分析找出發(fā)生問(wèn)題的原因;另一方面是用于預(yù)測(cè)未來(lái)可能發(fā)生的事件,比如,通過(guò)實(shí)時(shí)分析微博數(shù)據(jù),當(dāng)發(fā)現(xiàn)人們對(duì)霧霾的討論明顯增加時(shí),就可以建議銷(xiāo)售部門(mén)增加口罩的進(jìn)貨量,因?yàn)?,人們關(guān)注霧霾的一個(gè)直接結(jié)果是,大家會(huì)想到購(gòu)買(mǎi)一個(gè)口罩來(lái)保護(hù)自己的身體健康。不管是哪個(gè)目的,其實(shí)都反映了一種“因果關(guān)系”。但是,在大數(shù)據(jù)時(shí)代,因果關(guān)系不再那么重要,人們轉(zhuǎn)而追求“相關(guān)性”而非“因果性”。比如,我們?nèi)ヌ詫毦W(wǎng)購(gòu)物時(shí),當(dāng)我們購(gòu)買(mǎi)了一個(gè)汽車(chē)防盜鎖以后,淘寶網(wǎng)還會(huì)自動(dòng)提示你,與你購(gòu)買(mǎi)相同物品的其他客戶(hù)還購(gòu)買(mǎi)了汽車(chē)坐墊,也就是說(shuō),淘寶網(wǎng)只會(huì)告訴你“購(gòu)買(mǎi)汽車(chē)防盜鎖”和“購(gòu)買(mǎi)汽車(chē)坐墊”之間存在相關(guān)性,但是,并不會(huì)告訴你為什么其他客戶(hù)購(gòu)買(mǎi)了汽車(chē)防盜鎖以后還會(huì)購(gòu)買(mǎi)汽車(chē)坐墊。
“大數(shù)據(jù)對(duì)科學(xué)研究的影響有哪些”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!