互聯(lián)網IDC圈1月28日報道:大數(shù)據技術與移動互聯(lián)技術和云計算技術一樣,都屬于顛覆性的信息技術。但是,大數(shù)據并非是高純度的石油而是含金量非常低的礦石, 數(shù)據量大、種類繁雜、價值密度低、以及時時刻刻都在瞬息萬變的特點,使得存儲、統(tǒng)計、分類以及調用都困難異常,而其中隱藏的發(fā)展規(guī)律和社會經驗則價值巨大。
個舊ssl適用于網站、小程序/APP、API接口等需要進行數(shù)據傳輸應用場景,ssl證書未來市場廣闊!成為創(chuàng)新互聯(lián)公司的ssl證書銷售渠道,可以享受市場價格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:028-86922220(備注:SSL證書合作)期待與您的合作!幸運的是,人工智能領域的一些理論和比較實用的方法,已經開始用于大數(shù)據分析方面,并顯現(xiàn)出初步令人振奮的結果。至此大數(shù)據的價值變現(xiàn)潛能開始逐步被人工智能釋放。同時,大數(shù)據技術的發(fā)展也將在為人工智能提供用武之地的同時,喚醒人工智能巨大的潛力,從而使 這兩個領域的技術和應用出現(xiàn)加速發(fā)展的趨勢。
在2015年新華社新聞學術年會新華網“信息技術與媒體生態(tài)”分論壇上,英特爾中國研究院院長、首席工程師吳甘沙將大數(shù)據的可能價值變現(xiàn)方式劃分為六種: 一是 見微,從小處看到細微的洞察;二是 知著 ,能看到宏觀的變化規(guī)律。 正如《一代宗師》里的臺詞“見自己、見眾生、見天地”,吳甘沙把見微是叫做見自己,知著稱為見眾生、見天地。 第三第四種是 當下 和 皆明 ,當下是此時此刻的感受,皆明是知前后做到萬物皆明,是在時間點上在不同的萬物上獲得洞察。 五六是 辨訛 和 曉意 ,辨訛是去偽存真、查漏補缺,曉意則由于傳統(tǒng)上機器只能處理數(shù)據,對于有深刻內涵的內容無法真正理解顯得異常重要。
知著見微:大數(shù)據的“大彈性”
1、知著
隨著大數(shù)據、人工智能的發(fā)展,機器能進一步窺探到人類的思想境界。知著就是“見天地、見眾生”,正如天文望遠鏡。那么,大數(shù)據如何幫助人們知著呢?具體可以分為兩方面:
一是傳統(tǒng)采樣和定性,采樣更多的是了解平均,作為犧牲,采樣會把黑天鵝的信號當做噪聲過濾掉;
二是傳統(tǒng)定量的研究,尤其是在社會科學領域,大數(shù)據為之后的進一步定量研究做了好鋪墊。社會學里面有一個社會計算學分支,廣告中也有計算廣告學分支,所有這些都是通過定量的方法更好地了解這個社會、了解個體。無論是群體的理性還是個體的非理性,都可以通過定量的分析獲得洞察。
國外專家曾在Twitter上面進行過情感分析試驗,他們發(fā)現(xiàn)Twitter上面的情感變化和FacebookIPO當天股價的變化有高度相關性,而情感變化是股價變化的先行因素,這是一個很有趣的研究。這種研究使得人們能夠更好地看到社會上的一些行為、媒體內容中的一些變化和經濟行為變化的關系。
2、見微
如果說知著是天文望遠鏡,那么見微就是顯微鏡。傳統(tǒng)觀點認為,市場經濟的“市場”是所有人行為的總合,由于對數(shù)據和行為理解的局限,人們看到的市場亦是打馬賽克的塊狀分布。而隨著掌握的數(shù)據的增加,這個市場逐漸變成一個高清的縱深的圖。
傳統(tǒng)上的營銷行為講究的是對客戶群體進行細分,隨著大數(shù)據發(fā)展的深入,客戶群體從細分到微分、微分到個人,實現(xiàn)從個性化到個體化的轉變。
從前,商家只能關注花錢買單的客戶,大數(shù)據則可以實現(xiàn)用戶的體驗反饋,并且從點到面逐漸覆蓋。僅僅覆蓋到線上的面卻是不夠的,隨著移動互聯(lián)網以及位置信息的豐富,線下位置信息可以揭露更多的洞察——原來他到了一個線下的商場做了一次體驗。
網絡信息透露該用戶在體驗之前是獲得了基于位置信息的推薦,或者是因為社交網絡上朋友的一次推薦。體驗結束不僅僅有交易,也會到網上吐槽,而吐槽會進一步形成病毒式的傳播,他的朋友可能是點贊或者進一步轉發(fā)。所有這些就形成了網狀或者是圖狀的數(shù)據,這個數(shù)據使得我們對這個行為有了更好的洞察。
當下皆明:快思考也要深分析
1、當下
對于普通用戶來說,從瀏覽一個網頁或者看一部電影開始,一旦發(fā)起了瀏覽的動作,作為發(fā)行商或者是愛奇藝這樣的電影的流媒體網站就會到供應方平臺發(fā)起請求,發(fā)起的請求會將這個廣告商的畫像描繪出來。
接下來,供應方平臺會到廣告交易平臺進一步獲取廣告,而交易平臺又會將需求傳輸?shù)酱韽V告主的需求方平臺,需求方平臺下面有一個數(shù)據管理平臺,詳細分析了每個個體的偏好,根據傳送的個體偏好的分析返回,推薦合適的廣告。
通過實競價,獲得競價的一方就會把需求發(fā)到程序化的創(chuàng)意平臺,該平臺再根據廣告主以及個體畫像產生一次實時的創(chuàng)意,把真正的廣告給推到個體那邊。
而所有這些的發(fā)生可能在100毫秒發(fā)生,發(fā)生了從數(shù)據的采集到廣告主獲取廣告的候選進行實時競價和程序化的創(chuàng)意,最后形成這個廣告。在整個過程中,大數(shù)據起到了無可比擬的作用,這就是見微,而呈現(xiàn)到每一個個體前面的都是非常精準的廣告營銷。
同時,在100毫秒里面完成的一次精準廣告推薦涉及到當下。在傳統(tǒng)意義上,人們對于知識的理解,對于整個社會的理解基本上都有一個滯后期,吳甘沙把它稱為刻舟求劍,在人們真正獲得洞察的時候,整個這個世界已經變化了。正如建國以來已經進行過的6次人口普查,無論如何精準都是滯后的。而現(xiàn)在隨著大數(shù)據的普及,我們現(xiàn)在有可能更實時地理解我們這個社會。
當然,當下快思考風行,幾秒鐘得到的洞察可能一下子傳播到世界各地,犯的錯誤卻是覆水難收。
2、皆明
對應于當下的叫做皆明,皆明是深度報告,涉及三種分析。
第一,描述性分析,即過去發(fā)生了什么,為什么會發(fā)生,而現(xiàn)在又在發(fā)生什么,簡言之就是通曉古今。2005年倫敦發(fā)生暴亂后,《衛(wèi)報》對幾百萬條Twitter進行了分析。分析的過程中發(fā)現(xiàn),暴亂和貧窮確有很大的相關性,政府應該解決貧窮的問題;而Twitter雖然在早期傳播了謠言,但后期Twitter可以把更多的信息聚攏過來,讓人們看到真正的真相,這與政府當初的快思考,對貧窮的忽視和對Twitter的偏見大相徑庭。這是描述性分析的一個非常典型的案例。
第二,預測性分析 。 大數(shù)據的核心價值是對于未來的可見性,預測性分析就是能夠預測未來發(fā)生什么,三國時期諸葛亮的巧借東風屬于預測性分析。
預測性分析在當下最常見的應用是谷歌預測票房的分析?!吨┲雮b3》引發(fā)了對同系列的兩部電影的票房分析,也帶出了季節(jié)性的因素分析。透過預測,制片方和影院可以提前一個月對電影的票房做出高準確度的預測,這一個月的價值則可以直接與票房收益掛鉤。
第三,處方性分析。分析方能夠利用大數(shù)據運籌帷幄,希望未來發(fā)生什么,明白為了要讓目標實現(xiàn)現(xiàn)在要做一些什么。同樣是諸葛孔明的計謀,草船借箭就是處方性分析,紙牌屋也是在處方性數(shù)據分析中誕生的。通過受眾分析,制作方發(fā)現(xiàn)美國受眾都喜歡政治性電影,再經過進一步的研究,確定每個人物的角色定位和性格特點,包括國內的互聯(lián)網綜藝節(jié)目《美食美課》都是根據網上搜索的結果設計的一個節(jié)目。
在人工智能領域,經過長期的研究,已經積累了很多研究方法和應用技術。例如,自然語言語義分析、信息提取、知識表現(xiàn)、自動化推理、機器學習等。這些技術目前正在逐步地應用于大數(shù)據技術的前沿領域,結合預測性分析和處方性分析,挖掘大數(shù)據蘊含的規(guī)律和價值,從而為人類決策提供支撐。
例如,Netflix的影片推薦系統(tǒng)、Facebook的社交圖譜、Amazon的購物推薦系統(tǒng)等,已經依靠深度學習和其它人工智能方法,實現(xiàn)了大數(shù)據之上的巨大商業(yè)價值。
Google還對大數(shù)據的機器深度學習和建立知識樹KnowledgeGraph投入巨大的研究資源,期望能夠回答并幫助解決人類日常生活中普遍關心的問題。
辨訛曉意:從真相窺探思想
縱觀全局,雖然隨著整個IT行業(yè)計算能力、存儲能力、通訊能力的發(fā)展,以及人工智能研究的長期積累,人工智能在一些領域里獲得了一定的突破,其研究成果也已經在數(shù)據挖掘、工業(yè)機器人、物流、語音識別、銀行業(yè)軟件、醫(yī)療軟件等方面被廣泛的應用。
但是,目前的人工智能方法都只能處理已預先定義好的問題,實現(xiàn)既定的目標。一旦遇到未定義的情況,人工智能便束手無策。因此,現(xiàn)階段的人工智能技術并不能使機器具有真正的自主學習和研究的能力,更無法奢談?chuàng)碛袆?chuàng)造能力。而使機器獲得學習能力、研究能力和創(chuàng)造能力,恰恰是人工智能技術發(fā)展的目標。
1、辨訛
變訛是大數(shù)據價值變現(xiàn)的第五種方式,也就是看到真相。比如新華網上發(fā)的31省前三季度GDP之和超過全國約1.9萬億,從不同的數(shù)據來源可以發(fā)現(xiàn)這個數(shù)據是對不上的。
美國德克薩斯州的數(shù)據新聞報道說,能夠把這個州的很多政府雇員的工資都做到數(shù)據庫里面供人們查詢。對于普通人來說任何感興趣的人名都可以輸進去,看他的工資和其他行為,看到他們想要了解的真相。
2、曉意
第六是曉意,機器是不能曉意的,只有人能曉意,但是隨著人工智能的發(fā)展,機器能夠逐步窺探到人的思想境界?!赌颉冯娪爸v述美國奧克蘭運動家棒球隊總經理比利·比恩(Billy Beane)的經營哲學,描寫了他如何以小搏大、力抗其它薪資總額比他們多上數(shù)倍的大球隊的方法?!赌颉繁澈蟛粸槿酥囊幻媸?,比利花了更多的錢去請球探分析球員,因為球員的心理抗壓能力、意志力等等是無法用數(shù)據衡量的,所以要花更多的錢。
隨著大數(shù)據的發(fā)展,通過技術可以對人進行情感分析、價值觀分析,甚至在一個題材還沒有開始傳播的時候,可以對它進行“病毒傳播性”的分析,這些應用都使得大數(shù)據達到了曉意的能力。
曉意一方面是文本的曉意,另一方面是通過視聽覺獲得的曉意,機器可以具有情商,亦可以根據短視頻判斷對象處于何種情緒當中。
寒武紀大爆發(fā)的鈣
寒武紀為什么生命形態(tài)會大爆發(fā)呢?經過研究發(fā)現(xiàn)是海里面地殼運動更多的鈣元素進入到生命里面,不能適應鈣元素的就被毒死了,更能適應鈣元素的生物慢慢長出了脊椎,慢慢變成了脊椎動物,而脊椎動物促進了更多的生命的爆發(fā)。現(xiàn)如今,大數(shù)據就承擔了這樣的作用。
1、數(shù)據新聞
建立一個什么樣的數(shù)據的技術站才能使得數(shù)據新聞更好地服務受眾呢?
數(shù)據新聞分類兩類,一類是需要實時處理的,另外一類是需要批量處理。實時處理能夠更好地處理突發(fā)新聞和當下,而批量分析可以更好地融合更系統(tǒng)的數(shù)據做到前后皆明。
在數(shù)據分析和機器學習方面,以下三種技術在吳甘沙看來對于數(shù)據新聞非常重要。一個是Sentiment或者是情感分析,二是Literacy就是數(shù)據分析如何更好地理解內容,三是視聽覺的理解,四是對Audience的洞察。 結合具體的應用,比如Trendspotting可以找到更多的趨勢,Content Creation可以創(chuàng)造更多的內容,Acquisition Retention是維護用戶的黏性,Offer/Ad targeting是如何給用戶Offer更多的廣告和推送。
2、大數(shù)據打通六大產業(yè)
在2013年吳甘沙的演講中,他認為6大產業(yè)是通過大數(shù)據打通的,大數(shù)據為體,西學為用。大數(shù)據是根本,云計算是工具,智慧城市是綱,同時深度融合個性化制造、第三次工業(yè)革命、移動互聯(lián)網以及物聯(lián)網,綜合在一起就形成“ 移大三、智云物” 。
建立具有真正意義的人工智能系統(tǒng),是人類一直以來的夢想。面向大數(shù)據和人工智能的研究近來呈現(xiàn)出螺旋上升式發(fā)展態(tài)勢,但是大數(shù)據的潛能仍然未被全部激發(fā)。例如在智慧城市建設方面,目前建立在以由傳感器及電子攝像頭等設備收集數(shù)據基礎上的第一代智慧城市,其實處于神經系統(tǒng)發(fā)達而智慧能力不足的尷尬境地。隨著各類傳感器數(shù)據的不斷增加,傳統(tǒng)方法不能很好地處理這些海量數(shù)據,使得許多花大價錢購置的硬件設備成為擺設。面對擁堵的城市、霧霾的天氣、已有的海量數(shù)據,城市“智商”的建立迫切需要借助于人工智能技術的發(fā)展成果。
3、未來電影與未來市場
未來如果通過虛擬眼鏡來觀看電影,電影的發(fā)行體系會被極大地變革,門票都不再重要,廣告變成主要的贏利模式。 廣告可以完全無縫地嵌入在電影情節(jié)當中,觀眾完全是沉浸式的體驗。 在這個過程中,觀眾可以和電影的人物和情節(jié)進行互動,就像穿行在情節(jié)當中一樣。從另一個角度看,觀眾會改變情節(jié)的走向,其角色可能是一種偷窺者或者是帶入者,甚至可以把自己變成故事的主人公。
微軟中國研究院正在做一項技術,通過3D攝像頭把人臉的模型建立后可以實時渲染出另外一張臉,電影里面的某個人物可以完全是觀眾自己的臉,在電影中把任何一個觀看者的3D模型建立進去,就能把人物的長相變得和觀眾一模一樣。
未來的商場若也許存在以下現(xiàn)實和虛擬糅合在一起的技術增強:當消費者走在萬達廣場里面,突然發(fā)現(xiàn)眼睛里面出現(xiàn)了一些有趣的東西,它吸引消費者去打怪,指引路線,這個路線事實上是一個眼鏡引導消費者對這個商場進行瀏覽的過程。在瀏覽的過程中,消費者不停地與實際商品產生交互和觸點,這個虛擬空間和實體空間會隨意進行組合。
在未來,任何一個表面都可以是一個屏幕,用戶戴的眼鏡可以把內容投射在任何的表面,無論是弧形還是空氣,都可以把新的信息呈現(xiàn)出來,在運動的過程中每一次相遇都是計算的結果。因為這個計算需要用戶走到特定的位置,在這個位置用戶和某一個商品或某一個人產生相遇,所有的這些會極大地改變我們現(xiàn)在商業(yè)的生態(tài)。
區(qū)塊鏈、虛擬現(xiàn)實、人工智能和機器人也融入口訣中就是 “快蓄人氣移大三智云物”, 這些技術會給我們未來的社會帶來無限創(chuàng)意與玩法。
人工智能的發(fā)展,正如人本身一樣,需要學習大量的知識和經驗,這些知識和經驗需要海量的數(shù)據作為支持。 大數(shù)據技術的發(fā)展,為分析和儲存海量的數(shù)據提供了技術支持,使得機器得到的數(shù)據量和機器擁有的數(shù)據處理能力,與形成人工智能所需要的數(shù)據量和數(shù)據處理能力相匹配的矛盾得到了緩解 。在這種情況下,人工智能的理論、方法和技術的巨大潛力才有可能被真正的逐步釋放出來,實現(xiàn)人工智能的發(fā)展目標,并反過來進一步推動大數(shù)據技術的發(fā)展,形成有效的相互推動。