真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

螞蟻金服數(shù)據(jù)質(zhì)量治理架構(gòu)與實踐-創(chuàng)新互聯(lián)

摘要 :以“數(shù)字金融新原力(The New Force of Digital Finance)”為主題,螞蟻金服ATEC城市峰會于2019年1月4日上海如期舉辦。金融智能專場分論壇上,螞蟻金服數(shù)據(jù)平臺部高級數(shù)據(jù)技術(shù)專家李俊華做了主題為《螞蟻金服數(shù)據(jù)治理之數(shù)據(jù)質(zhì)量治理實踐》的精彩分享。

定制網(wǎng)站可以根據(jù)自己的需求進行定制,成都網(wǎng)站設(shè)計、網(wǎng)站制作、外貿(mào)營銷網(wǎng)站建設(shè)構(gòu)思過程中功能建設(shè)理應(yīng)排到主要部位公司成都網(wǎng)站設(shè)計、網(wǎng)站制作、外貿(mào)營銷網(wǎng)站建設(shè)的運用實際效果公司網(wǎng)站制作網(wǎng)站建立與制做的實際意義

演講中,李俊華介紹了螞蟻金服數(shù)據(jù)架構(gòu)體系的免疫系統(tǒng)——數(shù)據(jù)質(zhì)量治理體系,此外還著重介紹了數(shù)據(jù)質(zhì)量實施的相關(guān)內(nèi)容,以及螞蟻的數(shù)據(jù)質(zhì)量治理實踐與所面對的實際挑戰(zhàn)。
螞蟻金服數(shù)據(jù)質(zhì)量治理架構(gòu)與實踐
李俊華 螞蟻金服數(shù)據(jù)平臺部高級數(shù)據(jù)技術(shù)專家

本文將主要圍繞以下三部分進行分享:

  1. 數(shù)據(jù)治理概況

  2. 數(shù)據(jù)質(zhì)量治理挑戰(zhàn)

  3. 數(shù)據(jù)質(zhì)量治理實踐

一、數(shù)據(jù)治理概況

近年來,螞蟻金服不斷在數(shù)據(jù)架構(gòu)上進行升級改造,其目的在于解決螞蟻所面臨的數(shù)據(jù)物理孤島問題。如今,螞蟻以及整個阿里巴巴集團的底座都統(tǒng)一到了同一個平臺上,這樣當實現(xiàn)第五代數(shù)據(jù)架構(gòu)體系升級時,就降低了一站式研發(fā)的整體門檻,并使得螞蟻金服的所有工程師都可以在平臺上輕松玩轉(zhuǎn)數(shù)據(jù)。如今,在螞蟻的數(shù)據(jù)架構(gòu)中已經(jīng)能夠很好地解決數(shù)據(jù)孤島問題,而如今在數(shù)據(jù)治理體系中所需要關(guān)注的就是邏輯的孤島。
螞蟻金服數(shù)據(jù)質(zhì)量治理架構(gòu)與實踐
在對數(shù)據(jù)治理展開論述之前,先談一談數(shù)據(jù)價值。之前的情況是,當數(shù)據(jù)首先需要經(jīng)過專門團隊負責處理,刪除沒有價值的數(shù)據(jù),負責上線或者下線數(shù)據(jù)。但是,對于數(shù)據(jù)價值的判斷也是一個非常令人頭疼的問題,大部分的數(shù)據(jù)只會上線不會下線,這樣就造成了大量沒有價值的數(shù)據(jù)的堆積。而如今,螞蟻不僅關(guān)心下線沒有價值的數(shù)據(jù),同時也側(cè)重數(shù)據(jù)資產(chǎn)的價值大化。在數(shù)據(jù)價值方面,螞蟻有一套完整的數(shù)據(jù)資產(chǎn)等級以及數(shù)據(jù)資產(chǎn)的易用模型,這樣就能夠驅(qū)動自身充分利用數(shù)據(jù)資產(chǎn),來創(chuàng)造更多的價值。但是如果這些數(shù)據(jù)被使用了,但是質(zhì)量卻很低,這樣就會使得數(shù)據(jù)資產(chǎn)的價值大打折扣。

數(shù)據(jù)質(zhì)量產(chǎn)生分析

接下來將重點介紹螞蟻金服在數(shù)據(jù)治理質(zhì)量領(lǐng)域的實踐思路和方案,并與大家分享兩個案例。如下圖所示的是抽象數(shù)據(jù)抽取的全流程圖。當某個業(yè)務(wù)同學錄入數(shù)據(jù)的時候出現(xiàn)一點錯誤,就會造成數(shù)據(jù)的質(zhì)量問題,比如把客戶的行業(yè)信息填錯或者打錯了一個字都會造成數(shù)據(jù)質(zhì)量問題,而這樣的問題很容易出現(xiàn)。在基于傳統(tǒng)數(shù)據(jù)庫資產(chǎn)開發(fā)數(shù)據(jù)應(yīng)用的時候,基本都是從數(shù)據(jù)源端產(chǎn)數(shù)據(jù)過來,經(jīng)過加工、分析再將數(shù)據(jù)發(fā)送出去,也就是“從業(yè)務(wù)中來,最后回到業(yè)務(wù)中去”?,F(xiàn)在的方案與之前存在很大區(qū)別,以前做數(shù)據(jù)處理時,從數(shù)據(jù)生產(chǎn)的采集數(shù)據(jù)來,加工之后就給出去了,而如今螞蟻很多數(shù)據(jù)應(yīng)用將數(shù)據(jù)處理之后還會回到數(shù)據(jù)系統(tǒng)中。比如芝麻信用分的計算中存在很多大家看不到的場景,這些數(shù)據(jù)處理之后還會回到系統(tǒng)之中,而這個過程中每個環(huán)節(jié)都可能存在數(shù)據(jù)質(zhì)量問題。
螞蟻金服數(shù)據(jù)質(zhì)量治理架構(gòu)與實踐

二、數(shù)據(jù)質(zhì)量治理的挑戰(zhàn)

在下圖中的左側(cè)展示了螞蟻的業(yè)務(wù)形態(tài)。如今,螞蟻的業(yè)務(wù)場景已經(jīng)不再僅限于統(tǒng)計分析,而在螞蟻的芝麻分、花唄、借唄以及“310”放款的背后都是數(shù)據(jù)在進行支撐并驅(qū)動著其發(fā)展。今天,螞蟻的業(yè)務(wù)形態(tài)成為了“技術(shù)+數(shù)據(jù)+算法”三者的融合來追求價值大化。與此同時,數(shù)據(jù)質(zhì)量治理也存在著諸多挑戰(zhàn),它們來自于業(yè)務(wù)方面、數(shù)據(jù)方面、用戶方面。
螞蟻金服數(shù)據(jù)質(zhì)量治理架構(gòu)與實踐

三、數(shù)據(jù)質(zhì)量治理實踐

數(shù)據(jù)質(zhì)量治理思路

從事金融業(yè)務(wù)的同學往往深有感觸,互聯(lián)網(wǎng)金融時代業(yè)務(wù)的生命周期縮短了很多,并且變化也非常頻繁,相比于原本銀行的節(jié)奏顯得非??臁4送?,目前無論是螞蟻金服還是阿里巴巴都在談“數(shù)據(jù)業(yè)務(wù)化、業(yè)務(wù)數(shù)據(jù)化”,數(shù)據(jù)和業(yè)務(wù)一同共同發(fā)展和前進,并且已經(jīng)進入了發(fā)展的深水區(qū)。之前的幾年,螞蟻在業(yè)務(wù)上偏向于“T+1”,而如今,原來的架構(gòu)體系不足以支撐螞蟻未來繼續(xù)發(fā)展以及高時效性的訴求。同時,如今螞蟻的數(shù)據(jù)體量很大,而數(shù)據(jù)業(yè)務(wù)也驅(qū)動螞蟻的整個人才體系的升級。現(xiàn)在,除了本身做數(shù)據(jù)算法研發(fā)的同學之外,其他的技術(shù)同學也都會在平臺上使用數(shù)據(jù),這些同學可能對于數(shù)據(jù)的認知不同,那么在數(shù)據(jù)驅(qū)動下真正保證數(shù)據(jù)質(zhì)量就顯得異常重要。

那么如何實現(xiàn)數(shù)據(jù)質(zhì)量治理呢?首先,需要有一套明確的組織,這是持續(xù)建設(shè)企業(yè)文化的土壤,而數(shù)據(jù)質(zhì)量治理文化的建設(shè)一定是一個確定的、有組織的并且需要長期持續(xù)推進的事情。在組織保障和質(zhì)量文化的基礎(chǔ)之上,螞蟻還側(cè)重了研發(fā)流和數(shù)據(jù)流。在金融領(lǐng)域,研發(fā)流的管控更嚴格,也更嚴謹。而對于如今的互聯(lián)網(wǎng)金融而言,也需要進行強管控,這是因為業(yè)務(wù)形態(tài)決定了研發(fā)周期很短,現(xiàn)在螞蟻在研發(fā)流做了強管控,在一站式數(shù)據(jù)研發(fā)平臺上,使用了分級管控。需求提出之后就會被等級管理,并且進行打標,進而走入不同流程。此外,研發(fā)流上還側(cè)重分級管控,在同一套標準上定義級別,拉平不同的研發(fā)流。對于數(shù)據(jù)流而言,當一個應(yīng)用發(fā)布到生產(chǎn)環(huán)境之后,大部分精力花費在數(shù)據(jù)流中,每天需要從生產(chǎn)環(huán)境將數(shù)據(jù)采集到處理平臺,然后運行算法計算,之后將數(shù)據(jù)返回到生產(chǎn)環(huán)境中,走這樣的閉環(huán)。如今,螞蟻在數(shù)據(jù)流鏈路上做了很多事情,也建設(shè)了很多能力。對于數(shù)據(jù)流而言,如果源頭被污染了,如果不能控制其污染到下游,那么越往下修復(fù)成本就越大。
螞蟻金服數(shù)據(jù)質(zhì)量治理架構(gòu)與實踐
基于以上的數(shù)據(jù)質(zhì)量治理思路,螞蟻金服做了很多有意思的東西,在數(shù)據(jù)平臺運行時會將整個體系監(jiān)控起來,如果出現(xiàn)數(shù)據(jù)質(zhì)量故障,就能夠及時進行修復(fù)。此外,從研發(fā)到生產(chǎn)的各個環(huán)節(jié),螞蟻都做了大量的工作,這是因為基于平臺進行數(shù)據(jù)研發(fā)的同學很多,需要盡量降低使用門檻。對于全數(shù)據(jù)流而言,主要建設(shè)了四大能力,包括感知能力、識別能力、智愈能力和運營能力。平臺需要能夠感知發(fā)布任務(wù)的故障問題以及數(shù)據(jù)質(zhì)量問題,此外,平臺需要能夠識別出潛在風險,因為需要非常及時地了解被破壞的數(shù)據(jù)。當風險被識別出來之后,就需要智愈能力,之所以使用“智”,是因為原本數(shù)據(jù)處理任務(wù)往往是離線的,可能從凌晨開始到早上8點鐘左右屬于數(shù)據(jù)生產(chǎn)高峰,在這段時間里會有人員參與質(zhì)量保障任務(wù)。而智愈能力就希望通過AI算法來配合數(shù)據(jù)處理工作,使得感知能力疊加算法能力,能夠?qū)τ跀?shù)據(jù)感染進行自愈。最后是運營能力,數(shù)據(jù)質(zhì)量不會被展現(xiàn)在前臺,如果數(shù)據(jù)質(zhì)量足夠好,完全可以實現(xiàn)無感知,使用者不用再擔心數(shù)據(jù)能不能用,也不會出現(xiàn)敢不敢用的疑惑,因此數(shù)據(jù)質(zhì)量對于運營而言也非常重要。其實,數(shù)據(jù)質(zhì)量問題既不僅屬于研發(fā)也不僅屬于業(yè)務(wù),而是需要全員參與,共同來解決,這就是數(shù)據(jù)治理的思路。

螞蟻數(shù)據(jù)質(zhì)量治理架構(gòu)

如下圖所示的是螞蟻金服的數(shù)據(jù)質(zhì)量治理架構(gòu)體系。在系統(tǒng)層,按照上述所談到的具體思路,研發(fā)階段主要集中在數(shù)據(jù)測試、發(fā)布管控以及變更管理等方面的建設(shè),這里著重提及變更問題,數(shù)據(jù)的變更不僅僅設(shè)計到系統(tǒng)層的變更管理,也會涉及到在線系統(tǒng)的相互打通。如今,在線數(shù)據(jù)源的變更,也會使得數(shù)據(jù)運營發(fā)生變更,更可能會導(dǎo)致數(shù)據(jù)運營的數(shù)據(jù)質(zhì)量問題。在線研發(fā)部分為數(shù)據(jù)運營系統(tǒng)提供了一些相關(guān)的接口,能夠通知使用者線上的哪些變更會影響到數(shù)據(jù)運營。對于發(fā)布管控能力而言,螞蟻投入了大量精力進行研發(fā)。目前在螞蟻已經(jīng)沒有專職負責數(shù)據(jù)測試的同學,基本上全部都是全棧工程師,所以對于研發(fā)而言可能管控不是非常強,但卻實現(xiàn)了強大的發(fā)布管控能力,將與經(jīng)驗、規(guī)范、性能以及質(zhì)量相關(guān)的檢測全部在這部分執(zhí)行。
螞蟻金服數(shù)據(jù)質(zhì)量治理架構(gòu)與實踐
在生產(chǎn)階段,則主要側(cè)重于質(zhì)量監(jiān)控、應(yīng)急演練以及質(zhì)量治理這三個系統(tǒng)能力。質(zhì)量監(jiān)控告警系統(tǒng)能力在大部分的數(shù)據(jù)系統(tǒng)架構(gòu)中應(yīng)該都有,其功能類似于汽車的剎車功能,因此肯定是存在的。而螞蟻卻做了一件很有意思的事情——數(shù)據(jù)攻防演練,工程師會人為創(chuàng)造故障,然后測試系統(tǒng)能否在短時間內(nèi)發(fā)現(xiàn)故障并進行有效修復(fù),這部分也是目前螞蟻在重點進行建設(shè)的能力。在質(zhì)量治理部分,會根據(jù)不同應(yīng)用的級別,發(fā)布到生產(chǎn)環(huán)境之后進行定期巡檢,分析是否會影響數(shù)據(jù)質(zhì)量??傊?,對于數(shù)據(jù)質(zhì)量架構(gòu)體系的系統(tǒng)層而言,不僅原數(shù)據(jù)非常重要,如今更是結(jié)合機器學習來自動配置一些相關(guān)策略。

數(shù)據(jù)質(zhì)量治理方案

如下圖所示的是螞蟻金服在實踐中的事前、事中、事后的數(shù)據(jù)質(zhì)量質(zhì)量方案。整體而言,事前包括需求、研發(fā)、和預(yù)發(fā)三個階段,而如今螞蟻在事前可以做到的可管控、可仿真、可灰度。在事中,監(jiān)控問題是重點建設(shè)的,出現(xiàn)問題不可怕,但是需要實現(xiàn)自主發(fā)現(xiàn)問題。而為了使得防御能力更強,螞蟻實現(xiàn)了主動的攻擊演練,而正是通過攻防演練,幫助螞蟻發(fā)現(xiàn)了自身很多薄弱的地方。除此之外,還在事中提供了強大的應(yīng)急能力,某些事件將會觸發(fā)應(yīng)急預(yù)案,在這部分,保證數(shù)據(jù)質(zhì)量其實就是把不確定的數(shù)據(jù)風險變成確定的東西。在事后,數(shù)據(jù)質(zhì)量也非常重要,事后需要通過有效的指標和管控手段來進行審計和度量,以此發(fā)現(xiàn)整個鏈路上不完善的地方并持續(xù)完善。
螞蟻金服數(shù)據(jù)質(zhì)量治理架構(gòu)與實踐
數(shù)據(jù)質(zhì)量治理案例

最后為大家分享螞蟻金服在數(shù)據(jù)質(zhì)量治理方面的兩個案例:

案例1:在螞蟻數(shù)據(jù)治理架構(gòu)體系下的發(fā)布環(huán)節(jié),實現(xiàn)了一個發(fā)布強管控的流程。任何腳本在提交時都需要經(jīng)過檢測,然后發(fā)布到線上,并再進行一次檢測。
案例2:數(shù)據(jù)治理涉及到整個鏈路,而針對不同鏈路上的數(shù)據(jù)版本,數(shù)據(jù)采集主要是將數(shù)據(jù)從一端搬運到另一端,不存在加工的過程,此時可以人為注入一些故障,分析數(shù)據(jù)質(zhì)量治理體系能否發(fā)現(xiàn)問題并作出修改,因此這就產(chǎn)生了“攻”與“防”雙方。數(shù)據(jù)加工處理又另外一套體系結(jié)構(gòu),其涉及邏輯的加工,更多地需要考慮注入怎樣的故障,需要面臨什么。如今,在螞蟻真正落地數(shù)據(jù)質(zhì)量治理體系的時候,在攻防演練環(huán)節(jié)投入了大量精力。
點擊 閱讀更多 ,查看更多詳情


新聞名稱:螞蟻金服數(shù)據(jù)質(zhì)量治理架構(gòu)與實踐-創(chuàng)新互聯(lián)
本文鏈接:http://weahome.cn/article/djsjgs.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部