如今,隨著社會不斷發(fā)展,技術不斷進步,國內(nèi)外各大金融機構已經(jīng)在大數(shù)據(jù)、人工智能、區(qū)塊鏈等新技術上有很多嘗試,智能客服、智能投顧等新金融形式也早已不新鮮。那么,這些前沿新科技遇到嚴肅謹慎的金融業(yè),究竟是“黑科技”般的存在,還是技術宅們的另一場狂歡呢?
創(chuàng)新互聯(lián)建站于2013年成立,是專業(yè)互聯(lián)網(wǎng)技術服務公司,擁有項目網(wǎng)站建設、網(wǎng)站設計網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元平輿做網(wǎng)站,已為上家服務,為平輿各地企業(yè)和個人服務,聯(lián)系電話:18980820575以下是氪信聯(lián)合創(chuàng)始人楊玢玢在《當金融遇上黑科技》線下主題沙龍活動的精彩分享:
大家好!我是氪信楊玢玢,負責氪信產(chǎn)品研發(fā)。氪信的全稱是氪信信息技術有限公司(CreditX),最近剛剛完成了B輪融資。團隊的核心人員均來自于雅虎、微軟、攜程、eBay、央行等世界知名公司和機構,在人工智能領域有超過10年的積累。
在氪信創(chuàng)立之初,我們主要思考這樣一個問題:AI應用在金融領域里,如何能夠在商業(yè)上有所突破?李開復老師也針對這個問題說過他的觀點:想要有所突破,需要幾個必要因素,一個是要有數(shù)據(jù),畢竟AI歸根究底還是數(shù)據(jù)的技術;另外要有處理數(shù)據(jù)的能力,其次還要有商業(yè)變現(xiàn)的場景。技術單獨存在不能產(chǎn)生價值,一定要放在一個對技術有需求的場景里面。
我們認為,把AI技術應用于金融領域是一個突破點,而且金融本身是數(shù)據(jù)化非常完善的場景。同時,金融領域還具備以下幾個要素:
第一,市場本身快速發(fā)展。在國內(nèi)目前征信體系不是很完善的情況下,很多有金融需求的人得不到相應的金融服務。氪信通過對數(shù)據(jù)的搜集和加工,為符合要求的用戶提供金融服務。
第二,數(shù)據(jù)端非常成熟。如今,大家花在手機上的時間特別多,互聯(lián)網(wǎng)行為就是一個非常好的數(shù)據(jù)。關鍵在于如何把它和金融、信用相結合,怎么去擬合他們之間的關系。而這種信任評估是氪信比較擅長的。
從我們決定把AI的技術應用于金融風控,至今已有一年半的時間,在這段實踐過程中,我們看到在技術層面、業(yè)務層面和戰(zhàn)略層面都存在很多痛點,概括來說,就是業(yè)務本身對技術提出了需求。比如2016年蓬勃發(fā)展的小額現(xiàn)金貸業(yè)務,本身就是一個欺詐頻發(fā)的行業(yè),且沒有強數(shù)據(jù)做支撐,因此,很多從業(yè)十幾年的金融風控專家在面對新業(yè)務形態(tài)時,顯得有些束手無策。
沒有強數(shù)據(jù)不代表沒有數(shù)據(jù),事實上,企業(yè)還是能夠拿到一些所謂的“弱數(shù)據(jù)”,比如手機上的數(shù)據(jù),設備類的數(shù)據(jù),或者一些消費類的數(shù)據(jù)。拿到數(shù)據(jù)之后去想怎么把這些數(shù)據(jù)用好,最后再決定要不要給這個人授信。至于授信多少,就需要用到AI技術了。
接下來分享一下氪信的做法和取得的成果。簡單來講風控分為兩個部分:一個是反欺詐,一個是授信。
在實踐過程中,我們發(fā)現(xiàn)區(qū)別于傳統(tǒng)征信,互聯(lián)網(wǎng)征信存在幾個核心的點: 第一,在反欺詐的階段,傳統(tǒng)征信很難捕捉到一些不是很明顯的、由于社交關系和其它關系對自己產(chǎn)生的潛在風險,例如一些團貸、群體欺詐的問題。但是這些問題通過挖掘網(wǎng)絡數(shù)據(jù)價值就可以得到很好的解決。
第二,了解AI的人都清楚,我們在做數(shù)據(jù)加工的時候,主要還是做特征和建模。在加工的過程中,除了運用專家的方法之外,深度學習也被驗證效果突出。建模階段相比較傳統(tǒng)的淺層模型,比如說邏輯回歸等等模式,我們采用的是復雜的集成模型方式,因為不同維度的數(shù)據(jù)具有不同的特點,需要使用不同的建模方法,集成學習框架可以支持不同類型模型算法作為子模型,高效、準確的處理稀疏、超高維、非線性數(shù)據(jù)建模。
接下來我會分別講一下我們公司的做法:
第一是底層,我們需要把能夠拿到的數(shù)據(jù)定義為網(wǎng)絡需要的關系,底層做一個數(shù)據(jù)的整合;第二層我們會到一些復雜的網(wǎng)絡構建基礎,里面有一些信息挖掘和算法;再往上我們會有一些模型,從網(wǎng)絡里面拿到隱含的特征,去進行模型的構建;最終來識別比如說一些虛假的申請,或者是一些特殊地域的團貸等。
在網(wǎng)絡的算法里面,我們的主要核心是復雜網(wǎng)絡構建和團挖掘技術兩塊。首先在原始的點和邊構建好以后,我們?nèi)绾瓮ㄟ^合理算法解決實際的問題,通過團的距離計算,達到比較良好的分團的結果。
另外一個是特征,這個也是非常關鍵的。我們?nèi)绾螐木W(wǎng)絡里面提取對一個人的欺詐識別比較有用的信號特征。在這方面,傳統(tǒng)的做法是會有一些個人的風險特征,或者關聯(lián)人,大概多少壞人,這些是我們?nèi)四芟氲降奶卣鳌?
另外在我們的實踐應用過程中,我們發(fā)現(xiàn)在突破單個風險點來臨的時候,整個網(wǎng)絡會出現(xiàn)一些局部風險,并形成連接,比如說形成一些三角或者四角的關系等。從長遠的時間上看,這樣的關系可能未必不正常,但是一定時間內(nèi),你的申請人形成了非常緊密的聯(lián)系,這件事情是值得注意的。
除了個人局部的風險特征以外,還有全局的。我們用到了一些優(yōu)化后的算法,每一個人在整個網(wǎng)絡中,都會出現(xiàn)一些高的風險點,對和他有社交關系的人也會存在輻射效應。對于個人來說,可能在一度二度三度關系上,會和一個或是幾個壞人有一些聯(lián)系,現(xiàn)在社交比較發(fā)達,如果出現(xiàn)大片這樣子的人,可以通過輻射算法捕捉到這樣的信號。
另外在網(wǎng)絡這塊,很重要的一點就是整個系統(tǒng)的回轉和流程優(yōu)化。因為網(wǎng)絡欺詐有一個特性,對于實時性甄別以及實時修改性上限要求特別高,同時我們學習的目標,不是一個純事實,很多都是學習專家認定為欺詐的經(jīng)驗,這樣的結果對本身的優(yōu)化是很有價值的,從整個產(chǎn)品來看,形成了數(shù)據(jù)加工、數(shù)據(jù)計算和反饋的閉環(huán)。
我們也有專家的界面,網(wǎng)絡捕捉風險之后,我們的專家都可以看到。
下面分享一下我們氪信在特征加工上的實踐??赡芰私釧I的人特別清楚,我們最后做模型結果的時候,如果是優(yōu)秀的話,這個優(yōu)秀的絕大部分來自于我們非常辛苦的加工過程。
我們會看到個人的加工方法,很多時候會有一些不局限性,比如說文本的特征,通過一些方法或者通過不同時間維度的方法,可以描繪出幾百個維度的特征,但是不可能達到完備的狀態(tài),我們確實需要借助技術本身的能力達到提升。
氪信在小額信用貸的場景里面,嘗試用深度學習像循環(huán)神經(jīng)網(wǎng)絡處理時序的數(shù)據(jù)一樣處理文本,效果還是非常不錯的,我們整個的特征過程是包含了
專家的部分以及深度學習自動生成的特征共同傳遞給模型,并且進行了最終的預測和識別。 這邊舉一個具體的例子,剛才我提到時序的特征。比如我在不同的時間窗口,是不是要窮盡所有的特征?有可能我們花費了大量的時間,只可以覆蓋80%的部分,但是我們用循環(huán)神經(jīng)網(wǎng)絡利用長短時記憶的特征,可以捕捉數(shù)據(jù)在不同窗口趨勢類、統(tǒng)計類等不同的特征,從而衍生出來上萬種特征,最后我們把這些交給模型,讓它來識別哪些是有效的。
建模部分。我們曾做過很多相關的實踐,像淺層的偏現(xiàn)金的模式,有它的優(yōu)勢,比較穩(wěn)定,人也好理解。也嘗試過中間階段端到端的深度學習的方法,通過反神經(jīng)網(wǎng)絡的方法捕捉之間的關聯(lián)。
最后通過實踐結果,我們認為集成模型在金融風控場景里,是一個判斷好壞既穩(wěn)定又有效的手段。集成模型的思想是用不同的子分類器,處理不同的數(shù)據(jù)。我會選擇最好的分類器處理面臨的數(shù)據(jù),在上面去做一個集成,優(yōu)勢就出來了,就是好而不同,說的直白一點就是三個臭皮匠頂個諸葛亮。從模型性能來看,集成方法無論是擬合能力、模型的預測能力,以及換一個場景它的穩(wěn)定能力都是非常好的。同時,集成模型在各個場景里也可以實現(xiàn)遷移?,F(xiàn)在在氪信的產(chǎn)品體系里面,也融合了這個方法。
在信用貸場景里面,我們和傳統(tǒng)模型相比性能提升了1倍,穩(wěn)定在KS值0.3以上,壞賬率直接下降46%。這使得我們很興奮,是技術給業(yè)務直接帶來了效果。
氪信要做的就是把AI技術加到金融風控里面,而這個領域里面還是有很多事情可以做的。我們在實踐的過程中,同時把方法形成一套產(chǎn)品體系,幫助金融機構解決問題。我們氪信有相應的云數(shù)據(jù)的服務,有機器學習建模平臺,有在線風控引擎,可以幫助完成企業(yè)互聯(lián)網(wǎng)+的升級。 數(shù)據(jù)核心是我們沉淀的這條金融圖譜的知識體系,從原始的需要用什么數(shù)據(jù),到加工挖掘數(shù)據(jù),再到上層怎么連接管理它,形成精準完備的畫像。
另外在系統(tǒng)的整個過程和AI的運營中,從設備接入到數(shù)據(jù)的加工處理,到得出結果等等,整個都是自動化的過程?,F(xiàn)在現(xiàn)金貸的量非常大,解放人力已經(jīng)成為重要需求,因此我們確確實實需要這樣一套數(shù)據(jù)智能一體化的產(chǎn)品。