當(dāng)下,海量數(shù)據(jù)結(jié)合前沿技術(shù)架構(gòu)正在為保險(xiǎn)業(yè)帶來(lái)根本性的變革。本文以某知名保險(xiǎn)機(jī)構(gòu)為例,結(jié)合偶數(shù)行業(yè)實(shí)踐經(jīng)驗(yàn),介紹保險(xiǎn)企業(yè)如何利用湖倉(cāng)一體技術(shù)推動(dòng)數(shù)據(jù)戰(zhàn)略轉(zhuǎn)型升級(jí)。
華龍網(wǎng)站建設(shè)公司成都創(chuàng)新互聯(lián)公司,華龍網(wǎng)站設(shè)計(jì)制作,有大型網(wǎng)站制作公司豐富經(jīng)驗(yàn)。已為華龍上1000家提供企業(yè)網(wǎng)站建設(shè)服務(wù)。企業(yè)網(wǎng)站搭建\成都外貿(mào)網(wǎng)站制作要多少錢(qián),請(qǐng)找那個(gè)售后服務(wù)好的華龍做網(wǎng)站的公司定做!背景介紹
在對(duì)該客戶需求進(jìn)行深度挖掘并橫向比較行業(yè)現(xiàn)狀后,我們發(fā)現(xiàn):(1) 包括該客戶在內(nèi)的多數(shù)保險(xiǎn)企業(yè)的數(shù)據(jù)分析場(chǎng)景較為單一,直接產(chǎn)生業(yè)務(wù)價(jià)值的數(shù)據(jù)挖掘不夠豐富;(2) 該客戶現(xiàn)有數(shù)據(jù)分析場(chǎng)景的效率、性能、用戶體驗(yàn)都亟待提升。下文我們?cè)敿?xì)展開(kāi)分析。
業(yè)務(wù)場(chǎng)景分析客戶現(xiàn)有的數(shù)據(jù)分析應(yīng)用集中在經(jīng)營(yíng)分析、監(jiān)管報(bào)送和風(fēng)險(xiǎn)管控等幾個(gè)傳統(tǒng)場(chǎng)景,其實(shí)不止該客戶,目前大多數(shù)保險(xiǎn)企業(yè)的大數(shù)據(jù)業(yè)務(wù)應(yīng)用價(jià)值挖掘都還不夠豐富。
1.風(fēng)險(xiǎn)管控僅以目前多數(shù)保險(xiǎn)企業(yè)都非常關(guān)注的風(fēng)控環(huán)節(jié)為例,該客戶仍以風(fēng)險(xiǎn)部門(mén)固定報(bào)表分析為主,而通過(guò)風(fēng)險(xiǎn)數(shù)據(jù)建模,應(yīng)用在投保前風(fēng)險(xiǎn)排查、承保中風(fēng)險(xiǎn)管控及理賠時(shí)風(fēng)險(xiǎn)識(shí)別和反欺詐等全業(yè)務(wù)鏈條還非常有限。
在投保環(huán)節(jié),可以利用數(shù)據(jù)搭建風(fēng)險(xiǎn)評(píng)估模型,篩查高風(fēng)險(xiǎn)客戶,對(duì)大概率產(chǎn)生負(fù)價(jià)值的客戶采用拒?;蛘咛岣弑YM(fèi)的方式以減少損失。以互聯(lián)網(wǎng)場(chǎng)景下的意外險(xiǎn)和健康險(xiǎn)為例,由于投保手續(xù)較為簡(jiǎn)單,很多產(chǎn)品免體檢,只需要填寫(xiě)投保人基本信息即可,這些業(yè)務(wù)中,很容易出現(xiàn)投保人隱瞞病情、造假家庭收入的情況,逆向選擇甚至欺詐的可能性非常大。因此在投保場(chǎng)景下可以利用數(shù)據(jù)進(jìn)行多維分析,及時(shí)發(fā)現(xiàn)高風(fēng)險(xiǎn)投??蛻?,避免欺詐行為的發(fā)生。
在承保運(yùn)營(yíng)環(huán)節(jié),相比較傳統(tǒng)風(fēng)控,大數(shù)據(jù)風(fēng)控讓保險(xiǎn)機(jī)構(gòu)對(duì)保險(xiǎn)用戶的動(dòng)態(tài)跟蹤反饋,定期對(duì)承保中用戶信息進(jìn)行維護(hù),更新用戶風(fēng)險(xiǎn)指數(shù)。此外,在加強(qiáng)用戶信息安全管理和隱私方面,保險(xiǎn)公司借助大數(shù)據(jù)和人工智能(如設(shè)備指紋、IP 畫(huà)像、機(jī)器行為識(shí)別等工具)加以防范,在回訪環(huán)節(jié),根據(jù)用戶情況及其手機(jī)在網(wǎng)狀態(tài)選擇撥打方式及話術(shù),更有利于提高回訪效率,提升客戶體驗(yàn)。
在理賠環(huán)節(jié),大數(shù)據(jù)風(fēng)控先通過(guò)構(gòu)建模型的方式篩查出疑似欺詐的高風(fēng)險(xiǎn)案件,然后再人工重點(diǎn)審核和調(diào)查,減少現(xiàn)場(chǎng)查勘誤差,提高查勘效率。
除了風(fēng)險(xiǎn)管控,通過(guò)數(shù)據(jù)賦能業(yè)務(wù)還可以落地在其他幾個(gè)重點(diǎn)保險(xiǎn)場(chǎng)景中,包括產(chǎn)品創(chuàng)新、風(fēng)險(xiǎn)定價(jià)、精準(zhǔn)獲客。接下來(lái)我們展開(kāi)說(shuō)明下數(shù)據(jù)賦能這些場(chǎng)景的形式和實(shí)現(xiàn)邏輯。
?
?
2.產(chǎn)品創(chuàng)新除了傳統(tǒng)的保單和用戶信息等結(jié)構(gòu)化數(shù)據(jù),很多互聯(lián)網(wǎng)大廠和保險(xiǎn)應(yīng)用軟件都積累了大量用戶行為等非結(jié)構(gòu)化數(shù)據(jù),通過(guò)大數(shù)據(jù)可以對(duì)保險(xiǎn)市場(chǎng)需求的洞察更為敏銳,從而研發(fā)出低成本、場(chǎng)景化的細(xì)分保險(xiǎn)產(chǎn)品,用戶也可以在合適的時(shí)間、地點(diǎn)和場(chǎng)景選擇保障范圍和比例。
如基于女性用戶退換貨頻繁推出的運(yùn)費(fèi)險(xiǎn),男性用戶出差頻繁進(jìn)而推出航班延誤險(xiǎn)和酒店取消險(xiǎn),手機(jī)用戶增長(zhǎng)進(jìn)而推出碎屏險(xiǎn)等等。
?
?
3.風(fēng)險(xiǎn)定價(jià)險(xiǎn)企對(duì)客戶進(jìn)行精準(zhǔn)定價(jià)的前提是基于大量同質(zhì)風(fēng)險(xiǎn)標(biāo)的,通過(guò)對(duì)不同風(fēng)險(xiǎn)標(biāo)的進(jìn)行數(shù)據(jù)挖掘和分析,從而對(duì)不同特征的客戶進(jìn)行不同的定價(jià)。以車(chē)險(xiǎn)為例,通過(guò)智能設(shè)備采集用戶駕駛習(xí)慣,如活動(dòng)區(qū)域、行駛里程、駕駛頻率和時(shí)段、加速和剎車(chē)強(qiáng)度等習(xí)慣豐富車(chē)險(xiǎn)定價(jià)因子,進(jìn)而降低整個(gè)業(yè)務(wù)線的成本。
4.精準(zhǔn)獲客精準(zhǔn)獲客就是根據(jù)保險(xiǎn)用戶偏好,在合適的時(shí)間推薦合適的保險(xiǎn)產(chǎn)品給用戶。保險(xiǎn)公司在開(kāi)展定向營(yíng)銷(xiāo)時(shí),也更加注重場(chǎng)景內(nèi)潛在用戶挖掘,比如某些場(chǎng)景更容易激發(fā)用戶的風(fēng)險(xiǎn)憂患意識(shí),從而促進(jìn)投保轉(zhuǎn)化。此外,保險(xiǎn)代理公司和代理人可以訪問(wèn)保險(xiǎn)用戶信息和行為偏好,通過(guò)大數(shù)據(jù)標(biāo)簽和智能引導(dǎo),幫助代理人更好的抓住客戶需求和用戶體驗(yàn),形成轉(zhuǎn)化和復(fù)購(gòu)。精準(zhǔn)獲客模式不僅降低了營(yíng)銷(xiāo)成本,還提升了營(yíng)銷(xiāo)效率。
效率和體驗(yàn)分析1.效率該客戶現(xiàn)有技術(shù)架構(gòu)對(duì)資源依賴(lài)較高,一般分析看板 5-10 張圖表的查詢請(qǐng)求很可能導(dǎo)致內(nèi)存需求動(dòng)輒數(shù)百 GB,甚至有時(shí)會(huì)到達(dá) TB 級(jí)別,響應(yīng)時(shí)間進(jìn)而退化至數(shù)秒,嚴(yán)重影響了分析師和數(shù)據(jù)科學(xué)家的分析效率。同時(shí),受現(xiàn)有架構(gòu)制約,該客戶難以形成實(shí)時(shí)經(jīng)營(yíng)決策和實(shí)時(shí)業(yè)務(wù)應(yīng)用,也進(jìn)一步影響了決策效率。
2.體驗(yàn)除了資源開(kāi)銷(xiāo)大間接導(dǎo)致的交互體驗(yàn)下降,用戶的數(shù)據(jù)分析通常要通過(guò) IT 實(shí)現(xiàn),對(duì) IT 的依賴(lài)很大,因此很多靈活的應(yīng)用分析都難以進(jìn)行。以經(jīng)營(yíng)分析為例,該客戶目前的經(jīng)營(yíng)分析主要以面向管理決策者的固定報(bào)表為主,對(duì)業(yè)務(wù)用戶因隨機(jī)需求產(chǎn)生的靈活報(bào)表支持有限,分析和決策靈活度較低。此外,缺少基于現(xiàn)有架構(gòu)的原生分析工具和平臺(tái),導(dǎo)致整個(gè)數(shù)據(jù)分析和應(yīng)用的體驗(yàn)較差。
技術(shù)架構(gòu)分析該保險(xiǎn)公司很早就使用了 Db2,為提升 Db2 性能,該公司在 2013 年引入?TD?一體機(jī),并重新搭建數(shù)據(jù)倉(cāng)庫(kù)平臺(tái),集市建立在 Db2 之上。
隨著數(shù)據(jù)體量越來(lái)越大,基于 Teradata 和 Db2 的傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)越來(lái)越難以支撐業(yè)務(wù)發(fā)展,?從 2015 年起開(kāi)始搭建 Hadoop 大數(shù)據(jù)平臺(tái),最初包含 6 個(gè)節(jié)點(diǎn)的集群。經(jīng)過(guò)初期的探索后,將 Db2 的一些數(shù)據(jù)逐步遷移到 Hadoop 平臺(tái),同時(shí)把 ClickHouse 作為集市 SQL 查詢引擎。
?
?
隨著該客戶 Hadoop 應(yīng)用范圍越來(lái)越廣,集群規(guī)模也逐步擴(kuò)大,但也暴露出現(xiàn)有平臺(tái)架構(gòu)的一些問(wèn)題。
基于 TD 一體機(jī) + Db2 的傳統(tǒng)數(shù)倉(cāng),數(shù)據(jù)應(yīng)用主要是多維分析和固定報(bào)表,存在的的主要問(wèn)題包括:
查詢響應(yīng)慢:80% 的查詢響應(yīng)在分鐘級(jí)別;
并發(fā)性能差:隨著數(shù)據(jù)量和用戶數(shù)的增長(zhǎng),共享存儲(chǔ)模式愈發(fā)難以支撐高并發(fā);
時(shí)效性低:一方面由于 Db2 的計(jì)算能力和擴(kuò)展性受限,另一方面是由于過(guò)多過(guò)大的 Cognos Power Cube 更新較慢,用戶體驗(yàn)不佳;
維護(hù)困難:報(bào)表體量約 1000 張,報(bào)表維護(hù)的工作量巨大。
ClickHouse+Hadoop 大數(shù)據(jù)平臺(tái)的問(wèn)題主要有:
資源開(kāi)銷(xiāo)大:一般分析看板 5-10 張圖表的查詢請(qǐng)求同時(shí)發(fā)給 ClickHouse,由于 ClickHouse 對(duì)內(nèi)存和 CPU 資源的需求較大(內(nèi)存需求動(dòng)輒數(shù)百 GB 乃至數(shù) TB),其查詢性能下降很快,平時(shí)不足 2s 的查詢速度會(huì)退化至 8s 以上,響應(yīng)時(shí)間影響交互分析體驗(yàn);
多表關(guān)聯(lián)查詢性能弱:ClickHouse 涉及 Join 的查詢往往都需要 10s 以上,數(shù)據(jù)量?的查詢甚?甚至更久;
時(shí)效性低:ClickHouse 并不?持?jǐn)?shù)據(jù)的刪除,因此不得不通過(guò)額外字段來(lái)標(biāo)記當(dāng)前數(shù)據(jù)是否已經(jīng)被刪除,進(jìn)一步拖慢查詢的性能,因此也難以支持實(shí)時(shí)場(chǎng)景;
開(kāi)發(fā)成本高:ClickHouse 只能對(duì)同一分?上同一分區(qū)的數(shù)據(jù)去重,所以在設(shè)計(jì)表分區(qū)或者寫(xiě)?數(shù)據(jù)時(shí),都需要更多精力進(jìn)行處理,增加了開(kāi)發(fā)成本;
穩(wěn)定性弱:ClickHouse 最常見(jiàn)的是使用時(shí)前端應(yīng)用突然報(bào)出查詢錯(cuò)誤;
維護(hù)困難:目前已開(kāi)發(fā)了數(shù)百?gòu)垖挶恚ê骷?xì)和匯總寬表)用以滿足業(yè)務(wù)需求,每日更新、維護(hù)和迭代的工作量巨大。
湖倉(cāng)一體實(shí)現(xiàn)方案
圍繞客戶痛點(diǎn),偶數(shù)科技通過(guò)創(chuàng)新技術(shù)架構(gòu)對(duì)該保險(xiǎn)公司技術(shù)架構(gòu)進(jìn)行升級(jí)改造,依托實(shí)時(shí)湖倉(cāng)一體架構(gòu)形成數(shù)據(jù)創(chuàng)新和數(shù)據(jù)賦能。
?
?
通過(guò) WASP 工具,同時(shí)滿足批量和實(shí)時(shí)數(shù)據(jù)同步,實(shí)現(xiàn)批流一體,支持處理實(shí)時(shí)變化數(shù)據(jù),讓數(shù)據(jù)平臺(tái)接入更多源異構(gòu)數(shù)據(jù),整合該保險(xiǎn)公司的數(shù)據(jù)資產(chǎn),如行為埋點(diǎn)和用戶消息事件。
存儲(chǔ)集群既可以使用偶數(shù)專(zhuān)有存儲(chǔ)引擎 Magma、HDFS,也可以使用對(duì)象存儲(chǔ) S3,給客戶更多的存儲(chǔ)選擇。
OushuDB 作為計(jì)算引擎,創(chuàng)新引入了快照視圖 (Snapshot View) 的概念,通過(guò)匯集實(shí)時(shí)變化數(shù)據(jù)和批處理數(shù)據(jù),形成 T+0 實(shí)時(shí)快照,始終隨著業(yè)務(wù)源庫(kù)的變化而實(shí)時(shí)變化。以保險(xiǎn)用戶的權(quán)益視圖為例,通過(guò)多源庫(kù)匯集后的跨庫(kù)查詢得到動(dòng)態(tài)查詢結(jié)果。因此在報(bào)表分析的應(yīng)用方面,不僅支持管理決策者關(guān)注的固定經(jīng)營(yíng)報(bào)表,還支持分析師和業(yè)務(wù)人員的實(shí)時(shí)靈活報(bào)表分析。因此,該保險(xiǎn)公司也就不再需要通過(guò) MPP+Hadoop 組合來(lái)處理離線跑批及分析查詢。
偶數(shù)為客戶提供這樣的一套云原生實(shí)時(shí)湖倉(cāng)架構(gòu),不再依托原 ClickHouse、TD 一體機(jī),還能幫助用戶避免引入 MySQL、HBase 等組件,極大簡(jiǎn)化了數(shù)據(jù)架構(gòu),共享一份數(shù)據(jù),實(shí)現(xiàn)了數(shù)據(jù)湖、數(shù)倉(cāng)、集市全方位一體化,并實(shí)現(xiàn)了全實(shí)時(shí)數(shù)據(jù)分析能力,該架構(gòu)是由偶數(shù)在 2021 年初提出的 Omega 架構(gòu)。
全面改善提升
性能改善,提升用戶體驗(yàn)在實(shí)施偶數(shù)湖倉(cāng)一體架構(gòu)之前,基于現(xiàn)有的集群規(guī)模,用戶操作的響應(yīng)時(shí)間在分鐘級(jí),現(xiàn)通過(guò) OushuDB 查詢響應(yīng)時(shí)間均控制在秒級(jí)。OushuDB 相比 ClickHouse 在查詢性能方面大幅改善?;趪?guó)際基準(zhǔn)測(cè)試 TPC-H 的實(shí)驗(yàn)表明,OushuDB 多節(jié)點(diǎn)性能是 ClickHouse 的 2 倍以上,單節(jié)點(diǎn)性能是 ClickHouse 的 5 倍以上,部分 Query 可達(dá) 20 倍。
?詳細(xì)的比較過(guò)程和結(jié)果可以看往期這篇文章:
受美制裁,俄羅斯 ClickHouse 能否扛起數(shù)據(jù)庫(kù)大旗?
自助分析,賦能業(yè)務(wù)場(chǎng)景之前業(yè)務(wù)部門(mén)有任何數(shù)據(jù)分析都需求必須通過(guò) IT 實(shí)現(xiàn),對(duì) IT 的依賴(lài)很大。偶數(shù)湖倉(cāng)一體架構(gòu)原生支持 Kepler 數(shù)據(jù)分析和應(yīng)用平臺(tái),Kepler 降低業(yè)務(wù)人員對(duì) IT 的依賴(lài),真正支持業(yè)務(wù)自助分析,實(shí)現(xiàn)了使用大數(shù)據(jù)指導(dǎo)業(yè)務(wù)部門(mén)提高產(chǎn)能、賦能業(yè)務(wù)。
通過(guò) Kepler,客戶在經(jīng)營(yíng)分析、數(shù)據(jù)分析、數(shù)據(jù)挖掘等眾多方面都進(jìn)行了探索。在涉及保險(xiǎn)代理人營(yíng)銷(xiāo)獲客的單一場(chǎng)景、單一需求中,就加工了近百億條數(shù)據(jù)的寬表,創(chuàng)建了 50 多個(gè)維度(如產(chǎn)品、機(jī)構(gòu)、渠道、保代年齡、性別、學(xué)歷和過(guò)往業(yè)績(jī)等)和 40 多個(gè)指標(biāo)。
通過(guò)分析挖掘指對(duì)業(yè)務(wù)員做分群以確定高產(chǎn)能保險(xiǎn)代理人的共性特征(如學(xué)歷、性別、入職時(shí)間等等),對(duì)保險(xiǎn)代理人跟進(jìn)的商機(jī)和續(xù)保線索進(jìn)行智能推薦和標(biāo)簽提示,實(shí)現(xiàn)了更精準(zhǔn)的預(yù)估保代業(yè)務(wù)產(chǎn)能,最終讓營(yíng)銷(xiāo)人員和該保險(xiǎn)公司同時(shí)獲得更好發(fā)展。
此外,偶數(shù)湖倉(cāng)一體平臺(tái)還兼容主流第三方 BI 工具,保障用戶高效經(jīng)營(yíng)分析的同時(shí),提供更多工具選擇。
全實(shí)時(shí)分析,快速挖掘業(yè)務(wù)價(jià)值由于引入偶數(shù) Omega 架構(gòu),實(shí)時(shí)分析決策得到了質(zhì)的提升。除了高效拆分歷史和當(dāng)前數(shù)據(jù)進(jìn)行經(jīng)營(yíng)分析,在不同場(chǎng)景都逐步引入實(shí)時(shí)能力。
運(yùn)營(yíng)層面:建立和完善了實(shí)時(shí)業(yè)務(wù)變化,實(shí)時(shí)營(yíng)銷(xiāo)效果,當(dāng)日分時(shí)業(yè)務(wù)趨勢(shì)分析等;
用戶層面:保險(xiǎn)用戶、保險(xiǎn)代理人的推薦排序,根據(jù)實(shí)時(shí)行為等特征變量的生產(chǎn),為用戶推薦更精準(zhǔn)的保險(xiǎn)產(chǎn)品和定價(jià);
風(fēng)控層面:投保實(shí)時(shí)風(fēng)險(xiǎn)識(shí)別、反欺詐、異常理賠預(yù)警等應(yīng)用場(chǎng)景。
依托偶數(shù)湖倉(cāng)一體對(duì)高并發(fā)的支持,大量用戶可以同時(shí)使用復(fù)雜查詢對(duì)同一份數(shù)據(jù)進(jìn)行分析查詢,滿足更多用戶對(duì)更細(xì)粒度的分析需求。OushuDB 虛擬計(jì)算集群可以對(duì)湖倉(cāng)一體平臺(tái)實(shí)現(xiàn)資源合理利用、資源動(dòng)態(tài)配置和資源隔離,相比原 ClickHouse 對(duì)資源的占用情況,OushuDB 對(duì)資源占用非常低,這樣有效的保障了大量用戶同時(shí)在線查詢,避免高并發(fā)復(fù)雜查詢導(dǎo)致的系統(tǒng)崩潰。
從 2021 年,偶數(shù)科技開(kāi)始接觸該客戶,到 POC 及正式合作,偶數(shù)憑借前沿技術(shù)、專(zhuān)業(yè)的方案設(shè)計(jì)和交付能力,一直陪伴客戶成長(zhǎng)和發(fā)展。無(wú)論是初識(shí)還是陪伴,偶數(shù)秉承著初心,持續(xù)專(zhuān)注云數(shù)據(jù)平臺(tái)和解決方案,服務(wù)更多客戶。
立即注冊(cè),開(kāi)啟數(shù)字化轉(zhuǎn)型
你是否還在尋找穩(wěn)定的海外服務(wù)器提供商?創(chuàng)新互聯(lián)www.cdcxhl.cn海外機(jī)房具備T級(jí)流量清洗系統(tǒng)配攻擊溯源,準(zhǔn)確流量調(diào)度確保服務(wù)器高可用性,企業(yè)級(jí)服務(wù)器適合批量采購(gòu),新人活動(dòng)首月15元起,快前往官網(wǎng)查看詳情吧