2017-01-22 史蒂夫·喬布斯的“一塊玻璃”手機(jī)改變了世界,把人類帶到了便利的移動(dòng)互聯(lián)網(wǎng)時(shí)代,并且結(jié)合金融, 形成了互聯(lián)網(wǎng) 金融的普惠金融模式。 任何人只要會(huì)使用智能手機(jī),在京滬這樣的城市已經(jīng)可以不帶錢包出行了。 可以說普羅大眾都已經(jīng)能體會(huì)到互聯(lián)網(wǎng)金融時(shí)代的便利。 而阿爾法狗(AlphaGo)的成功,讓吃瓜群眾發(fā)現(xiàn) AI 已非昔年靠窮舉法贏棋的“深藍(lán)”(IBM開發(fā)的國(guó)際象棋機(jī)器人),而是有了自主推理學(xué)習(xí)能力,進(jìn)而大家擔(dān)心人類是不是有朝一日會(huì)被人工智能機(jī)器人“顛覆”掉?人工智能已經(jīng)在無人駕駛、圖像處理、語音識(shí)別方面取得了突破性的應(yīng)用,那金融領(lǐng)域呢? 李開復(fù)老師曾談及人工智能應(yīng)用的三個(gè)要素:數(shù)據(jù)、處理數(shù)據(jù)的能力和商業(yè)變現(xiàn)的場(chǎng)景。人工智能解決金融界問題的過程, 很好的對(duì)應(yīng)了這三個(gè)要素。也許, 金融領(lǐng)域是人工智能最合適不過的顛覆場(chǎng)景了。 在金融業(yè)務(wù)的前端,已經(jīng)有不少傳統(tǒng)銀行將人工智能用于為客戶定制服務(wù),開發(fā)理財(cái)產(chǎn)品的應(yīng)用。例如巴克萊銀行和花旗銀行等。 國(guó)內(nèi)銀行中走在科技前列的招商銀行,也開始試用全新的人工智能業(yè)務(wù)模式。未來人工智能和機(jī)器學(xué)習(xí)技術(shù)在金融業(yè)前端會(huì)有更多的便捷精準(zhǔn)服務(wù)提供給客戶。 那么金融應(yīng)用領(lǐng)域的后端呢? 信息安全、投資風(fēng)控、資產(chǎn)管理等方面的問題成了新問題,對(duì)于躲在觸屏手機(jī)背后的客戶,缺失了央行數(shù)據(jù)的客戶,銀行沒有辦法通過一雙雙眼睛去看到用戶是謙謙君子還是騙子流氓。這個(gè)時(shí)候, 金融后端,傳統(tǒng)金融風(fēng)控手段覆蓋不到和難以觸及的, 那么“互聯(lián)網(wǎng) 金融”業(yè)務(wù)就要結(jié)合更廣泛的互聯(lián)網(wǎng)數(shù)據(jù)和人工智能手段, 來處理更廣泛的金融客戶問題。 從這個(gè)角度考慮,新金融時(shí)代,人工智能和機(jī)器學(xué)習(xí),是真的要“顛覆”傳統(tǒng)金融風(fēng)控了嗎? 在引入人工智能處理互聯(lián)網(wǎng)行業(yè)幾十萬維數(shù)據(jù)的處理手段,“降維”處理金融業(yè)界萬維、千維數(shù)據(jù)的時(shí)候,是會(huì)形成有效的降維攻擊嗎? 注:本文援引CreditX在招行卡中心培訓(xùn)干貨內(nèi)容為例, 來解析人工智能和機(jī)器學(xué)習(xí)將會(huì)如何登上金融風(fēng)控的主要舞臺(tái)。 在談及機(jī)器學(xué)習(xí)在金融場(chǎng)景中的實(shí)際應(yīng)用之前,首先我們對(duì)金融風(fēng)控的一個(gè)標(biāo)準(zhǔn)業(yè)務(wù)流程進(jìn)行梳理,通常一個(gè)風(fēng)控業(yè)務(wù)包括前端頁面用戶資料申請(qǐng)?zhí)峤缓褪占?,反欺詐、合規(guī)、邏輯校驗(yàn),核心決策授信包括申請(qǐng)?jiān)u分和電調(diào),以及最后的催收。 面對(duì)這套業(yè)務(wù)流程, 新金融風(fēng)控領(lǐng)域面對(duì)的數(shù)據(jù)痛點(diǎn),一般有幾大類:
業(yè)務(wù)流程上,機(jī)器學(xué)習(xí)已經(jīng)在每個(gè)風(fēng)控節(jié)點(diǎn)發(fā)揮作用。比如反欺詐環(huán)節(jié),在泛互聯(lián)網(wǎng)的環(huán)境里, 金融風(fēng)控面臨的傳統(tǒng)個(gè)體欺詐已迅速演變?yōu)橛薪M織、有規(guī)模的群體欺詐和關(guān)聯(lián)風(fēng)險(xiǎn)。而傳統(tǒng)反欺詐還停留在識(shí)別一度風(fēng)險(xiǎn)等這種簡(jiǎn)單規(guī)則方式,如聯(lián)系人中借貸人個(gè)數(shù)等,對(duì)于二度、三度乃至更廣范圍的網(wǎng)絡(luò)全局風(fēng)險(xiǎn)苦無良策。 機(jī)器學(xué)習(xí)里面基于圖的半監(jiān)督算法很好地解決了這一訴求,基于申請(qǐng)人、手機(jī)號(hào)、設(shè)備、IP地址等各類信息節(jié)點(diǎn)構(gòu)建龐大網(wǎng)絡(luò)圖,并可在此之上進(jìn)行基于規(guī)則和機(jī)器學(xué)習(xí)的反欺詐模型實(shí)時(shí)識(shí)別。
在申請(qǐng)?jiān)u分環(huán)節(jié),傳統(tǒng)金融風(fēng)控往往是基于評(píng)分卡體系對(duì)強(qiáng)征信數(shù)據(jù)如銀行借貸記錄等進(jìn)行建模,而新金融的業(yè)務(wù)下,客群的進(jìn)一步“下沉”,覆蓋更多收入群體,新增群體的強(qiáng)征信數(shù)據(jù)往往大量缺失,金融機(jī)構(gòu)不得不使用更多弱金融數(shù)據(jù), 辟如消費(fèi)數(shù)據(jù)、運(yùn)營(yíng)商數(shù)據(jù)、互聯(lián)網(wǎng)行為數(shù)據(jù)等。 這類底層數(shù)據(jù)的改變,對(duì)傳統(tǒng)信用評(píng)分卡造成了巨大的困難,具體體現(xiàn)在:
人工智能和機(jī)器學(xué)習(xí)對(duì)上述問題有獨(dú)到處理: 面對(duì)數(shù)據(jù)繁雜的問題,基于深度學(xué)習(xí)的特征生成框架已被成熟運(yùn)用于大型風(fēng)控場(chǎng)景中,對(duì)諸如時(shí)序、文本、影像等互聯(lián)網(wǎng)行為、運(yùn)營(yíng)商非結(jié)構(gòu)化數(shù)據(jù)實(shí)現(xiàn)了深層特征加工提取,顯現(xiàn)出對(duì)模型效果超出想象的提升。 【圖注】上圖為大型信用貸場(chǎng)景中模型重要性特征列表,機(jī)器學(xué)習(xí)特征比例已經(jīng)超過專家人工特征。 針對(duì)數(shù)據(jù)駕馭難的挑戰(zhàn),經(jīng)過大量實(shí)踐表明,不同的數(shù)據(jù)用合適的模型才能挖掘出其最大價(jià)值。幸運(yùn)的是,機(jī)器學(xué)習(xí)方法過去在互聯(lián)網(wǎng)廣告、搜索、推薦等技術(shù)的成熟應(yīng)用,正是對(duì)不同類型的數(shù)據(jù)用不同的機(jī)器學(xué)習(xí)模型進(jìn)行處理,將此移植到金融場(chǎng)景中,用復(fù)雜集成模型就可以輕車熟路地處理上千維度的弱變量,并將之與違約風(fēng)險(xiǎn)精準(zhǔn)掛鉤。 解決模型迭代慢也是機(jī)器學(xué)習(xí)最擅長(zhǎng)的事情。 過去互聯(lián)網(wǎng)公司每天都產(chǎn)生海量用戶數(shù)據(jù),需要對(duì)搜索、推薦模型持續(xù)頻繁地在線優(yōu)化,自迭代頻次比金融領(lǐng)域更快速更準(zhǔn)確,這是人工迭代幾乎無法解決的問題。因此在金融風(fēng)控中,通過對(duì)模型特征、借貸群體、模型性能和業(yè)務(wù)反饋等多方面的監(jiān)控,機(jī)器學(xué)習(xí)模型已經(jīng)能很好地進(jìn)行在線快速自迭代。
事實(shí)上,機(jī)器學(xué)習(xí)要解決的問題很清晰,所有的這一套數(shù)據(jù)適配融合、群體反欺詐、特征工程、模型構(gòu)建和訓(xùn)練、性能監(jiān)控與自迭代的機(jī)制,包括深度學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、在線學(xué)習(xí)等技術(shù),核心都是為了將互聯(lián)網(wǎng)級(jí)別的機(jī)器學(xué)習(xí)技術(shù)“降維”應(yīng)用到金融領(lǐng)域,解決新金融場(chǎng)景上數(shù)據(jù)的獨(dú)特性,一方面可用數(shù)據(jù)比互聯(lián)網(wǎng)要少,另一方面又比傳統(tǒng)評(píng)分卡體系多了很多不可解釋、高維稀疏的大數(shù)據(jù)。 來源:虎嗅網(wǎng) |
|