一直以來(lái),金融科技(FinTech)的發(fā)展常被劃分為三個(gè)階段: 第一階段FinTech1.0是金融業(yè)內(nèi)通過(guò)IT技術(shù)實(shí)現(xiàn)辦公電子化; 第二階段FinTech2.0是通過(guò)互聯(lián)網(wǎng)實(shí)現(xiàn)金融業(yè)務(wù)中的資產(chǎn)端、交易端、支付端和資金端的互聯(lián)互通; 第三階段FinTech3.0是通過(guò)大數(shù)據(jù)、云計(jì)算、人工智能、區(qū)塊鏈技術(shù)來(lái)解決傳統(tǒng)金融的信息采集、風(fēng)險(xiǎn)定價(jià)模型、投資決策和信用中介等痛點(diǎn)。 由此可見(jiàn),大數(shù)據(jù)風(fēng)控作為金融科技FinTech3.0的重要落地場(chǎng)景,是大數(shù)據(jù)、云計(jì)算、人工智能等技術(shù)在金融行業(yè)風(fēng)險(xiǎn)控制領(lǐng)域的應(yīng)用。這里的風(fēng)控領(lǐng)域既包含了銀行的信貸風(fēng)險(xiǎn),也包含了保險(xiǎn)業(yè)和投資業(yè)的各類風(fēng)險(xiǎn),其中信貸領(lǐng)域的應(yīng)用發(fā)展最為迅速,融資企業(yè)數(shù)量最多,各大金融機(jī)構(gòu)也最為重視。 與傳統(tǒng)銀行風(fēng)控模式相比,大數(shù)據(jù)風(fēng)控所需數(shù)據(jù)量更大,數(shù)據(jù)時(shí)效性更強(qiáng)、數(shù)據(jù)維度更多、數(shù)據(jù)處理更快。為了應(yīng)對(duì)這些問(wèn)題,需要應(yīng)用的新技術(shù)包括大數(shù)據(jù)采集和處理、機(jī)器學(xué)習(xí)、生物特征識(shí)別、自然語(yǔ)言處理、用戶畫(huà)像等,其應(yīng)用的場(chǎng)景也涵蓋了貸前準(zhǔn)入、貸中審批和貸后管理幾個(gè)方面。 一大數(shù)據(jù)采集和處理 大數(shù)據(jù)采集和處理是大數(shù)據(jù)風(fēng)控實(shí)施的前提,金融機(jī)構(gòu)可以獲取的數(shù)據(jù)維度不涵蓋了海量互聯(lián)網(wǎng)數(shù)據(jù)、信用數(shù)據(jù)、合作數(shù)據(jù)、企業(yè)數(shù)據(jù)和歷史數(shù)據(jù),通過(guò)大數(shù)據(jù)處理技術(shù)把非機(jī)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),進(jìn)行清洗、抽取和轉(zhuǎn)換,以便于在此基礎(chǔ)上進(jìn)行數(shù)據(jù)分析和各類新技術(shù)運(yùn)用。信貸場(chǎng)景面臨最大的一個(gè)難題是技術(shù)門(mén)檻較高,一方面需要具有分布式計(jì)算集群的架設(shè)經(jīng)驗(yàn),另一方面也需要在分布式平臺(tái)上各類數(shù)據(jù)處理和分析工具的使用經(jīng)驗(yàn)。第二個(gè)難題就是數(shù)據(jù)難以獲取,以及獲取數(shù)據(jù)的質(zhì)量和合法性問(wèn)題。 二機(jī)器學(xué)習(xí) 首先是新算法應(yīng)用。通過(guò)將各類新型的機(jī)器學(xué)習(xí)算法應(yīng)用到信貸場(chǎng)景,一方面無(wú)監(jiān)督算法可以監(jiān)測(cè)異常交易,控制欺詐風(fēng)險(xiǎn)和信用風(fēng)險(xiǎn);另一方面有監(jiān)督算法構(gòu)建和探索輸入變量和目標(biāo)變量之間線性或非線性的關(guān)系,對(duì)客戶進(jìn)行分類,以便于實(shí)施差異化風(fēng)險(xiǎn)策略。其次是在線學(xué)習(xí)。針對(duì)欺詐監(jiān)測(cè)實(shí)時(shí)性較強(qiáng)的特點(diǎn),在線學(xué)習(xí)技術(shù)次是在線學(xué)習(xí)。針對(duì)欺詐監(jiān)測(cè)實(shí)時(shí)性較強(qiáng)的特點(diǎn),在線學(xué)習(xí)技術(shù)通過(guò)對(duì)數(shù)據(jù)實(shí)時(shí)訓(xùn)練,預(yù)測(cè)欺詐概率。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,在線學(xué)習(xí)技術(shù)能夠監(jiān)測(cè)識(shí)別出更加復(fù)雜的欺詐行為。最后是模型自主迭代。隨著數(shù)據(jù)維度的日益豐富,金融機(jī)構(gòu)更加傾向于運(yùn)用多級(jí)模型和策略進(jìn)行信貸風(fēng)控智能化。這時(shí),一旦輸入變量發(fā)生變化,就會(huì)影響到模型結(jié)果。模型自主迭代技術(shù)可以在保證模型輸出穩(wěn)健性的同時(shí),根據(jù)輸入數(shù)據(jù)變化調(diào)整模型參數(shù),該過(guò)程不需要過(guò)多人工干預(yù),極大提升了效率。該技術(shù)直接的應(yīng)用就是自動(dòng)決策引擎,以數(shù)據(jù)化、智能化驅(qū)動(dòng)自動(dòng)審批。這方面最大的問(wèn)題就是決策過(guò)程過(guò)于復(fù)雜,使得解釋性較差。同時(shí),過(guò)于智能化的流程設(shè)計(jì)使得該類方法的穩(wěn)定性和泛化性較差,需要快速迭代。 三生物特征識(shí)別 近年來(lái),生物特征識(shí)別被廣泛應(yīng)用到信貸審批流程中,尤其是人臉識(shí)別、指紋識(shí)別、聲紋識(shí)別、虹膜識(shí)別等。從金融行業(yè)的應(yīng)用來(lái)看,指紋識(shí)別應(yīng)用最廣,超過(guò)了市場(chǎng)份額的一半。生物特征識(shí)別應(yīng)用的場(chǎng)景包括:遠(yuǎn)程開(kāi)戶、身份核驗(yàn)、放款確認(rèn)等。這方面技術(shù)性難題相對(duì)較少,更多的是數(shù)據(jù)隱私和數(shù)據(jù)安全問(wèn)題。 四自然語(yǔ)言處理 自然語(yǔ)言處理包括語(yǔ)音識(shí)別和文字識(shí)別,與生物特征識(shí)別相比,自然語(yǔ)言處理更進(jìn)一步,具備了理解語(yǔ)言的能力。通過(guò)挖掘語(yǔ)音信息、文本轉(zhuǎn)換后的語(yǔ)義信息,可以輔助客服人員監(jiān)測(cè)客戶情緒;與機(jī)器學(xué)習(xí)結(jié)合,可以在某種程度上替代人工客服,提供智能語(yǔ)音機(jī)器人服務(wù)。這方面最大問(wèn)題是語(yǔ)言和環(huán)境的復(fù)雜性,人類思維的跳躍性和語(yǔ)言的模糊性會(huì)增加語(yǔ)義識(shí)別的難度,進(jìn)而造成錯(cuò)誤的決策。 五用戶畫(huà)像 用戶畫(huà)像技術(shù)建立在海量數(shù)據(jù)維度的基礎(chǔ)上,根據(jù)用戶社會(huì)屬性、生活習(xí)慣和消費(fèi)行為抽象出標(biāo)簽化的用戶模型。對(duì)于金融機(jī)構(gòu)來(lái)說(shuō),用戶畫(huà)像可以幫助企業(yè)從業(yè)務(wù)角度分析客戶,了解用戶特征,控制用戶風(fēng)險(xiǎn)。用戶畫(huà)像技術(shù)通常與聚類算法結(jié)合使用,通過(guò)系統(tǒng)的梳理用戶群體,分析惡意用戶的行為特征,采取針對(duì)性的風(fēng)控規(guī)則。這方面最大問(wèn)題是用戶標(biāo)簽的準(zhǔn)確性,以及與關(guān)聯(lián)風(fēng)控規(guī)則之間的穩(wěn)定性。 |
|