一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

數(shù)據(jù)風(fēng)控的探索實(shí)踐:機(jī)器學(xué)習(xí)識(shí)別欺詐

 拓端數(shù)據(jù) 2020-03-18

在信息爆炸時(shí)代,“信用”已成為越來(lái)越重要的無(wú)形財(cái)產(chǎn)。 ”數(shù)據(jù)風(fēng)控“的實(shí)際意義是用DT(Data Technology)識(shí)別欺詐,將欺詐防患于未然,然后凈化信用體系。

挑戰(zhàn)

信貸風(fēng)險(xiǎn)和欺詐風(fēng)險(xiǎn)是消費(fèi)金融業(yè)務(wù)發(fā)展中最重要的兩種風(fēng)險(xiǎn),信息不對(duì)稱是導(dǎo)致這些風(fēng)險(xiǎn)的主要原因。
數(shù)據(jù)防欺詐”是數(shù)據(jù)風(fēng)控武器之一。這種武器的力量的重要保證是數(shù)據(jù)和信息收集的完整性和準(zhǔn)確性。通過(guò)這些有價(jià)值的數(shù)據(jù),找到欺詐者留下的線索,以防止發(fā)生欺詐。

實(shí)施過(guò)程

用戶立體化呈現(xiàn)——多維數(shù)據(jù)采集

tecdat深入分析用戶的基本屬性、社會(huì)屬性、消費(fèi)者行為、興趣偏好、社會(huì)偏好、資產(chǎn)特征、信用特征等數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘,使用戶更加立體化地實(shí)時(shí)呈現(xiàn)。

挖掘潛在的團(tuán)伙欺詐——社區(qū)發(fā)現(xiàn)算法    

一方面,基于機(jī)構(gòu)的存量數(shù)據(jù),運(yùn)營(yíng)商等數(shù)據(jù)構(gòu)建復(fù)雜的網(wǎng)絡(luò)。 同時(shí),采用社區(qū)挖掘算法實(shí)現(xiàn)風(fēng)險(xiǎn)分組。 在此基礎(chǔ)上,我們訓(xùn)練機(jī)器學(xué)習(xí)模型。

建模的原材料——特征工程

建模的第一步是特征工程,眾所周知,特征是機(jī)器學(xué)習(xí)建模的原材料,對(duì)最終模型的影響至關(guān)重要。數(shù)據(jù)和特征比模型更重要,數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限,而模型和算法逼近這個(gè)上限。特征加工和衍生工作越完備,那么構(gòu)建的機(jī)器學(xué)習(xí)模型效果越好。但是,面對(duì)不同數(shù)據(jù),不同業(yè)務(wù)場(chǎng)景,特征加工衍生往往是最耗時(shí)間與資源的工作。

尤其在弱數(shù)據(jù)方面,充斥著大量文本、時(shí)序類數(shù)據(jù),人工特征定義的方法天然存在較大局限性。

tecdat引入基于機(jī)器學(xué)習(xí)的特征提取框架(如 random forest,SVM,CNN)來(lái)適應(yīng)不同的數(shù)據(jù)類型,自動(dòng)從大量復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)中產(chǎn)生高質(zhì)量的特征,完成模型訓(xùn)練后可以輸出特征的重要性,結(jié)合多種方法進(jìn)行特征選擇和解釋。

和而不同——集成模型

具體的模型,我們知道在弱勢(shì)數(shù)據(jù)的基礎(chǔ)上加工和衍生的特點(diǎn),機(jī)構(gòu)往往面臨很多特征維度,從數(shù)千到數(shù)萬(wàn)以上,非常稀疏。 超出了傳統(tǒng)風(fēng)控的基于評(píng)分卡系統(tǒng)的建模能力。

tecdat引入集成模型(ensemble models)來(lái)解決這個(gè)問(wèn)題。 集成模型從“投票”的思想簡(jiǎn)單的理解,也就是我們對(duì)不同類型的數(shù)據(jù)使用最合適的子模型(Logistic回歸,GBDT,CNN,xgboost), 然后每個(gè)子模式投票作出決策。

能夠使整體模型的準(zhǔn)確度和防止過(guò)擬合的能力達(dá)到協(xié)調(diào),從而達(dá)到在總體上的最佳準(zhǔn)確度。

復(fù)雜的集成模式框架除了當(dāng)前場(chǎng)景和業(yè)務(wù)建模具有很好的表現(xiàn),其另一個(gè)重要價(jià)值在于可以快速應(yīng)用于新業(yè)務(wù)應(yīng)用,對(duì)冷啟動(dòng)階段有非常重要的作用。

結(jié)果/效果總結(jié)

最后,在線上信用貸場(chǎng)景實(shí)踐下來(lái),經(jīng)過(guò)多批次多個(gè)跨時(shí)間段的驗(yàn)證,可以看到,效果上還是有非常直接的提升,模型性能相比傳統(tǒng)模型提升了大約30%。

版權(quán)聲明:為拓端數(shù)據(jù)原創(chuàng)文章,未經(jīng)允許不得轉(zhuǎn)載!

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    国产精品久久三级精品| 偷拍洗澡一区二区三区| 国产内射一级一片内射高清| 在线中文字幕亚洲欧美一区 | 亚洲中文字幕综合网在线| 久热人妻中文字幕一区二区| 欧美一区二区三区播放| 日韩在线欧美一区二区| 国内欲色一区二区三区| 欧美日韩乱一区二区三区| 国产午夜精品在线免费看| 色哟哟在线免费一区二区三区| 久久国产人妻一区二区免费| 欧美精品日韩精品一区| 国产成人精品在线播放| 东北女人的逼操的舒服吗| 欧美日韩乱码一区二区三区| 日韩精品小视频在线观看| 日韩精品视频高清在线观看| 在线观看国产午夜福利| 日韩欧美综合中文字幕| 国产在线日韩精品欧美| 日本av在线不卡一区| 韩日黄片在线免费观看| 精品国产91亚洲一区二区三区| 99国产精品国产精品九九 | 老鸭窝老鸭窝一区二区| 特黄大片性高水多欧美一级| 欧美日韩国产自拍亚洲| 99久久人妻精品免费一区| 中文字幕欧美视频二区| 国产精品亚洲二区三区| 国语对白刺激高潮在线视频| 免费性欧美重口味黄色| 日韩丝袜诱惑一区二区| 国产传媒免费观看视频| 日韩成人中文字幕在线一区| 国产福利一区二区久久| 在线一区二区免费的视频| 亚洲中文字幕人妻av| 日韩人妻av中文字幕|