第一節(jié) 大數(shù)據(jù)風控現(xiàn)狀
目前,大數(shù)據(jù)風控似乎已經(jīng)成為互聯(lián)網(wǎng)金融企業(yè)的必備宣傳點。凡提及自己的風控體系,好像不提大數(shù)據(jù)都不好意思見人。連"E租寶"這樣的龐氏騙局企業(yè),在宣傳中也號稱"引領大數(shù)據(jù)在行業(yè)信用管理和風控防范之中的應用趨勢"。但除了空洞的宣傳外,行業(yè)內對于如何落地大數(shù)據(jù)風控并沒有給出合理可信的解釋。
在很多情況下,大數(shù)據(jù)風控目前更像一群處男在談論性,大家都沒有做過,大家又表現(xiàn)的好像都做過,大家都在談論它,但其實都不知道到底體驗是什么。
當然,我們也看到了優(yōu)秀的互聯(lián)網(wǎng)金融公司組建了大數(shù)據(jù)團隊,開展了大數(shù)據(jù)風控的探索。比例,利用知識圖譜在社交數(shù)據(jù)上做欺詐分析,利用邏輯回歸,支持向量機(SVM),決策樹等模型補充或替代傳統(tǒng)的打分卡,在更廣泛的數(shù)據(jù)源上進行建模分析等。
第二節(jié) 大數(shù)據(jù)風控落地路漫漫
然而,大數(shù)據(jù)風控建設的道路還很遠。原因有如下幾點。
一、不同的消費場景下,客戶客群的特征是不一樣的,收集到的客戶信息差異可能很大,這些大數(shù)據(jù)方法的有效性前提就受到質疑。比如,針對熱愛社交的80、90后年輕群體,能夠爬取到有價值的社交數(shù)據(jù),知識圖譜就能發(fā)揮出一些價值。但針對貸款主流群體的60后來說,這些人用社交網(wǎng)絡的非常少,"巧婦難為無米之炊",這種方法就難有用武之地。
二、在中國目前的信用體系下,貸款審批的衡量是很復雜的。反欺詐能力,額度評估能力與催收手段等綜合起來,共同決定了風險決策的能力。大數(shù)據(jù)在這些能力上的落地探索,還處于非常初期的階段。在不同的場景下,有些可能是反欺詐的決定性更強些,有些可能是額度的評定更強些,有些可能是催收的手段來的更直接。拋開具體的貸款場景談論風控的大數(shù)據(jù)技術,是有失偏頗的。
三、算法都是有適用性和局限性的,不是說看起來炫的方法就一定更有效,有沒有效果,要看療效。但療效到底如何,不做是不知道的。
四、大數(shù)據(jù)算法的難以解釋性,導致了算法落地的困難。比如,用SVM作出的模型可能從歷史數(shù)據(jù)上顯示是更好的,但是為什么會更好卻無法解釋,也無法保證是否在將來的業(yè)務中表現(xiàn)也好。同時,模型對金融產品是有指導意義的,如果模型本身不可解釋,則對也會對產品的設計和推廣帶來障礙。
五,傳統(tǒng)的金融產品,如房貸,車貸等,一定意義上也是大數(shù)據(jù)決策的。人工的風控決策方法,是信審人員長期與不良借款人斗智斗勇的結晶,是人的智慧對大數(shù)據(jù)的總結。數(shù)據(jù)挖掘算法在與人的經(jīng)驗的結合和PK的過程中,難以快速勝出。
大數(shù)據(jù)風控的顛覆性效果,現(xiàn)階段更多的體現(xiàn)在創(chuàng)新型的金融產品上,比如淘寶和京東的分期服務,針對學生的3C分期服務,針對高速場景下貨車的分期服務等。
同時,大數(shù)據(jù)風控的投入,卻是很大的。無論從基礎的設施投入、系統(tǒng)研發(fā),到昂貴的大數(shù)據(jù)人才的雇用,再到負樣本(壞賬)的積累,都是巨大的投入。當企業(yè)的老板沒有高瞻遠矚到愿意持續(xù)無悔的砸錢投入,當企業(yè)的技術人才沒有過硬到一定能排除萬難取得最終的勝利,大數(shù)據(jù)的產出都存在很大的未知數(shù)。這些未知數(shù)讓很多老板望而卻步。
如何能讓大數(shù)據(jù)風控切實落地,產生實實在在的價值,不僅僅是大數(shù)據(jù)技術專家思考的核心問題,更是金融公司老板所關切的重要問題。
不幸的是,這些老板決策了對大數(shù)據(jù)技術的投資,并承擔了最終的結果(壞賬,以及對技術投資的回報率(ROI)),而他們往往對技術并不能深入的了解。如何高效地在這個領域進行資源的投入,是眼下的當務之急。
第三節(jié):建立效果評估體系,循序漸進開展大數(shù)據(jù)風控
大數(shù)據(jù)風控是未來,但落地的困境又這么多,扭轉局面的關鍵點在哪里?這個關鍵點,應該是在建立廣泛認可的效果評估體系,然后在效果評估的框架下面,逐步推動大數(shù)據(jù)技術的普及。這個效果評估體系,將具備如下的特征。
一、指標的制定是服務階段性商業(yè)目標的。在產品上線的階段,有放貸限額,小范圍試錯;而業(yè)務成熟階段,則會追求更高的批過率和更低的壞賬率,并尋求兩者之間最佳平衡。
二、用量化指標進行衡量。也就是說,大數(shù)據(jù)風控作為風控的方法,應該用清晰的指標來衡量取得的成果。
三、指標的物理含義是一般人都能理解的。只有讓為投入買單的老板們理解了大數(shù)據(jù)風控的衡量指標,他們才能作出決策以開展持續(xù)的技術投入。
四、指標是完備的。比如,實施了一種大數(shù)據(jù)風控技術,可能帶來壞賬率的下降,但同時也可能帶來批過率的下降。雖然壞賬少了,但業(yè)務量也降低了。但從"得"的指標上衡量,是沒有意義的。要"得"與"失"結合起來,根據(jù)企業(yè)不同的發(fā)展階段,選擇不同的技術。
在該評估體系下,老板們將能清晰地衡量具體的風控技術來帶的ROI,然后決策該采用什么樣的技術手段。在有清晰的產出預期下,大數(shù)據(jù)風控的投入就可以有循漸進的執(zhí)行。企業(yè)將不再困惑于各種難以理解的模型算法,而是把它們當成工具,然后選擇最優(yōu)的算法即可。也就是說,在有邏輯回歸,支持向量機,深度學習等多種方法候選的情況下,任何一種方法都可能有自己適用的人群。方法之間沒有優(yōu)劣之分,只有誰更適合。
第四節(jié):建立模型評估體系
基于大數(shù)據(jù)的思想,人們提出了很多模型(支持向量機,邏輯回歸,深度學習等)來做風控系統(tǒng)。同一種模型用不同的模型參數(shù)又可以橫向衍生出很多新的模型。 那么在眾多的數(shù)學模型中,怎樣知道應該使用那一種模型呢? 模型評估體系的建設就顯得尤為重要。 通常評估一個模型的好壞應該從模型的三個屬性去評估。他們分別是模型的
a.精確性:在預測狀態(tài)變量時,模型必須有一定的精確性
b.穩(wěn)健性:模型應該對于目標總體中的所有樣本都有效,而不僅僅是對開發(fā)測試樣本有效
c.合理性:模型表現(xiàn)出來的趨勢對于觀測到的行為必須有意義。
在這里我們主要講講模型的精確性。KS值、洛倫茲曲線(ROC)是被廣泛使用的模型精確性評估指標。在統(tǒng)計學中,KS值是用來衡量模型的區(qū)分能力。通俗來講就是模型區(qū)分好客戶與壞客戶的能力。好客戶是指守約客戶,壞客戶是指違約客戶。KS值越大,模型的識別能力就越強,反之,就越弱。ROC曲線的作用是衡量信貸模型的目標累積強度。這里的目標是指違約客戶,通俗來講ROC曲線的凸度大小反應了模型識別壞客戶的能力。凸度越大說明模型越優(yōu)秀如:在20%的總體人群中就能夠辨別出60%的所有違約人群。ROC曲線凸度大小和KS值大小是正相關關系。ROC曲線的凸度越大,相對應模型的KS值就越大。這些指標有助于多個模型甄別,模型參數(shù)優(yōu)化的情況。即便對于當前來看不錯的模型,我們也應該定期檢驗模型的重要評估指標。評估體系的建立固然重要但同時也要充分認識模型的局限性。在利用模型制定信貸策略時,我們應該信奉‘實踐是檢驗真理的唯一標準’。
第五節(jié):行業(yè)內公司現(xiàn)狀及未來展望
北京數(shù)云普惠科技有限公司致力于向消費金融公司普及大數(shù)據(jù)技術,提供標準化、模塊化、易用的大數(shù)據(jù)風控系統(tǒng)以降低消費金融企業(yè)客戶使用大數(shù)據(jù)技術的資金成本和技術門檻。其創(chuàng)始人海歸博士孫林和首席科學家海歸博士付亞博認為,困擾企業(yè)進行大數(shù)據(jù)技術投入的因素,不僅包括技術的難度和領導者的判斷,更多的來自于技術本身對既有業(yè)務管理體系和決策層知識結構的挑戰(zhàn)。它像一把雙刃劍,如果用的不好,可能會對企業(yè)的業(yè)務帶來混亂和災難。明確的效果評估體系,能給大數(shù)據(jù)風控技術落地帶來有效的指導和管控,把業(yè)務的開展統(tǒng)一到一個目標體系上來。當大數(shù)據(jù)風控的應用能夠達到投入即能改善業(yè)務效果時,公司的發(fā)展就能進入一個良性的循環(huán)。當企業(yè)的業(yè)務都管理在一個大數(shù)據(jù)系統(tǒng)中的時候,企業(yè)的客戶資源,數(shù)據(jù)資產等都不再受限于某一個員工角色,人員流失等對企業(yè)的影響就會越來越小,也會減輕管理的難度。
優(yōu)信金融作為優(yōu)信拍旗下二手車消費金融公司,在大數(shù)據(jù)風控應用上有長期的積累和探索,其CRO倪驥先生認為當前使用大數(shù)據(jù)進行風控還有很多困難。1,目前大數(shù)據(jù)還不夠大。很多數(shù)據(jù)在覆蓋率上能達到50%已經(jīng)是驚喜了。2,傳統(tǒng)的風險模型都需要違約數(shù)據(jù)的積累,中小型互聯(lián)網(wǎng)金融機構在時間成本和資金成本都難以承受。因此,互聯(lián)網(wǎng)金融企業(yè)相當需要與征信服務公司和數(shù)據(jù)提供商的多方位合作以提升在數(shù)據(jù)積累和建模等多方面的能力。
未來,在“談消風聲”公眾號里,我們將推出一個系列的文章,通俗易懂地講解大數(shù)據(jù)風控的效果評估指標。第一篇,我們將從“混淆矩陣”開始講起,具體內容,在“談消風聲”公眾號里回復“混淆矩陣”即可獲得。
- 百億美元預算僅分到3.25億,馬斯克的SpaceX遭遇最狠一擊
- 啟信寶發(fā)布《全國產業(yè)集群大全》,全景透視超20000個特色產業(yè)集群
- 人民日報對話任正非:國家越開放,會促使我們更加進步
- 五大領域,六大亮點!全國首個新域新質創(chuàng)新大賽落地青島
- 2025新域新質創(chuàng)新大賽新聞通氣會?在青島召開
- 華為ICT大賽2024-2025全球總決賽收官:AI賦能教育轉型,助力ICT人才培養(yǎng)
- 從無線再進化到數(shù)據(jù)完整性:解碼Qorvo如何定義下一代智能設備
- 發(fā)力5G-A揚帆,山東領航萬兆時代:助推新型工業(yè)化崛起
- 萬智互聯(lián) 加速邁向智能世界——華為亮相第八屆數(shù)字中國建設峰會
- 聯(lián)想車計算上海車展亮劍:以智算AI,驅動汽車“智慧”加速
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。