- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2023-03-20來源:莫念初瀏覽數:931次

智能風控是利用大數據、人工智能技術和科學決策方法,通過自動化預測、評級和決策等方式,提高風控效果和效率、降低成本的一套綜合體系。智能風控包括智能風控的方法論,智能風控的算法,工程技術的實現以及深入業務場景的應用。智能風控方法包含模型搭建方法、數據挖掘方法、風控策略制定方法,通過一系列方法,我們可以構建智能風控的基本架構。智能風控算法包括機器學習算法、深度學習和關系網絡等算法,這些算法是方法體系中的核心部件,也是智能風控得以展現智能的關鍵部分。工程技術實現是運用智能風控的方法論以及智能算法,結合工程技術,實現自動化的風控決策和智能交互。應用方面,在業務流程的全過程中,只要有風險點的環節都可以加入智能風控進行決策。根據不同的業務場景靈活的選取模型規則的組合進行自動決策。自動體系要達到的最終目的是提高企業風控的精準度和效率,將風險控制在合理的范圍內,減少風險損失提高企業的盈利能力。

1. 數據層詳解

首先是數據層。數據是所有智能風控的基礎,數據中包含識別風險的信息,智能風控數據層包含不同類型的數據。根據來源我們可以將數據分為其內部數據和第三方數據。以金融風控場景中常見的數據為例,企業內部數據包含基礎信息,比如身份信息、學歷信息、設備相關的信息包含 app 行為數據、設備指紋數據等。交易數據包含授信記錄數據、還款記錄數據等。第三方數據就更加廣泛,包括多頭借貸數據、征信相關數據等。數據處理上,按照處理的實效性劃分,可以分為實時計算和離線計算。實時計算通常是用于實時決策場景。比如線上金融業務的授信審批,需要實時獲取各類信貸決策的數據。離線計算通常用于定時任務,比如信貸風控中的貸中風控識別場景。從數據處理的方式上劃分,可以分為流式數據處理和批量數據處理。數據處理的步驟通常分為數據采集、數據校驗、數據清洗、數據存儲、標準輸出和數據監控。數據采集步驟對企業內部數據通常是從業務系統產生的數據元素獲取需要的數據字段。對外是從第三方接口獲取數據。數據校驗是對數據做基本的驗證判斷,確保指定對象的數據有效。數據清洗是對數據做規范標準化處理,排除異常和雜亂數據。數據存儲分為線上實時數據和離線數據存儲,以滿足不同使用場景和目的。標準化輸出是將數據處理的結果對外提供使用接口或者其他的查詢服務。最后,數據監控是對整個數據處理結果的過程進行監控預警,及時發現數據層的應用異常。那么最后數據平臺是數據層的支撐工具,通過數據平臺來實現數據層的管理。通常數據平臺包含內外部數據接入整合的功能,數據管理和服務的功能,數據校驗和監控的功能。
2. 特征畫像層詳解

特征是對數據的再次加工,將智能風控建筑的原材料變成磚瓦。特征是從數據中抽取有效的、針對特定目的的部分信息,從數據產生特征的過程就是特征挖掘。數據質量決定了特征質量的上限,但是好的特征挖掘過程是盡量的從數據中挖掘出最有價值的信息。有些特征是直接從數據中獲取的比如性別、年齡、居住區域這類身份特征和基礎信息特征。另外一些特征就需要對原始數據進行匯總加工比如借款次數、額度使用占比等。還有一些特征需要基于關系圖譜機器學習的方法進行深度加工才能提取,比如二度關系里人的特征、收入指數、消費能力指數等。特征提取的方法包括基于統計聚類的 RFM 方法,基于時序特征的提取方法,基于機器學習 NLP 圖特征圖算法等特征提取方法。雖然特征提取的方法不同,但是特征提取的關鍵步驟基本是一致的。源數據分析和清洗是對原始數據的流轉、時效、質量等進行分析并清洗處理成標準格式。中間數據構造是按照不同特征提取的方法構建中間數據集,比如二分類特征提取方法要求數據集為標準的寬表數據格式。特征設計和生成是根據不同特征提取方法設計并生成特征,比如 RFM 特征方法中需要選取特征匯總的不同維度、匯總的對象以及匯總的計算方式。特征評估是對特征效果進行分析,選擇效果好、穩定性高的特征。特征回溯是對歷史數據進行回測,通常服務于特征提取后的建模場景。特征監控是對已經進入使用階段的特征進行持續監控以確保有效性和穩定性。特征平臺是為了支撐特征從開發到應用的工具平臺。通常特征平臺包括特征挖掘模塊、特征計算模塊和特征管理模塊。
3. 模型算法層詳解

模型算法層是智能風控的核心,是構成智能風控建筑的主體結構。通過模型算法層實現智能化的預測評估。風控中典型的場景就是預測風險,計算發生風險的概率,再復雜的算法本質上還是可以理解為概率問題。風控場景中的模型有很多種類,這些都是根據業務場景來決定的。金融風控場景中我們構建模型計算評分來預測用戶的欺詐概率、違約概率、貸中風險發生的概率、貸后催收回款的概率。在營銷場景中我們構建模型來判斷營銷成交轉化的概率、識別作弊的概率。在內容風控場景中構建模型來判定內容違規的概率。模型是機器學習算法構建的結果。為了構建模型我們可以選擇的算法是多種多樣的,新的算法也在不斷產生和更新迭代。風控領域常用的算法包括基礎算法如邏輯回歸算法、決策樹算法等。集成學習算法包括隨機森林、xgboost 等。深度學習算法包括神經網絡、圖神經網絡等等。算法和場景雖然不同,但是構建模型的流程也是基本相似的。可以劃分為如下幾個步驟: 問題定義是對業務場景的問題進行明確和界定。 樣本定義及劃分是選擇合適的樣本定義標簽,選擇可用的特征范圍。 模型架構設計是確定算法,確定模型結構。 數據準備與 EDA 是對樣本數據進行整理探索性分析。檢查樣本的可靠性。 特征選擇是從大量的被選特征當中選擇效果好和覆蓋率高的特征。 模型訓練與評估是完成模型訓練并評估模型效果,此過程可以循環迭代多次。 模型監控是在模型應用之后持續的監控,確保模型的有效性和穩定性。 模型平臺是支持模型管理的工具。通常模型平臺包括自動建模功能模塊、模型計算功能模塊、模型管理功能模塊。
4. 決策應用層詳解

決策應用層是整個智能風控體系的最后環節。這一層針對業務場景,基于特征和模型結果制定決策方案,對最終的業務決策和流程產生影響。策略環節通常需要設計一套決策流程,在流程中的每一個環節設置決策規則。這些規則包括直接使用特征制定的規則和基于模型制定的規則。通過規則實現業務流程的通過或者拒絕、差異化的分流等動作。在金融風控貸前場景中,通常的決策包括欺詐識別、信用風險識別以及其他一些準入攔截。對于通過的客戶在進行差異化的審核操作、差異化的授信額度決策、差異化的定價政策等等。在策略制定的過程中,可以選擇多種的決策算法進行支持的,包括決策樹,異常點檢測等等算法來支持我們制定決策規則,用最優化的算法來支持我們進行最優化決策點的選擇。風控策略制定中最常見的就是進行風控規則策略的制定,通常的流程如下: 識別業務場景中常見的風險點 選擇合適的分析樣本 基于歷史數據選擇算法生成規則 對規則的有效性和穩定性進行評估 設計規則測試的方案 通常進行 AB 實驗來驗證規則的效果 對規則的有效性和穩定性進行持續監控 決策引擎是支持策略部署執行的一個工具。決策引擎通常包括規則配置、決策流的配置、審批管理等功能模塊。

企業在風控體系搭建的初期,不一定會有標準化的平臺工具來支持。但是隨著企業智能風控體系的這個發展和成熟,更加高效的方式還是去建立每個功能模塊的平臺化工具。智能風控體系中幾個關鍵平臺工具之間的交互關系如上圖所示: 數據平臺主要是為特征平臺提供數據的輸入,同時,它也支持各類樣本數據、分析數據的提取。 特征平臺主要是為模型平臺和決策引擎提供特征計算和輸入。 模型平臺主要是為決策引擎提供模型計算結果的輸入。 決策引擎主要是基于特征平臺和模型平臺的結果進行決策,幾個工具平臺之間的相互依賴和配合,形成了智能風控全流程的一個閉環。?

下一篇:建設現代化產業體系從何發力...