日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

億信ABI

一站式數據分析平臺

ABI(ALL in one BI)是億信華辰歷經19年匠心打造的國產化BI工具,技術自主可控。它打通從數據接入、到數據建模與處理、再到數據分析與挖掘整個數據應用全鏈路,可滿足企業經營中各類復雜的分析需求,幫助企業實現高效數字化轉型。

億信ABI

一站式數據分析平臺

億信華辰深耕商業智能十多年,
打造一體化的填報、處理、可視化平臺。

淺析數據挖掘在金融行業中的應用

時間:2020-10-10來源:知乎瀏覽數:297

什么是數據挖掘?現在比較通用的定義是數據庫中的知識發現, 數據庫中數據量是非常大的, 要想從中提取有用的信息, 就要用到各種技術手段, 涉及到的學科領域包括: 統計、機器學習、人工智能、數據可視化等。

我國金融行業是較早使用數據庫技術的行業,所以也積累了大量的數據,數據挖掘在金融行業有了很多成功的案例。

暗流涌動:金融業務場景下的問題
技術是用來解決問題的,首先,我們要找到金融行業有哪些業務問題是亟待解決的!以銀行來說,主要就是要做好兩件事,吸儲和放貸。吸儲顯然就是各種金融產品的銷售,需要準確把握客戶,讓客戶把資金留在銀行; 放貸則包括了信用卡業務和各種額度的貸款, 需要仔細把握風險, 避免壞賬。

在信息技術還沒有如今這么發達的時候,銀行大多數還是靠的客戶經理自身的經驗,謹慎但繁瑣的人工審批,這個環節的成本是很高的,而且人是很有可能犯錯誤的。為了解決這個問題數據挖掘被推到了業務前沿:一方面是可以自動化,用程序自動判斷客戶類型,自動評估貸款風險,從而降低成本;另一個方面是更加客觀,避免人的失誤, 排除主觀因素的影響。

實操展現:數據挖掘如何解決問題
以信用卡的業務問題為例, 我們來看下數據挖掘方法是怎么構建信用評估模型的。

首先,確定研究對象,這里我們分析的對象是信用卡/貸款申請人, 確定了申請人這個對象, 我們就能確定收集哪些數據。

第二,整理數據, 例如以下幾個方面,基本屬性:年齡、性別、學歷、職業、婚姻等;財務特征:月總收入、月還款占總收入比例等。另外還需要客觀體現申請人信用表現的特征,信用評估實際就是在預測申請人違約的可能性,實際的違約行為就是要整理的數據,例如逾期還款次數,最長逾期時間等。

第三, 數據預處理。在模型訓練之前,需要對數據進行處理,例如空值填充、異常值過濾、類型轉換、降維等。有的是數據質量問題,有的是算法的要求。

第四,模型訓練。這里我們使用的是有監督學習算法,像神經網絡、支持向量機、邏輯回歸等。這些算法實際是在計算申請人的這些特征(自變量)和是否違約(因變量)直接具體的定量的相關性。這樣就能通過這些因變量預測申請人違約的可能性。

第五、模型評估。模型在使用之前肯定是要進行評估的。現在有很多的評估指標,例如正確率、準確率、召回率、ROC曲線等。根據模型的側重點,選擇合適的評估指標,得到最優模型。

最后,模型部署。模型是一個有預測的能力的程序,這個程序怎么運行,要看實際場景需求了,像銀行的預測并發性很高,而且要實時響應,所以很多都是將模型轉換成了評分卡,將模型的預測轉換成了數據庫查詢。現在實時流技術的發展,也能夠將模型部署到實時流中,實現模型的實時預測。這樣業務人員就能快速判斷申請人的信用情況。

結束語
技術是在不斷發展的,只要能夠獲取知識,數據挖掘并沒有局限于具體使用哪些技術方法。但是數據積累是需要時間的,在實際進行數據挖掘之前,我們更加深入的理解業務,明確收集哪些特征數據,并且做好數據規范,避免要用數據時才發現是臟數據,良好的數據質量也是數據挖掘成功的保障。億信華辰旗下的數據挖掘平臺:豌豆DM,深入洞察企業數據規律,充分挖掘數據潛在價值。我們相信數據挖掘技術會在金融行業找到更多的應用場景,持續發揮作用。
(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢