數據治理之“困”
在談到當前的數據治理之“困”時,主要有四方面:

第一,存在信息孤島,有數不能用。當前,金融業數據治理過程中普遍存在“不愿、不敢、不能”共享的問題,導致海量數據散落在眾多機構和信息系統中,形成一個個“數據煙囪”。一是不愿共享,多數機構都將數據作為戰略性資源,認為擁有數據就擁有客戶資源和市場競爭力,主觀上不愿意共享數據;與之類似,機構內部數據權屬分割,數據所有權和事權密切相關,部門寧愿將數據“束之高閣”,也不愿輕易拿出來共享。二是不敢共享,部分金融數據具有一定敏感性,涉及用戶個人隱私、商業秘密甚至國家安全,數據共享可能存在法律風險,客觀上給機構間共享數據帶來障礙。三是不能共享,由于各機構數據接口不統一,不同機構的數據難以互聯互通,嚴重阻礙數據開放共享,導致數據資產相互割裂、自成體系。
第二,
數據質量不高,有數不好用。金融科技背景下,高質量數據成為金融服務與創新的重要基礎,也是大數據提升金融精準施策能力的關鍵前提。然而,當前金融業整體數據質量不高現象依然突出,給數據深入挖掘與高效應用帶來困難。在完整準確性方面,由于缺乏統一的數據治理體系,有些金融機構在
數據采集、存儲、處理等環節可能存在不科學、不規范等問題,導致錯誤數據、異常數據、缺失數據等“臟數據”產生,無法確保數據的完整性和準確性。在一致性方面,由于業務條線繁雜、業務種類多樣,多個部門往往數據采集標準不一、統計口徑各異,同一數據源在不同部門的表述可能完全不同,看似相同的數據實際含義也可能大相徑庭,數據一致性難以保障。這給全局數據建模、分析、運用造成障礙,數據挖掘效果大打折扣。
第三,融合應用困難,有數不會用。金融數據來源眾多、體量龐大、結構各異、關系復雜。從如此繁雜的海量金融數據中挖掘高價值、關聯性強的高質量數據,需要高效的信息技術支撐和可靠的基礎設施保障。然而,部分金融機構科技研發投入相對不足、科技人員占比失調,利用數據建模分析解決實際問題的能力有待提高。信息資源利用大多停留在表面,
數據應用尚不深入、應用領域相對較窄、數據與場景融合不夠,導致數據之“沙”難以匯聚成“塔”,海量數據資源無法盤活,數據潛力得不到充分釋放。
第四,治理體系缺失,有數不善用。我們常說,“技術本身是中性的,技術運用的善惡完全取決于人”,這一結論對數據同樣適用。科技要向善,數據也同樣要向善。然而,由于法律法規尚不健全、數據治理體系還不完善、機構合規意識不足,數據“不善用”的問題較為突出。從業機構違法違規成本低,為謀求商業利益而置現有管理規定于不顧,過度采集數據、違規使用數據、非法交易數據等問題屢見不鮮。例如,某些APP、網站,用戶不授權提供手機號、通訊錄、地理位置等信息,就無法繼續使用和瀏覽,通過“服務脅迫”來達成“數據綁架”。此外,部分機構數據保護意識、內部管理、技防能力薄弱,數據泄露事件時有發生,用戶成為“透明人”,電信欺詐、騷擾電話、暴力催收等屢禁不止,嚴重侵害用戶權益。
(部分內容來源網絡,如有侵權請聯系刪除)