當前,以人工智能、區塊鏈等為代表的數字技術不斷涌現,快速向經濟社會各領域融合滲透。以數據為核心的
數字化轉型已是大勢所趨。金融業是數據密集型行業,在生產經營過程中積累了海量的數據資源。如何做好
數據治理,更快、更好地推進數字化轉型。

首先,談一談我們面臨的數據治理困難,即數據治理之“困”。
第一,存在信息孤島,有數不能用。當前,金融業數據治理過程中普遍存在“不愿、不敢、不能”共享的問題,導致海量數據散落在眾多機構和信息系統中,形成一個個“數據煙囪”。
一是不愿共享,多數機構都將數據作為戰略性資源,認為擁有數據就擁有客戶資源和市場競爭力,主觀上不愿意共享數據;與之類似,機構內部數據權屬分割,數據所有權和事權密切相關,部門寧愿將數據“束之高閣”,也不愿輕易拿出來共享。
二是不敢共享,部分金融數據具有一定敏感性,涉及用戶個人隱私、商業秘密甚至國家安全,數據共享可能存在法律風險,客觀上給機構間共享數據帶來障礙。
三是不能共享,由于各機構數據接口不統一,不同機構的數據難以互聯互通,嚴重阻礙數據開放共享,導致數據資產相互割裂、自成體系。(數據孤島的產生不能怪數據所有者,因為數據產生的初衷肯定是自己用,而并不是為了讓別人用,以后也會如此)
第二,
數據質量不高,有數不好用。金融科技背景下,高質量數據成為金融服務與創新的重要基礎,也是大數據提升金融精準施策能力的關鍵前提。然而,當前金融業整體數據質量不高現象依然突出,給數據深入挖掘與高效應用帶來困難。
在完整準確性方面,由于缺乏統一的數據治理體系,有些金融機構在
數據采集、存儲、處理等環節可能存在不科學、不規范等問題,導致錯誤數據、異常數據、缺失數據等臟數據產生,無法確保數據的完整性和準確性。
在一致性方面,由于業務條線繁雜、業務種類多樣,多個部門往往數據采集標準不一、統計口徑各異,同一數據源在不同部門的表述可能完全不同,看似相同的數據實際含義也可能大相徑庭,數據一致性難以保障。這給全局數據建模、分析、運用造成障礙,數據挖掘效果大打折扣。
第三,融合應用困難,有數不會用。金融數據來源眾多、體量龐大、結構各異、關系復雜。從如此繁雜的海量金融數據中挖掘高價值、關聯性強的高質量數據,需要高效的信息技術支撐和可靠的基礎設施保障。然而,部分金融機構科技研發投入相對不足、科技人員占比嚴重失調,利用數據建模分析解決實際問題的能力有待提高。
信息資源利用大多停留在表面,
數據應用尚不深入、應用領域相對較窄、數據與場景融合不夠,導致數據之“沙”難以匯聚成“塔”,海量數據資源無法盤活,數據潛力得不到充分釋放。
第四,治理體系缺失,有數不善用。我們常說,技術本身是中性的,技術運用的善惡完全取決于人,我認為這一結論對數據同樣適用。科技要向善,數據也同樣要向善。然而,由于法律法規尚不健全、數據治理體系還不完善、機構合規意識不足,數據“不善用”的問題較為突出。
從業機構違法違規成本低,為謀求商業利益而置現有管理規定于不顧,過度采集數據、違規使用數據、非法交易數據等問題屢見不鮮。例如,某些APP、網站,用戶不授權提供手機號、通訊錄、地理位置等信息,就無法繼續使用和瀏覽,通過“服務脅迫”來達成“數據綁架”。
此外,部分機構數據保護意識、內部管理、技防能力薄弱,數據泄露事件時有發生,用戶成為“透明人”,電信欺詐、騷擾電話、暴力催收等屢禁不止,嚴重侵害用戶權益。
面對上述困難和挑戰,金融業如何解困破局、實現數據有序治理和高效利用,是需要我們共同探討的重點議題。下面,我談一談數據治理應遵循的基本原則,也就是數據治理之“道”。
一是依法合規,保障安全。數據作為重要的生產要素,確保數據安全應是始終恪守的底線。金融業是對信息安全高度敏感的行業,應建立健全數據安全管理長效機制和防護措施,嚴防數據泄露、篡改、損毀與不當使用,依法依規保護數據主體隱私權在數據治理過程中不受侵害,不能因開展跨部門數據融合應用而突破現有法律法規與監管規則。
二是物理分散,邏輯集中。由于歷史原因,很多機構往往存在“N”個數據中心(數據源),呈現出多個業務條線數據分散存儲、分散運行的局面,若采用“推倒重來”的方式顯然成本太高、阻力太大。
因此,應在保持現有數據中心職能不變的前提下,維持當前數據物理存放位置和運行主體不變,充分利用各數據中心IT設施和人財資源,構建“1個數據交換管理平臺+N個數據中心(數據源)”的數據架構格局。在此基礎上,制定實施統一的數據管理規則,實現數據的集中管理。
三是最小夠用,用而不存。數據治理的一大難點就是如何在保障數據所有權基礎上實現數據的融合應用。應消除數據所有方因信息“所有權讓渡”造成“事權轉移”的顧慮,規范數據使用行為,嚴控數據獲取和應用范圍,確保數據專事專用、最小夠用、未經許可不得留存,杜絕數據被誤用、濫用。在滿足各方合理需求前提下,最大限度保障數據所有方權益,確保數據使用合規、范圍可控。
四是一數一源,一源多用。當前,無論是金融管理部門還是金融機構,各業務條線數據分散現象或多或少存在,數據多頭收集時有發生。這不但增加信息報送、采集、存儲成本,也導致數據責任主體不明,數據安全、數據質量難以保障。應明確源數據管理的唯一主體,保障數據完整性、準確性和一致性,減少重復收集造成的資源浪費和數據冗余。同時,建立數據規范共享機制,提升數據利用效率和應用水平,實現數據多向賦能。
(部分內容來源網絡,如有侵權請聯系刪除)