數據治理的定義是對數據資產管理行使權力和控制的活動集合。其最終目的是挖掘數據價值,推動業務發展,實現盈利。我國最早意識到數據治理重要性的行業是金融行業,金融行業對數據的依賴性很強,而數據治理是數據平臺建設的主要限制因素。數據治理平臺是以元數據為基礎,實現數據的產生、存儲、遷移、使用、歸檔、銷毀等環節的數據生命周期管理。實現數據從源到數據中心再到應用端的全過程管理,為用戶提供了準確便捷的企業資產信息。
數據治理平臺也包括數據標準,數據質量。
一、數據治理的核心領域
1、數據標準
數據標準是企業建立的一套符合自身實際,涵蓋定義、操作、應用多層次數據的標準化體系,它包括基礎標準和指標標準。與數據治理其他核心領域具有一定的交叉,比如元數據標準、數據交換和傳輸標準、數據質量標準等。
2、數據質量管理
數據質量管理已經成為企業數據治理的有機組成部分。高質量的數據是商業企業進行分析決策、業務發展規劃的重要基礎,只有建立完整的數據質量體系,才能有效提升企業數據整體質量,從而更好的為客戶服務,提供更為精準的決策分析數據。
3、數據模型
數據模型是數據治理中的重要部分,合適、合理、合規的數據模型,能夠有效提高數據的合理分布和使用,它包括概念模型、邏輯數據模型和物理數據模型,是數據治理的關鍵、重點。
4、元數據管理
元數據分為業務元數據、技術元數據和操作元數據,三者之間關系緊密。業務元數據指導技術元數據,技術元數據以業務元數據為參考進行設計,操作元數據為兩者的管理提供支撐。
5、數據交換
數據交換是企業進行數據交互和共享的基礎,合理的數據交換體系有助于企業提高數據共享程度和數據流轉時效。
6、數據安全
商業企業的重要且敏感數據大部分集中在應用系統中,例如客戶的聯絡信息、資產信息等,如果不慎泄露,不僅給客戶帶來損失,也會給商業企業帶來不利的聲譽影響,因此數據安全在數據管理和治理過程中是相當重要的。
7、數據生命周期管理
任何事物都具有一定的生命周期,數據也不例外。從數據的產生、加工、使用乃至消亡都應該有一個科學的管理辦法,將極少或者不再使用的數據從系統中剝離出來,并通過核實的存儲設備進行保留,不僅能夠提高系統的運行效率,更好的服務客戶,還能大幅度減少因為數據長期保存帶來的儲存成本。
8、數據分布和存儲
數據分布和存儲主要涵蓋了數據如何劃分和存儲,總行系統以及總分行數據如何分布,主數據及參考數據如何管理。只有對數據進行合理的分布和存儲,才能有效的提高數據的共享程度,才能盡可能的減少數據冗余帶來的存儲成本。
二、數據治理的價值體系
1、數據流通:通過實現信息整合和分發機制,支持跨業務、跨部門、跨系統的信息流轉和協同。這部分體現著業務數據治理的關鍵價值。
2、數據洞察:通過消除數據內在的質量缺陷,明確數據之間的關聯關系,幫助數據分析人員更好地理解數據,實現數據洞察。這部分體現著分析數據治理的關鍵價值。
3、數據服務:通過數據的采集、清洗、導入,提升數據質量,確保數據的一致性。這部分體現著主數據治理的關鍵價值。
三、數據治理平臺建設方案
1、制定數據標準,優化流程
對企業來說,數據有很多來源。金融、人力、供應鏈、生產、銷售等內部數據;政策、經濟、社會、科技、產業、市場、競爭者等外部數據。盡管數據來源廣泛,數據量大是其優勢,但如果不加以整理,混亂的數據不但不利于分析應用,而且會造成不必要的財產損失。所以企業應建立統一的數據標準、數據管理流程和系統,以規范數據生產與供應過程。
2、搭建平臺
對于數據治理平臺的搭建,企業需要考慮用戶的不同需求,從而建立不同的模塊。數據治理平臺的內容主要包括數據質量管理、數據標準管理、數據安全管理、數據模型工具、元數據管理、主數據管理等功能模塊。我們所說的數據治理項目不是為治理數據而構建,而是與大數據平臺、數據倉庫、數據分析挖掘等項目相結合,通過提高數據質量、控制數據安全性,使數據發揮最大效益。
3、優化模型,確保數據安全
數據安全管理是從數據資產整理開始的。將數據資產進行整理分類,可以明確敏感數據在系統內的分布情況,判斷敏感數據是如何被訪問的,以及確定當前賬號和授權的狀態。依據數據價值和數據特性,對企業的核心數據資產進行分類,利用數據治理工具將其模型化,確定敏感數據的位置、描述和處理方法,確保數據的合法合規地使用。