DAMA國際數據管理協會對數據治理定義:數據治理是對數據資產的管理活動行使權力和控制的活動集合(規劃、監控和執行)。
數據治理涵蓋了從前端業務系統、后端業務數據庫再到業務終端的
數據分析,從源頭到終端再回到源頭,形成的一個閉環負反饋系統。從目的來講,數據治理就是要對數據的獲取、處理和使用進行監督管理。
具體一點來講,數據治理就是以服務組織戰略目標為基本原則,通過組織成員的協同努力,流程制度的制定,以及數據資產的梳理、采集清洗、結構化存儲、可視化管理和多維度分析,實現
數據資產價值獲取、業務模式創新和經營風險控制的過程。今天小億就來帶著大家從各概念定義本身來說說數據治理。
01、元數據
元數據是關于數據的數據,是為了描述數據的相關信息而存在的數據。
元數據不僅僅表示數據的類型、名稱、值等信息,它可以理解為是一組用來描述數據的信息組/數據組,該信息組/數據組中的一切數據、信息,都描述/反映了某個數據的某方面特征,則該信息組/數據組可稱為一個元數據。

▲技術元數據
例如:元數據可以為數據說明其元素或屬性(名稱、大小、數據類型等),或其結構(長度、字段、數據列),或其相關數據(位于何處、如何聯系、擁有者)。在日常生活中,元數據無所不在。只要有一類事物,就可以定義一套元數據。

▲業務元數據
除此以外,在
數據倉庫體系中,元數據代表了一種統計數據從元數據、數據倉庫到
數據應用的全鏈路信息,記錄了統計數據從產生到展示的全部過程。可以說,有了元數據,開發人員便可以方便地找到統計數據背后的計算邏輯與過程,用于指導開發工作并追蹤數據問題,可以極大地提升工作的效率。
02、主數據
在2018年中國信通院牽頭編寫的《
主數據管理實踐白皮書(1.0版)》中,主數據定義的概念如下:“指滿足跨部門業務協同需要的、反映核心業務實體狀態屬性的組織機構的基礎信息。主數據相對于交易數據而言,屬性更加穩定,準確度要求更高,唯一識別。”
企業主數據指企業內一致并共享的業務主體,如圖所示,是各個系統(包括操作型系統、事務型應用系統、分析型系統)間一致并共享的數據;是用來描述核心業務的實體,例如員工、組織機構、客戶、供應商、會計科目等相關數據。主數據與其他數據的關系如圖所示:

具有以下特點:
1.權威性:主數據作為企業最重要的數據資產,它的設計并不面向業務系統,而應該保持相對的獨立,它服務于但又高于使用主數據的業務系統;
2.全局性:主數據是超越部門與流程而存在的,以滿足跨部門業務協同而建立的,可以認為是所有職能部門業務過程的“最大公約數”;

3.共享性:主數據是在兩個或多個系統之間,需要共享的數據,才能定義為主數據。因此主數據必須應用一種能夠被各種異構系統所兼容的技術架構;
4.擴展性:主數據在設計的時候,就需要考慮未來做擴展的可能性。因此主數據數據項定義時應當遵守開閉原則,即對擴展開放對修改關閉, 凡是已經定義的主數據數據項原則上不應當再次修改。
03、數據標準
數據標準是指企業為保障數據的內外部使用和交換的一致性和準確性而制定的規范性約束。而數據標準管理則是一套由管理制度、管控流程、技術工具共同組成的體系,是通過這套體系的推廣,應用統一的數據定義、數據分類、記錄格式和轉換、編碼等實現數據的標準化。
數據標準管理的目標是通過統一的數據標準制定和發布,結合制度約束、系統控制等手段,實現數據的完整性、有效性、一致性、規范性、開放性和共享性管理,為
數據資產管理提供經營管理依據。

▲數據治理體系架構
對于大多數企業而言,他們已有各種各樣的信息規范,如建模規范,但是這些規范只是為了約束開發工作,更多的時候強調的是數據字典表達的規范。而企業級數據標準的目標卻是使企業內部在業務和數據上達成共識,業務共識在先,數據共識在后。從一個IT管理的數據規范變成企業級的數據標準,將是非常大的轉變,這個轉變的核心是以數據標準提高業務的規范性和業務協同能力,同時約束IT系統建設。
04、數據質量
數據質量是指在業務環境下,數據符合數據消費者的使用目的,數據質量需要滿足業務場景具體的需求。數據質量包含兩個方面:數據自身的質量和數據的過程質量。
數據自身的質量很好理解,比如數據必須真實準確地反映實際發生的業務,任何業務操作的數據都沒有被遺漏,數據存在各種約束條件,這種約束條件不能自相矛盾等等。

數據的過程質量就是數據的使用過程符合標準規范,比如
數據存儲:數據是否被安全地存儲到了合適的介質上,能夠保證數據不受外來因素的破壞。當然數據存儲只是數據使用過程的一個環節,除此之外還包括獲取、傳輸、應用和刪除等一系列的使用過程,這其實也是數據生命周期的各個階段。
05、數據指標
根據百度百科的定義,預期中打算達到的指數、規格、標準,一般用數據表示就是指標。
而數據指標有別于傳統意義上的統計指標,它是通過對數據進行分析得到的一個匯總結果,是將業務單元精分和量化后的度量值,使得業務目標可描述、可度量、可拆解。但只有對業務有參考價值的可統計的數據才能叫做指標,因為它反映了用戶做了哪些行為,給業務帶來了怎樣的結果指標。

而數據指標體系是通過技術手段,從不同的“維度”梳理業務過程,將零散的、有關聯性的指標,系統化的組織起來,通過數據看板或接口形式,提供給運營、算法等不同的業務方使用。
一個好的數據指標體系能幫助使用者準確快速地下結論,比如定義業務運作的好壞、能滿足多場景的歸因,即使出現異動,也能快速定位原因,最終提高發現問題、分析問題、解決問題的效率。
06、數據交換
出于各種原因,組織會選擇數據交換與共享。例如,內部與內部的數據交換共享,企業與企業之間的數據交換共享,以及政府或企業對個人或服務提供商的數據交換與共享。數據交換共享就是讓不同地方使用不同計算機、不同軟件的用戶能夠讀取他人數據并進行各種操作運算和分析。

也就是當數據從一個系統跨授權邊界訪問或傳遞到另一個系統時,就需要使用一個或多個協議來指定每個組織的責任、要訪問或交換的數據類型和影響界別、如何使用交換數據,以及在交換系統的兩端處理、存儲或傳輸數據時如何保證數據安全。
常見的數據交換/共享場景包括但不限于:在授權用戶之間共享數據和信息;提供對數據的自定義訪問;合作進行聯合項目;提供完整的、短暫的、間歇性的、永久的或臨時的數據交換共享活動;通過交換共享減少數據收集工作量和成本;提供在線培訓;為關鍵數據和備份文件提供安全存儲。
07、數據資產
在理論層面,目前并沒有對數據資產的權威定義。我們選取業界較為認可的概念,即:數據資產是指由企業擁有或者控制的,能夠為企業帶來未來經濟利益的,以物理或電子的方式記錄的數據資源,如文件資料、電子數據等。但在企業中,并非所有的數據都構成數據資產,數據資產是能夠為企業產生價值的數據資源。
數據資產管理是對存量數據進行系統化梳理,與數據標準匹配,推動數據資源轉化為數據資產的過程,即指規劃、控制和提供數據及信息的一組業務職能,包括開發、執行和監督有關數據的計劃、政策、方案、項目、流程、方法和程序,從而控制、保護、交互和提高數據資產的價值。數據資產管理需要充分融合業務、技術和管理,以確保數據資產保值增值。

▲數據治理實施步驟
在數據治理架構中,數據資產管理位于底層數據和數據管理與應用之間,處于承上啟下的重要地位。對上支撐數據安全管理等職能建設以價值發掘為導向的數據應用,對下實現底層數據的梳理、對接數據標準,達成企業內部“統一數據標準”的目標。
08、小結
數據治理就是實現
數據價值的過程。這個過程怎么實現?通過采集、傳輸、儲存等一系列標準化流程將原本零散的數據變成格式規范、結構統一的數據,同時對其進行嚴格規范的綜合數據監控,保證數據質量;然后對這些標準化的數據進行進一步的加工分析,形成具有指導意義的業務監控報表、業務監控模型等,來幫助企業進行輔助決策。
睿治
數據治理平臺就是由億信華辰完全自主研發的、開創性的、一站式綜合數據治理整體解決方案。睿治數據治理平臺融合
數據集成、數據交換、實時計算存儲、
元數據管理、數據標準管理、數據質量管理、主數據管理、數據資產管理、數據安全管理、數據生命周期管理十大產品模塊,打通數據治理各個環節,十大產品模塊可獨立或任意組合使用,快速滿足政府、企業各類不同的數據治理場景。

▲睿治數據治理平臺架構圖
(部分內容來源網絡,如有侵權請聯系刪除)