隨著Hadoop技術的提升,數據如何進來,如何整合,開展什么樣的應用都已經有了成熟的案例,可是,同傳統數倉時代一樣,垃圾進垃圾出,如何破?相比傳統數倉時代,進入Hadoop集群的數據更加的多樣、更加的復雜、量更足,這個數倉時代都沒有處理好的事情,如何能夠在大數據時代處理好,這是所有大
數據應用者最最期盼的改變,也是大數據平臺建設者最有挑戰的難題:
數據治理難的不是技術,而是流程,是協同,是管理。

數據治理并不等同于數據管理,而只是數據管理的頂層執行層面。數據管理指規劃、控制和提供數據及信息資產,發揮數據和信息資產的價值,強調在企業間或企業內部進行。數據治理是對
數據資產管理活動行使權力和控制的活動集合(規劃、監控和執行)。數據治理制定正確的原則、政策、流程、操作規程,確保以正確的方式對數據和信息進行管理。
數據資產管理是業務部門和IT部門的共同職責,需要由業務部門和IT部門分別或共同制定相關決策,如業務運營模型、數據治理模型、企業信息模型、業務規范、信息規范、數據庫架構、
數據倉庫/商務智能架構、元數據架構、技術元數據、數據安全管理等。
對于一個企業來說,把數據作為資產,才是建設大數據的最終目的,而不是僅僅是因為Hadoop架構帶來性價比和未來的擴展性。當一個企業把數據作為資產,他就像管理自己名下存折、信用卡一樣,定期梳理,無時無刻不關心資產的變化情況,關注資產的質量。
而資產目錄就是管理資產的形式和手段,他像菜單一樣對企業的資產進行梳理、分門別類,提供給使用者;使用者通過菜單,點選自己需要的數據,認可菜單對應的后端處理價值,后廚通過適當的加工,推出相應的數據服務;這是一個標準的流程,而這些流程之上,附著一整套數據管理目標和流程。
大數據平臺以數據資產目錄為核心,將元數據、
數據標準、
主數據、
數據質量、數據生命周期、數據輪廓等信息在邏輯層面關聯起來,在管理層面上整合成統一的整體,構建起數據管理體系,全面的支持數據服務等具體應用。
根據DAMA(國際數據管理協會)的定義,數據治理(Data Governance)是指對數據資產的管理活動行使權力和控制的活動集合(規劃、監控和執行)。數據治理是識別、管理和解決幾種不同類型數據相關問題的手段,包括數據質量問題、數據命名和定義沖突、數據安全等問題。
(部分內容來源網絡,如有侵權請聯系刪除)