
1、建設數據倉庫所必須
數據倉庫是由外部數據、業務數據以及文檔資料通過某些 ETL 工具得到的,如果沒有一個明確、清晰的規則,根本不可能實現這個過程。
2、幫助快速理解數倉系統
一方面,數據倉庫本質上是一個部門甚至一個公司的重要項目,開發時間冗長。中間不可避免的會產生人員流動,如果沒有清楚的元數據,那會對整個系統乃和整個項目造成重大影響;
另一方面,數據倉庫做為整個部門、公司的分析數據出口,并不僅僅對數據人員服務。DM 層對業務人員, DIM 對其他開發人員都是不可避免的。如果有清楚的元數據來說明數倉系統,就會節約雙方大量的溝通時間。
3、高效精準溝通
一方面,元數據中的管理元數據會記錄不同用戶、角色、部門的數據權限。如果有數據需要進行通知,則可以快速查詢系統進行群發郵件等方式進行溝通,從而避免了造成溝通環節的缺人和多人情況發生。
另一方面,在與產品溝通業務或是與研發溝通接口時,可以根據業務元數據,確認彼此溝通的指標、維度含義。從而在根源上避免交流的歧義。進而提高溝通效率。
4、保證
數據質量
理想的元數據做到了對數據倉庫結構的描述,倉庫模式試圖,維,度量,層次結構,到處數據庫的定義,以及
數據集市的位置和內容。
因此,我們可以很確定的判斷哪些數據是肯定準確無誤的、哪些數據是可能有問題的、哪些數據是肯定有問題的。
簡單的說就是每一個字段都應該有它的取值范圍、業務定義等信息,元數據定義好了自然就可以應用到數據質量檢測、評估等方面,進而通過數據質量管理流程真正提高企業的數據質量。
5、降低數據系統建設成本
假如元數據建設完備,所以取得信息會更準確快捷,使數據系統建設不返工或少返工,減少分析工作量,加強各方的統一理解以及溝通效率,進而使開發成本最小。
6、快速分析變更影響
因元數據被集中維護并管理引用關系,當發生變更時,可以通過
元數據管理系統以實時分析出其所影響的業務功能、應用系統、涉及人員、是否涉及監管等影響信息。
7、為未來做好準備
大數據、人工智能、數據湖、數據中臺、
商業智能等企業的戰略級應用系統能夠依賴良好的元數據管理而發揮出其應有的效果。
(部分內容來源網絡,如有侵權請聯系刪除)