- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2020-07-29來源:CSDN瀏覽數:487次
什么是數據治理?
答:又叫”數據管控”。引用《DAMA 數據管理知識體系指南》一書給出的定義:數據治理是對數據資產管理行使權力和控制的活動集合(規劃、監控和執行)。數據治理職能指導其他數據管理職能如何執行。
數據元:通過名稱、格式、長度、定義值域等一系列屬性描述的數據單元。
代碼集:數據元的取值范圍。
數據元類目:按照標準規范對數據元進行分類。
元數據:對數據資源的描述性信息(數據的數據)。例如數據表的字段就是描述這些數據表中數據的元數據。
元模型:定義各種元數據的結構以及元數據間的關系。
元數據(Metadata)?使得用戶可以掌握數據的歷史情況,如數據從哪里來?流通時間有多長?更新頻率是多大?數據元素的含義是什么?對它已經進行了哪些計算、轉換和篩選等等。在需求不確定情況下,在瞬間萬變的商業環境下,元數據可以更好的支持需求的變化,降低項目風險。
元數據按照適用場景可有以下兩種區分:
元數據貫徹于建立數據倉庫的全過程,不僅僅只是TL過程。
元數據標準?不統一,各廠商、各軟件采用不同的元數據標準。業界需要統一的標準,以便各個軟件系統之間可以相互交換元數據。CWG 1.0 (Common Warehouse Metamodel Version 1.0)?就是一種,其定義一個描述數據源、數據目的、轉換、分析的元數據框架,以及定義建立和管理數據倉庫的過程和操作,提供使用信息的繼承。目前宣布支持CWM的廠商包括:IBM、Oracle、Hyperion、Dimension EDI、Genesis IONA、HP、NCR和Unisys等。
CWM基于3個工業標準:
對每類數據進行治理時,關注點、方法以及效果都不同,需要區別對待。
| 數據分類 | 描述 |
|---|---|
| 主數據(Master Data) | 關于業務實體的數據 |
| 事務數據(Transactional Data) | 業務運營過程中的內部或者外部事件或者交易記錄 |
| 參考數據(Reference Data) | 用于將其他數據進行分類或者目錄整編的數據 |
| 元數據(Metadata) | 描述數據的數據 |
| 統計分析數據(Analytical Data) | 指對企業業務活動進行統計分析的數據 |
主數據?關注的是”人”和”物”,主數據管理是數據治理領域一個專門的話題,其主要目的是對關鍵業務實體(如員工、客戶、產品、供應商等)建立統一視圖,讓客觀世界里本是同一個人或物,在數據世界里也能做到唯一識別,而不是在不同系統、不同業務中成為不同的人或物。
事務數據?關注的是”事”,事務數據沒有形成單獨的數據治理領域,由于事務數據是BI分析的基礎,因此往往在數據質量管理中重點關注。
參考數據?是更細粒度的數據,是對”人”“事”“物”的某些屬性進行規范性描述的,對參考數據的管理一般會與主數據管理同時進行,或與BI數據質量管理同時進行,因為指標維度和維值直接影響到BI數據質量。
元數據?是一個包羅萬象的概念,其本質是為數據提供描述,所以任何數據都有元數據。數據治理領域的元數據,更多是指BI、數據倉庫這個范疇內的元數據(國際上有Common Warehouse Meta-model規范),此外還有信息資源管理的元數據(如Dublin core協議)、地理信息元數據、氣象元數據等等。正因為如此廣泛,也造成了從業者對其有極高的預期以及實踐后的極大失落。
現在極少談”元數據”,而是談”數據定義”,談數據必談定義,但卻又不將其作為專門一類數據來管理,在數據治理領域單獨做元數據管理,收效甚微。 主要原因有兩點:
統計分析數據?,目前BI系統建設的主要作用就是做各種指標和報表的計算和展示。統計分析數據往往是數據治理的重點,統計分析數據的數據流分析、統計分析數據的數值的波動性、平衡性監控,幾乎是各個企業做數據治理的必備應用。