企業
數據治理涉及的工作很廣,包括
數據標準、
數據質量、數據安全、數據共享機制、
元數據管理、
主數據管理等。主數據作為企業的黃金數據,對于企業信息化管理具有重要意義。本文將對主數據的概念及主數據與數據治理體系中的幾個核心部分的關系和大家做一個探討。
1、什么是主數據
主數據就是企業中多個信息系統共享和使用的數據。例如:ERP系統中有“客戶主數據”,“項目主數據”和“供應商主數據”。主數據通常是公司的關鍵資產之一。
為了更全面地回答“什么是主數據?”,我們先看一下在企業中常見的6種數據類型:
非結構化數據:可在電子郵件、白皮書、雜志文章、企業內部網站門戶、產品規格設計文件、營銷資料和PDF文件中找到的數據。
交易數據:具有歷史意義或其他系統需要分析的業務事件。通常與系統交易有關的數據,例如銷售、交貨、發票、故障單、索賠等。交易數據是使用主數據實體的單位級別的交易。與主數據不同,事務本質上是特定的時間和瞬時數據。
元數據:關于其他數據的數據。它可以存儲在正式的存儲庫中或以各種其他形式存在,例如XML文檔、報告定義、數據庫中的列描述、日志文件、連接和配置文件。
層級數據:存儲其他數據之間關系的數據。它可以作為財務系統的一部分存儲,也可以作為對現實世界關系的描述單獨存儲,例如組織結構或產品BOM。層級數據有時被視為超級主數據域,因為它對于理解和發現主數據之間的關系至關重要。
參考數據:一種特殊類型的主數據,用于對其他數據進行分類或用于將數據與企業范圍以外的信息相關聯。可以在主數據或交易數據對象之間共享參考數據,例如國家/地區、貨幣、時區、付款條件等。
主數據:企業內部的核心數據,描述開展業務所圍繞的對象。它通常不經常更改,并且可以包含經營業務所需的參考數據。主數據本質上不是事務性的,但它確實描述了事務。常見的主數據類型有:供應商主數據、客戶主數據、物料主數據、價格主數據、科目主數據、組織主數據、人員主數據等。根據企業業務類型不同,還會有產品主數據、項目主數據等細分。

圖:主數據與企業數據關系
2、主數據與元數據的關系
元數據(meta-data)是描述企業數據的相關數據,指在IT系統建設過程中所產生的有關數據定義、目標定義、轉換規則等相關的關鍵數據,包括對數據的業務、結構、定義、存儲、安全等各方面對數據的描述。
元數據可以說是企業的數據地圖,它直接反映了企業中有什么樣的數據,數據是如何存放的,例如,數據結構是什么樣子,數據與業務之間的關系是怎么樣,數據與數據之間的關系是怎么樣,數據有什么樣的安全需求,數據有什么樣的存儲需求。

比如上圖中地市表的數據模型,地市表這個實體的數據模型如何進行定義正是元數據所關心的范疇。而在數據模型設計的“城市表”中填寫了相應的城市數據,例如,北京、上海、廣州、南寧等等。這些在城市表中填充的數據,正是組織中國地理協會的主數據,因為這些數據是中國地理協會這個組織的關鍵業務實體,它為組織的業務開展提供關聯環境,而且它可能在企業業務開展過程中被反復引用。針對這些核心關鍵數據,組織和企業無論從數據的質量、一致性、可用性、管理規范等方面都應該有著最嚴格的數據要求。
主數據跟元數據的關系,舉個例子的話就是一本書,主數據就是書里邊的正文,實際有用的數據,元數據就是書的目錄,是索引,方便你找到主數據的。
3、主數據與數據標準的關系
沒有規矩不成方圓,數據標準是數據治理或整體數據化建設的核心。在
主數據管理體系中,主數據模型、主數據管理規范、主數據共享技術規范都可以看作數據標準。我們希望將所有數據生產線路上的規范都統一納入數據標準管理體系。
同時,數據生產過程中的每個環節都需要數據標準的支撐。
數據按照數據層級劃分,如下表所示。

數據按照數據生產過程劃分,如下表所示。
4、主數據與數據質量的關系
很多失敗的
數據應用,第一理由都歸集為數據質量問題導致最后的交付結果數據不準確,以致業務部門最終無法采納。那么,什么樣的問題才算作數據質量問題呢?當數據中很多字段存在大量的空數據時,這是由于數據質量存在問題,還是由于數據模型設計得不合理?
主數據管理最核心的價值在于提升基礎數據的整體數據質量,保證數據的及時性和準確性。
5、主數據與數據安全的關系
主數據是企業的黃金數據,其
數據價值不言而喻,所以如何保證主數據的使用安全是我們必須關注的內容。主數據應當完整納入數據安全管理體系,從
數據存儲安排、防止竊取和泄露等諸多方面予以全方位的保障。
6、主數據與數據倉庫的關系
主數據管理系統與數據倉庫系統是相輔相成的兩個系統,但二者絕不是重復的,也不是互斥的。它們有很多共同之處:
首先二者對企業都具有相同的價值,可以減少數據冗余和不一致性、提升對數據的洞察力,二者都是跨部門的集中式系統;
其次二者都依賴很多相同的技術手段,都會涉及到 ETL 技術、都需要元數據管理、都強調數據質量;
第三就是二者建設手段類似,都需要數據治理的規范作為指導、都需要不同系統、不同部門的協作、需要統一的安全策略。
但是,主數據管理系統和數據倉庫 / 決策支持系統二者之間也存在很多不同:
處理類型不同:主數據管理 (MDM) 系統是偏交易型的系統,它為各個業務系統提供聯機交易服務,系統的服務對象是呼叫中心、B2C、CRM 等業務系統;而數據倉庫是屬于分析型的系統,面向的是分析型的應用,是在大量歷史交易數據的基礎上進行多維分析,系統的使用對象是各層領導和業務分析、市場銷售預測人員等;
實時性不同:與傳統的數據倉庫方案的批量 ETL 方式不同,主數據管理系統在數據初始加載階段要使用 ETL,但在后續運行中要大量依賴實時整合的方式來進行主數據的集成和同步;
數據量不同:數據倉庫存儲的是大量的歷史數據和各個維度的匯總數據,可能會是海量的,而 MDM 存儲的僅僅是客戶和產品等信息。
雖然主數據管理系統和數據倉庫系統異同共存,但是二者卻有著緊密的聯系,并且可以互為促進、互為補充。舉例而言,數據倉庫系統的分析結果可以作為衍生數據輸入到 MDM 系統,從而使 MDM 系統能夠更好地為操作型 CRM 系統服務。
(部分內容來源網絡,如有侵權請聯系刪除)