主數據的定義
在數據管理領域,對于主數據的概念和定義有不同的解釋和說明。參照標準和規范定義,本文采用國際數據管理協會DAMA在《DAMA數據管理知識體系指南》一書中對主數據的定義進行說明。
主數據是關于業務實體的數據,這些實體為業務交易提供關聯環境。業務規則通常規定了主數據格式和允許的取值范圍,一般組織的主數據包括當事人、產品、財務結構和位置等。
主數據是關于關鍵業務實體權威的、最準確的數據,可用于建立交易數據的關聯環境。主數據值被認為是“黃金”數據,主數據相對交易數據而言,屬性相對穩定,準確度要求更高,唯一識別。
主數據的特征
相比于其他數據,主數據具有如下特征:
1)超越部門,主數據是所有部門和所有業務過程的最大公約數據;
2)超越流程,主數據不隨具體流程而改變,而是作為完整流程的不變因素。
3)超越主題,不依賴特定業務主題卻又服務于所有業務主題的有關業務實體信息;
4)超越系統,
主數據管理作為單獨的系統存在,服務于但高于其他業務系統;
5)超越技術,主數據必須應用一種能夠為各類異構系統所兼容的技術條件,面向微服務架構為主數據的實施提供了有效的工具。
主數據的類型
主數據主要包括配置型主數據和核心主數據。
1)配置型主數據:配置型主數據,也稱為參考數據,是描述業務或核心主數據屬性分類的參考信息,會在整個組織內共享使用。一般依據國際標準、國家標準、行業標準或企業標準和相關規范等,在系統中一次性配置使用的基礎數據,例如國家、民族、性別等規范性表述。配置型主數據相對穩定,不易變化。
2)核心主數據:核心主數據指用來描述企業核心業務實體的主數據,是企業核心業務對象、交易業務的執行主體,如產品、物資、設備、組織機構、員工、供應商、客戶、會計科目等。
主數據與其他數據的關系
在《DAMA數據管理知識體系指南》一書中,將數據管理領域知識體系概括為十個大的方面,分別是數據架構管理、數據開發、數據操作管理、數據安全管理、參考數據和主數據管理、
數據倉庫和商務智能管理、文檔和內容管理、
元數據管理、
數據質量管理和
數據治理等。主數據管理與參考數據管理作為最核心的業務內容,在數據管理體系,以及提高數據質量,構建企業數據資產的過程中發揮著巨大的作用。
主數據及主數據管理往往和其他已有的概念混在一起,從而影響人們對主數據與主數據管理的本質的認識。本文將主數據與元數據、主數據與交易數據、主數據與參考數據這三個概念進行區別和聯系。
1)主數據與元數據
主數據和元數據是兩個完全不同的概念。元數據是指公司
數據資產管理的基礎,是關于“數據的數據”,例如數據類型、數據定義、數據關系等,相當于數據表格中的表頭信息,是一個相對客觀的概念。而主數據是從元數據中挑選出來的,表征公司業務運行的關鍵、通用型數據,是一個相對主觀的概念。它不僅僅只是表頭信息,而是包括實例數據。例如公司的產品列表、客戶列表、分公司地址信息等。
2)主數據與交易數據
交易數據也是基于元數據衍生而來的,反應公司實時業務記錄的數據,同樣是實例數據。主數據是相對穩定的,靜止不變或者是一段時間內靜止不變的數據,而交易數據則是實時變化的數據,往往描述的是某一個時間點所發生的交易行為。例如客戶訂單、存貨跟蹤、銷售記錄、售后事件等。
一個主數據可能會跟多個交易數據有關聯,而一個交易數據可能又會對主數據產生影響。舉例來說,航空公司中,“客戶本年度飛行里程”是一個主數據,而“客戶每次飛行記錄”,則是交易數據,當交易數據“客戶每次飛行記錄”累積到一年時,主數據“客戶本年度飛行里程”便會產生更新。
3)主數據與參考數據
參考數據是用于將其他數據進行分類或者目錄整編的數據。業務規則通常規定參考數據值是幾個允許值之一。允許值的數據集是一個值域。有些組織根據內部業務定義參考數據的值域,其他參考數據的值域可由像政府或行業標準等外部資源來定義。多組參考數據的值域可以指向同一個概念域。每個值在其所在的值域集是唯一的。用通俗的術語表述,參考數據也可以叫做數據字典、代碼集等。
企業為了進行更有效率的數據整合、數據共享和
數據分析應用,開始嘗試對參考數據進行企業或者部門層面的整合和管理,利用參考數據集記錄系統嘗試為范圍內的IT系統中的數據庫提供統一的參考數據。參考數據是對數據的解釋針對一些數據范圍和取值的數據解釋,讓人們容易讀取相關的數據。
在政務
數據應用領域,廣義的參考數據體現在參考數據集記錄系統、政務信息資源目錄系統、代碼集系統、數據圖書館等系統方面,廣義的主數據體現在數據融合建倉的過程中,一般政務數據項目會建設包括人口、法人、房屋、電子證照、社會信用、空間地理等主數據,也稱基礎庫。
在實操中,參考數據管理和標準實施一般是和主數據管理項目一起實施。
(部分內容來源網絡,如有侵權請聯系刪除)