在數(shù)據(jù)治理中,我們總是會(huì)聽到元數(shù)據(jù)和主數(shù)據(jù),我們今天就可以來說說什么是元數(shù)據(jù),什么是主數(shù)據(jù)。

1、元數(shù)據(jù)(metadata)
描述數(shù)據(jù)的數(shù)據(jù),對數(shù)據(jù)及信息資源的描述性信息
大部分屬性字段就是元數(shù)據(jù)。比如,性別,國籍,出生省份等。這個(gè)是最接近自然意義的的數(shù)據(jù)。
(1)在
數(shù)據(jù)倉庫領(lǐng)域中,元數(shù)據(jù)按用途分成:
業(yè)務(wù)元數(shù)據(jù):提供基于用戶的信息,如記錄數(shù)據(jù)項(xiàng)的業(yè)務(wù)描述信息的元數(shù)據(jù)能幫助用戶使用數(shù)據(jù)
技術(shù)元數(shù)據(jù):支持系統(tǒng)對數(shù)據(jù)的管理和維護(hù),如關(guān)于數(shù)據(jù)項(xiàng)存儲(chǔ)方法的元數(shù)據(jù)能支持系統(tǒng)以最有效的方式訪問數(shù)據(jù)。
(2)具體來說,在數(shù)據(jù)倉庫系統(tǒng)中,元數(shù)據(jù)機(jī)制主要支持以下五類系統(tǒng)管理功能:
描述哪些數(shù)據(jù)在數(shù)據(jù)倉庫中;
定義要進(jìn)入數(shù)據(jù)倉庫中的數(shù)據(jù)和從數(shù)據(jù)倉庫中產(chǎn)生的數(shù)據(jù);
記錄根據(jù)業(yè)務(wù)事件發(fā)生而隨之進(jìn)行的數(shù)據(jù)抽取工作時(shí)間安排;
記錄并檢測系統(tǒng)數(shù)據(jù)一致性的要求和執(zhí)行情況;
衡量
數(shù)據(jù)質(zhì)量。
(3)基于應(yīng)用,可以將元數(shù)據(jù)分成以下的若干種。
數(shù)據(jù)結(jié)構(gòu):數(shù)據(jù)集的名稱、關(guān)系、字段、約束等;
數(shù)據(jù)部署:數(shù)據(jù)集的物理位置;
數(shù)據(jù)流:數(shù)據(jù)集之間的流程依賴關(guān)系(非參照依賴),包括數(shù)據(jù)集到另一個(gè)數(shù)據(jù)集的規(guī)則;
質(zhì)量度量:數(shù)據(jù)集上可以計(jì)算的度量;
度量邏輯關(guān)系:數(shù)據(jù)集度量之間的邏輯運(yùn)算關(guān)系;
ETL過程:過程運(yùn)行的順序,并行、串行;
數(shù)據(jù)集快照:一個(gè)時(shí)間點(diǎn)上,數(shù)據(jù)在所有數(shù)據(jù)集上的分布情況;
星型模式元數(shù)據(jù):事實(shí)表、維度、屬性、層次等;
報(bào)表語義層:報(bào)表指標(biāo)的規(guī)則、過濾條件物理名稱和業(yè)務(wù)名稱的對應(yīng);
數(shù)據(jù)訪問日志:哪些數(shù)據(jù)何時(shí)被何人訪問;
質(zhì)量稽核日志:何時(shí)、何度量被稽核,其結(jié)果;
數(shù)據(jù)裝載日志:哪些數(shù)據(jù)何時(shí)被何人裝載
(4)元數(shù)據(jù)的基本管理
元模型管理
通過可視化的用戶體驗(yàn)實(shí)現(xiàn):
a.元模型添加、刪除、修改、發(fā)布等維護(hù)功能;
b.了解已有元模型的分類、統(tǒng)計(jì)、使用情況、變更追溯
c.每個(gè)元模型的生命周期管理等等。
元數(shù)據(jù)管理
元數(shù)據(jù)管理實(shí)現(xiàn)針對元數(shù)據(jù)的基本管理功能。
元數(shù)據(jù)的添加、刪除、修改屬性等維護(hù)功能;
元數(shù)據(jù)之間關(guān)系的建立、刪除和跟蹤等關(guān)系維護(hù)功能;
提供元數(shù)據(jù)發(fā)布流程管理,可以更好地管理和跟蹤元數(shù)據(jù)的整個(gè)生命周期;
元數(shù)據(jù)自身質(zhì)量核查、元數(shù)據(jù)查詢、元數(shù)據(jù)統(tǒng)計(jì)、元數(shù)據(jù)使用情況分析、元數(shù)據(jù)變更、元數(shù)據(jù)版本和生命周期管理等功能。
元數(shù)據(jù)分析
元數(shù)據(jù)分析功能主要實(shí)現(xiàn)針對元數(shù)據(jù)的基本分析功能。包括血緣分析(血統(tǒng)分析)、影響分析、實(shí)體關(guān)聯(lián)分析、實(shí)體影響分析、主機(jī)拓?fù)浞治觥⒅笜?biāo)一致性分析等。
2、主數(shù)據(jù)(Master Data)
主數(shù)據(jù)(MD Master Data)指系統(tǒng)間的共享數(shù)據(jù)(例如,客戶、供應(yīng)商、賬戶和組織部門相關(guān)數(shù)據(jù))。與記錄業(yè)務(wù)活動(dòng),波動(dòng)較大的交易數(shù)據(jù)相比,主數(shù)據(jù)(也稱基準(zhǔn)數(shù)據(jù))變化緩慢。在正規(guī)的關(guān)系數(shù)據(jù)模型中,交易記錄(例如,訂單行項(xiàng))可通過關(guān)鍵字(例如,訂單頭或發(fā)票編號和產(chǎn)品代碼)調(diào)出主數(shù)據(jù)。主數(shù)據(jù)必須存在并加以正確維護(hù),才能保證交易系統(tǒng)的參照完整性。
從報(bào)告或維度建模角度看,主數(shù)據(jù)指基于其組織或配置指標(biāo)的維度或?qū)哟危皇菍?shí)際情況或其自身測量結(jié)果。例如,收入、成本和利潤是實(shí)際情況,而時(shí)間、地點(diǎn)、客戶和供應(yīng)商是維度。
主數(shù)據(jù)和元數(shù)據(jù)的關(guān)系
主數(shù)據(jù)跟元數(shù)據(jù)的關(guān)系,舉個(gè)例子的話就想是一本書,主數(shù)據(jù)就是書里邊的正文,實(shí)際有用的數(shù)據(jù),元數(shù)據(jù)就是書的目錄,是索引,方便你找到主數(shù)據(jù)的。
好啦!大家明白了什么是主數(shù)據(jù)和元數(shù)據(jù)了嗎!
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)