在理解
主數(shù)據(jù)、解決數(shù)據(jù)問題之前,首先,我們要明確到底有哪些數(shù)據(jù)或哪幾類數(shù)據(jù)?當(dāng)然,數(shù)據(jù)按照不同維度、不同語境可以分為不同的類,比如結(jié)構(gòu)化和非結(jié)構(gòu)化化、交易和非交易數(shù)據(jù)、行業(yè)數(shù)據(jù)和公司數(shù)據(jù)等。從
數(shù)據(jù)治理或信息化項(xiàng)目的角度,數(shù)據(jù)一般分為:數(shù)據(jù)元、元數(shù)據(jù)、主數(shù)據(jù)、參考數(shù)據(jù)、常規(guī)數(shù)據(jù)等。
數(shù)據(jù)(data):根據(jù)《信息技術(shù)數(shù)據(jù)元的規(guī)范和標(biāo)準(zhǔn)化》(GB/T18391.1-2002),數(shù)據(jù)是指對(duì)事實(shí)、概念或指令的一種形式化標(biāo)示,適用于以人工或自動(dòng)方式進(jìn)行通信、解釋和處理。
數(shù)據(jù)元(data element)指用一組屬性描述定義、標(biāo)識(shí)、表示和允許值的數(shù)據(jù)單元。在特定的語境中,可以認(rèn)為是不可再分的最小數(shù)據(jù)單元,也可以直觀理解為數(shù)據(jù)庫表的列,對(duì)象、特征、表達(dá)是數(shù)據(jù)元的三要素,比如“今天股市收盤是2500點(diǎn)”數(shù)據(jù)元,其中“今天股市”就是對(duì)象,“收盤”是特性,“2500”是表達(dá)。
元數(shù)據(jù)(MetaData)指描述數(shù)據(jù)的數(shù)據(jù),也指幫助查找、存取、使用和管理信息資源的信息。為便于理解元數(shù)據(jù)和數(shù)據(jù)元,作者舉個(gè)例子,比如我們要向中證金融報(bào)送兩融數(shù)據(jù),數(shù)據(jù)報(bào)送接口規(guī)范中有許多表,每個(gè)表有許多列,每個(gè)列有填報(bào)要求比如類型、是否為空。每個(gè)填報(bào)字段可以認(rèn)為是數(shù)據(jù)元,而每個(gè)填報(bào)字段的填報(bào)要求可以認(rèn)為是該字段的元數(shù)據(jù),而每個(gè)字段可以認(rèn)為是該表的元數(shù)據(jù)。也即數(shù)據(jù)元和元數(shù)據(jù)本身也是數(shù)據(jù),在不同的上下文有不同的定義和理解,本身都是個(gè)相對(duì)的概念,意識(shí)到這點(diǎn)才能很好理解兩者的關(guān)系。現(xiàn)實(shí)中,元數(shù)據(jù)常見用于描述數(shù)據(jù)庫中所有數(shù)據(jù)的語境,而數(shù)據(jù)元通常用在行業(yè)標(biāo)準(zhǔn)制定。
參考數(shù)據(jù)(reference data)指數(shù)據(jù)可能的取值范圍及其解釋,也即我們常說的數(shù)據(jù)字典。數(shù)據(jù)字典雖然很好理解,但行業(yè)現(xiàn)實(shí)中,由于每個(gè)系統(tǒng)有不同的數(shù)據(jù)字典,甚至同一系統(tǒng)內(nèi)也有不同數(shù)據(jù)字典,而且沒有統(tǒng)一標(biāo)準(zhǔn),間接造就了大量的數(shù)據(jù)孤島,也需要加強(qiáng)治理。
常規(guī)數(shù)據(jù)(作者自己定義),是與每日業(yè)務(wù)開展或每個(gè)業(yè)務(wù)人員最為關(guān)注的那些數(shù)據(jù),比如交易、審計(jì)、采購訂單、銷售訂單、報(bào)表等等數(shù)據(jù),
主數(shù)據(jù)(master data),通常是不隨或很少隨時(shí)間變化的靜態(tài)數(shù)據(jù),并且與個(gè)體活動(dòng)或流程無關(guān),比如客戶、證券標(biāo)的、金融產(chǎn)品、會(huì)計(jì)科目等信息,這些信息構(gòu)成了公司的業(yè)務(wù)。主數(shù)據(jù)掌控交易數(shù)據(jù)如何被處理并決定著決策的精準(zhǔn)度。
主數(shù)據(jù)管理,本質(zhì)上是各業(yè)務(wù)人員利用IT工具進(jìn)行協(xié)作,來協(xié)調(diào)、清理、發(fā)布和保護(hù)企業(yè)需要共享的數(shù)據(jù)資產(chǎn),保證企業(yè)核心信息的一致、準(zhǔn)確和安全。主數(shù)據(jù)也是大數(shù)據(jù)建設(shè)中的重點(diǎn)內(nèi)容。
元數(shù)據(jù)和參考數(shù)據(jù)一般與系統(tǒng)或數(shù)據(jù)庫底層設(shè)計(jì)有關(guān),相對(duì)變化頻率非常低;而主數(shù)據(jù)與技術(shù)有關(guān),與業(yè)務(wù)關(guān)系更為密切,相對(duì)變化頻率較低,也是常規(guī)數(shù)據(jù)的基礎(chǔ);而常規(guī)數(shù)據(jù)則變化頻繁,只要展業(yè)基本都會(huì)累加,且實(shí)時(shí)性要求較高。基于以上分類和分析,由于主數(shù)據(jù)與業(yè)務(wù)聯(lián)系緊密且是一般數(shù)據(jù)基礎(chǔ),加上又有一定變化(頻率很低),數(shù)據(jù)治理的重點(diǎn)領(lǐng)域是上述四類數(shù)據(jù)中的主數(shù)據(jù)。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除)