元數(shù)據(jù)管理要符合企業(yè)數(shù)據(jù)現(xiàn)狀,要能支撐企業(yè)數(shù)據(jù)人員分析數(shù)據(jù)的需要,元數(shù)據(jù)是企業(yè)數(shù)據(jù)資產(chǎn)的最原始詞典,我們需要從這本詞典中獲取到準(zhǔn)確的數(shù)據(jù)信息,準(zhǔn)確、便捷、深度、廣度是元數(shù)據(jù)管理努力的方向。

要實(shí)現(xiàn)企業(yè)元數(shù)據(jù)管理需從兩個(gè)方面考慮,一是盤(pán)點(diǎn)企業(yè)數(shù)據(jù)情況,搞清楚要管理哪些元數(shù)據(jù)以及這些元數(shù)據(jù)在什么地方,以何種形態(tài)存儲(chǔ),他們之間有有著怎樣的聯(lián)系。二是建模,這里的建模是建立元數(shù)據(jù)的模型及元模型,要抽象出企業(yè)的元模型,建立個(gè)元模型之間的邏輯關(guān)系。總結(jié)的講盤(pán)點(diǎn)企業(yè)數(shù)據(jù)資產(chǎn)和建立企業(yè)元模型是元數(shù)據(jù)管理的兩個(gè)基本步驟。下面我們展開(kāi)的講一下這兩點(diǎn):
企業(yè)數(shù)據(jù)資產(chǎn)盤(pán)點(diǎn),首先要把元數(shù)據(jù)建設(shè)的定位定義清楚,短期解決什么問(wèn)題,長(zhǎng)期達(dá)到什么目的,基于短期目標(biāo)要重點(diǎn)細(xì)化。舉個(gè)例子要實(shí)現(xiàn)企業(yè)物理模型的全面管理,實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)變更一體化管理這個(gè)短期目標(biāo),那么就需要盤(pán)點(diǎn)企業(yè)有多少應(yīng)用系統(tǒng),每個(gè)應(yīng)用系統(tǒng)有多少個(gè)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)的種類(lèi)有什么,哪些是業(yè)務(wù)數(shù)據(jù)表,哪些是垃圾數(shù)據(jù)表,每個(gè)數(shù)據(jù)字段的含義是否完整,每個(gè)系統(tǒng)那個(gè)業(yè)務(wù)部門(mén)使用,哪些管理員進(jìn)行運(yùn)維,企業(yè)的數(shù)據(jù)變更是否有流程驅(qū)動(dòng)等。將以上信息分為兩大類(lèi),一類(lèi)是數(shù)據(jù)模型本身的元數(shù)據(jù)信息,一類(lèi)是支撐數(shù)據(jù)模型管理的元數(shù)據(jù)信息,這兩類(lèi)信息都是需要盤(pán)點(diǎn)的內(nèi)容。
元數(shù)據(jù)建模,元數(shù)據(jù)建模是對(duì)企業(yè)要管理的元數(shù)據(jù)進(jìn)行結(jié)構(gòu)化、模型化。元模型的構(gòu)建要一般要參考公共倉(cāng)庫(kù)元模型CWM,但也不能照搬CWM,否則構(gòu)建的元模型太過(guò)臃腫,不夠靈活。在構(gòu)建元模型過(guò)程中不但要關(guān)心模型的結(jié)構(gòu)更要關(guān)系模型間的關(guān)系,每個(gè)模型在元數(shù)據(jù)的世界里是一個(gè)獨(dú)立的個(gè)體,個(gè)體和個(gè)體之間的關(guān)系賦予了模型間錯(cuò)綜復(fù)雜的關(guān)系圈,這些關(guān)系的創(chuàng)建往后衍生會(huì)支撐數(shù)據(jù)圖譜或知識(shí)圖譜的構(gòu)建。再拿數(shù)據(jù)資產(chǎn)盤(pán)點(diǎn)的例子來(lái)講,我們要建立數(shù)據(jù)庫(kù)元模型、表元模型、字段元模型、管理員元模型,其中庫(kù)-表-字段是通過(guò)組合關(guān)系來(lái)構(gòu)建的,而表-表、字段-字段是通過(guò)依賴關(guān)系來(lái)構(gòu)建的。通過(guò)這樣的關(guān)系構(gòu)建就能將企業(yè)中的所有有交互的數(shù)據(jù)形成一個(gè)錯(cuò)綜復(fù)雜龐大的數(shù)據(jù)關(guān)系網(wǎng)絡(luò),
數(shù)據(jù)分析人員就可以基于這張網(wǎng)絡(luò)進(jìn)行各種信息的挖掘。
(部分內(nèi)容來(lái)源網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除)