日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

必須搞懂元數據相關的9個術語和名詞

時間:2022-12-21來源:小億瀏覽數:562

元數據被認為是數據治理的基石,但關于元數據相關的概念,很多人不是那么清楚,今天就和大家詳解元數據相關的術語。當然,與元數據相關的概念非常多,以下僅羅列幾個常見的。

01、元數據
1.名詞解釋
元數據最簡單的定義是描述數據的數據。這里有兩個關鍵點,一個是數據,一個是描述數據。企業中一般的可進行管理的數據如下表:

我們再來舉個通俗的例子,一本書的封面和目錄向我們展示了這樣的元數據信息:圖書名稱、作者姓名、出版商和版權細節、圖書的提綱、標題、頁碼等。

2. 主要作用
在數據治理中,元數據是對數據的描述,存儲著數據的描述信息。我們可以通過元數據管理和檢索我們想要的“書”。可見元數據是用來描述數據的數據,讓數據更容易理解、查找、管理和使用。
元數據是建設數據倉庫的基礎,是構建企業數據資源全景視圖的基礎,清晰的血緣分析、影響分析、差異分析、關聯分析、指標一致性分析等是數據資產管理的重要一環。

如果說數據是物料,那么元數據就是倉庫里的物料卡片;如果說數據是文件夾,那么元數據就是夾子的標簽;如果說數據是書,那么元數據就是圖書館中的圖書卡。

02、元模型

1.名詞解釋
和元數據管理相關的另一個重要概念是元模型,定義元數據的屬性、關系的模型叫做元模型,每類元數據都屬于一個元模型。
比如,表模型里定義了表的屬性有“注釋”、“是否系統表”、“是否臨時表”、“所有者”等(圖1);定義了表由索引、外鍵、表分區、字段等組成(圖2);定義了表受表輸出組件、存儲過程、表等的影響(圖3)。

圖1

圖2

圖3

2.主要作用
有了元模型,就能根據元模型來采集元數據信息。要實現企業元數據管理,需要定義一個符合存儲企業數據現狀的元數據模型,且這個模型有不同粒度和層次的元模型,有了層次和粒度的劃分,未來元數據進行批量管理后就可以靈活的從不同維度進行元數據分析,如企業的數據地圖、數據血統都是基于此實現的。

我們試著把企業中的技術元數據、業務元數據、操作元數據、管理元數據進行元模型的梳理,如下圖所示:

將以上梳理出的信息通過UML建模處理就得到了元模型,在元模型中有包、類、屬性、繼承、關系。創建元模型的時候也可以參考CWM(公共倉庫元模型),CWM定義了一套完整的元模型體系結構,用于數據倉庫構建和應用的元數據建模。

03、父子關系

1.名詞解釋
子類元模型可繼承父類元模型所有的屬性,是將所有一類元模型將相同的屬性抽取出來,形成一個父類元模型。例如:父類為哺乳動物,而人、貓、狗都是子類。
2.主要作用
元模型中的父子關系可幫助我們快速建立元數據間的關聯,便于元數據的維護;有父子關系的元數據之間的映射,可確保查詢時的高性能。

04、組合關系

1.名詞解釋
描述組合端模型由被組合端模型所組成,如:物理表模型是由字段模型組成,報表是由報表字段組成,主題域由維表和主題集組成。元數據的組合關系其實就是包含關系,比如表下面有字段、主鍵,那么表就是包含字段和主鍵的。

2.主要作用
在元數據采集的過程中,會根據采集掛載點的元數據對應元模型的組合關系,將所有元模型對應的元數據都采集過來。在元數據分析時,元數據節點展開后顯示的元數據由元模型的組合關系決定。

05、依賴關系

1.名詞解釋
描述模型與模型之間的引用關聯關系,如:報表用到了主題表,則報表依賴主題表;視圖用戶到表,則視圖依賴于表。元數據的依賴關系類似于引用的關系,比如視圖可以根據表和視圖創建,那么視圖就是依賴于表和視圖的。

2.主要作用
元數據的血緣、影響、全鏈分析都是基于依賴進行分析,主要是通過采集表、視圖的創建、存儲過程和主外鍵這些信息進行解析后來構建依賴關系,各種分析出來的效果會根據元數據之間的依賴關系來進行連線。

06、血緣分析

1.名詞解釋
血緣分析是從某一個元數據作為起點,往回追溯數據處理過程。血緣分析是建立在元數據整合的基礎上,記錄數據治理過程中的血緣關系,基于這些血緣關系信息,可以往回追溯其數據處理過程,并通過圖形化的方式展示數據從哪里來,經歷了哪些加工。

比如,數據A經過ETL處理生成了數據B,那么我們就說數據A與B有著血緣關系,且數據A是數據B的上游數據,同時數據B是數據A的下游數據。按血緣對象來分,可分為系統級血緣、表級血緣、字段(列)級血緣。不管是結構化數據還是非結構化數據,都必定存在數據血緣關系。

2.主要作用
數據血緣分析是元數據管理的重要應用之一,其梳理系統、表、視圖、存儲過程、ETL、程序代碼、字段等之間的關系,并采用圖數據庫進行可視化展示。簡單地說就是通過可視化展示數據是怎么來的,經過了哪些過程、階段及計算邏輯。數據血緣分析可以提高數據應用的可信度,為數據質量問題的追溯提供了技術上的保障。

07、影響分析

1.名詞解釋
影響分析是從某一個元數據出發,尋找依賴該元數據處理過程的元數據或者實體。
2.主要作用
影響分析幫助用戶迅速了解分析對象的下游數據信息,快速掌握元數據變更可能造成的影響,以便更有效的評估變化該元數據帶來的風險,從而幫助用戶高效準確地對數據資產進行清理、維護與使用。

08、全鏈分析

1.名詞解釋
全鏈分析是以某個元數據為目標節點,其前后與其有關系的所有元數據,其前反應數據的來源,其后反應數據的處理過程。

2.主要作用
全鏈分析用來分析指定元數據前后與其有關系的所有元數據,不僅反映了元數據的來源與加工過程,也反映了元數據的使用情況,使用全鏈分析可清晰地了解該元數據的來龍去脈。

09、數據地圖

1.名詞解釋
以拓撲圖的形式展現各類元數據或實體、數據處理過程元數據進行分層次的的圖形化展現。
下圖是一個數據地圖,它顯示企業有3個系統域,風險平臺、內部管理平臺和業務平臺。“風險平臺”系統域下有反洗錢系統、內控合規系統和全面風險管控三個系統;“內部管理平臺”系統域下有財務系統、檔案系統和運營管理三個系統;“業務平臺”系統域下有貸記卡系統、擔保系統和國結系統三個系統。檔案系統會用到運營管理和擔保系統的數據。財務系統會用到內控合規系統的數據,檔案系統會用到擔保系統的數據等等。

2.主要作用
數據地圖對數據的流轉分布關系進行可視化展現,通過不同層次的圖形展現粒度控制,滿足業務使用、數據管理、開發運維不同應用場景的圖形查詢和輔助分析需求。

像睿治數據治理平臺中的元數據庫是分系統對系統各元數據進行展示,而數據地圖則是從宏觀層面展示各系統間關系。數據地圖中的系統節點可以和元數據掛載點綁定。構建數據地圖,首先我們可以將企業各個業務系統或從業務角度或從管理角度劃分給不同的系統域,再通過實際的業務或者數據走向,來定義各系統之間的關系,最終形成企業級數據地圖。
(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢