日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

首頁 行業百科 數據治理之元數據管理

數據治理之元數據管理

|億信華辰大數據知識庫2022-07-31

數據治理之元數據管理

元數據(Meta Date),關于數據的數據或者叫做用來描述數據的數據或者叫做信息的信息。這些定義都很是抽象,我們可以把元數據簡單的理解成,最小的數據單位。元數據可以為數據說明其元素或屬性(名稱、大小、數據類型、等),或其結構(長度、字段、數據列),或其相關數據(位于何處、如何聯系、擁有者)。

一、什么是元數據?

元數據(Meta Date),關于數據的數據或者叫做用來描述數據的數據或者叫做信息的信息。這些定義都很是抽象,我們可以把元數據簡單的理解成,最小的數據單位。元數據可以為數據說明其元素或屬性(名稱、大小、數據類型、等),或其結構(長度、字段、數據列),或其相關數據(位于何處、如何聯系、擁有者)。


二、元數據分類
1、業務元數據
主要包括業務術語、信息分類、指標定義、業務規則等。
2、技術元數據
數據結構、數據處理細節方面的技術化描述,主要包括源系統接口規范、數據倉庫結構的描述(接口信息、表信息、程序信息等)以及經營分析數據處理過程的描述等。
3、管理元數據
主要包括人員角色、崗位職責、管理流程等信息。
4、安全元數據
主要包括訪問安全、權限控制、分級管理、隱私控制、流程約束等信息。
5、稽核元數據

主要包括數據完整性和一致性檢查、數據采集日志追蹤、稽核規則、稽核流程、預警通知規則(數據質量)等信息。


三、元數據的作用
元數據是網絡信息資源描述的重要工具,可以用于網絡信息資源管理的各個方面,包括信息資源的建立、發布、轉換、使用、共享等。
1、定位作用:由于網絡信息資源沒有具體的實體存在,因此,明確它的定位至關重要。元數據包含有關網絡信息資源位置方面的信息,因而由此便可確定資源的位置之所在,促進了網絡環境中信息對象的發現和檢索。此外,在信息對象的元數據確定以后,信息對象在數據庫或其他集合體中的位置也就確定了,這是定位的另一層含義。
2、描述作用:根據元數據的定義,它最基本的功能就在于對信息對象的內容和位置進行描述,從而為信息對象的存取與利用奠定必要的基礎。
3、評估作用:元數據提供有關信息對象的名稱、內容、年代、格式、制作者等基本屬性,使用戶在無需瀏覽信息對象本身的情況下,就能夠對信息對象具備基本了解和認識,參照有關標準即可對其價值進行必要的評估,作為存取利用的參考。
4、選擇作用:根據元數據所提供的描述信息,參照相應的評估標準,結合使用環境,用戶便能夠做出對信息對象取舍的決定,選擇適合用戶使用的資源。

5、搜尋作用:元數據提供搜尋的基礎,在著錄的過程中,將信息對象中的重要信息抽出并加以組織,賦予語意,并建立關系,使檢索結果更加準確,從而有利于用戶識別資源的價值,發現其真正需要的資源。


四、元數據管理的難點
1、元模型的構建
元模型其核心結構要穩定,因為元數據的建設不是一蹴而就的,需要慢慢地積累和演變,因此存儲元數據的元模型結構一定要抽象出穩定的結構,比如:針對關系抽象出組合關系和依賴關系,針對模型要抽象出每一類型元數據父類或基類以方便其靈活擴展。
2、元數據間的關系
從元數據應用的角度來看,光分析元數據的結構對數據分析人員和數據應用的價值還不是那么突出。元數據管理的價值主要在其關系的豐富程度,舉個不恰當的例子,猶如一個人,如果其社會關系足夠豐富,那么其處理各種事情就游刃有余,元數據也類似數據分析和應用,一定是從其關系中探尋出數據的價值,進而知道業務或進行數據創新,從長期的實踐中發現,基于信息項或字段的元數據關系構建是最穩定的。
3、數據識別

要確定要管理哪些元數據,按元數據的定義來看,只要能描述數據的數據都能作為元數據進行管理,但從價值角度講一定要找到對數據業務、數據運維、數據運營、數據創新帶來幫助的元數據進行管理,避免眉毛胡子一把抓。一般企業元數據建設都是圍繞著源系統、數據平臺、數據集市、數據應用中的數據模型、數據庫、表、字段、報表(指標存儲字段)、字段和字段間的數據關系進行管理。圍繞這條主線,進一步胡管理業務元數據和操作元數據。在建設過程中要圍繞本企業數據管理問題域進行虛實結合的建設。


五、元數據管理方式
元數據管理有兩種方式。集中式管理和分布式管理。集中式管理是指在系統中有一個節點專門司職元數據管理,所有元數據都存儲在該節點的存儲設備上。所有客戶端對文件的請求前,都要先對該元數據管理器請求元數據。分布式管理是指將元數據存放在系統的任意節點并且能動態的遷移。對元數據管理的職責也分布到各個不同的節點上。大多數集群文件系統都采用集中式的元數據管理。因為集中式管理實現簡單,一致性維護容易,在一定的操作頻繁度內可以提供較滿意的性能。缺點是單一失效點問題,若該服務器失效,整個系統將無法正常工作。而且,當對元數據的操作過于頻繁時,集中的元數據管理成為整個系統的性能瓶頸。分布式元數據管理的好處是解決了集中式管理的單一失效點問題, 而且性能不會隨著操作頻繁而出現瓶頸。其缺點是,實現復雜,一致性維護復雜,對性能有一定影響。
六、元數據管理工具
睿治元數據管理平臺致力于處理技術元數據、業務元數據、管理元數據,幫助各行各業用戶獲得更多的數據洞察力,進而挖掘出隱藏在資源中的價值。
1、平臺內置豐富的適配器,全面保障各類源頭的元數據自動化采集,一鍵采集對接,同時可支持適配器快速擴展。
2、元數據的應用都基于元模型。億信元數據管理平臺(EsPowerMeta)中的元模型支持CWM(公共倉庫元模型)規范的同時,提供了一套便捷的自定義管理接口功能,可完全自定義擴展,能夠滿足元數據管理快速實施的需要,可適應用戶在不同時期的不同管理需要。
3、億信元數據管理平臺(EsPowerMeta)提供了完善的元模型和元數據維護功能,采用多種方式簡化元數據維護的復雜性。系統支持元數據的自動獲取和時間調度管理,支持手工創建和變更元數據,并配合版本管理,能完整存儲元數據整個生命周期動態和變化,方便用戶跟蹤業務運作的歷史數據。
認為本內容有幫助
0
您可能需要的數據產品
億信華辰助力政企數字化轉型
customer

在線咨詢

在線咨詢

點擊進入在線咨詢