一、什么是元數據
元數據不是你聊天的內容也不是你的資料,更不是你在網上發布了什么消息,元數據是更底層的數據。最直接理解(元數據)的方式是活動數據:你在設備上從事活動、手機自動運行的記錄。舉例來說,手機元數據可能包括:來電日期與時間、通話時長、來電號碼,通話位置……通過分析你不同設備的元數據,監視者能得知你昨晚入睡與今早起床的時間、每天逛了哪些地方、在哪里待了多久,以及你接觸過的對象有誰,誰又與你聯系過。元數據,忠實而冷酷的記錄者。
一間擺滿書的屋子能被稱為圖書館嗎?
要在圖書館中找到某本書,不能只是在圖書館中走來走去,單靠運氣去找。
盡管元數據一詞只有幾十年的歷史,然而幾千年的圖書館管理員們一直在工作中使用著元數據,只不過我們先所謂的“元數據”是歷史上被稱為“圖書目錄信息”。圖書目錄中的信息解決了一個十分關鍵的問題,就是如何幫助用戶在圖書館快速地、準確地找到想要的圖書。
圖書目錄中依然延續至今的信息片段:書名、作者、主題、簡介等。但如今其含有更多的信息,如出版社、出版時間、定價、條形碼和上架建議等等。
有一個關于元數據的例子,元數據就像“戶口本”,戶口本中除了有姓名、出生日期、住址、民族等信息外,還有家庭的血緣關系,父子關系、兄弟關系等。這些信息就構成了對這個人的詳細描述,那這些信息就是描述這個人的元數據。
所以元數據是什么?元數據:描述數據的數據元數據分類:業務元數據、技術元數據、管理元數據業務元數據:面向業務分析人員。業務元數據是描述數據的業務含義、業務規則等。通過明確業務元數據讓人們更容易理解和使用業務元數據,元數據消除了數據二義性,讓人們對數據有一致的認證,避免“各說自話”,進而為
數據分析和應用提供支撐。常見的業務元數據包括:業務定義、業務術語、業務規則、業務指標等
技術元數據:技術元數據是對數據的結構化,方便計算機或數據庫之間對數據進行識別、存儲、傳輸和交換。技術元數據可以服務于開發人員,讓開發人員對數據的存儲、結構更明確,從而為應用的開發和系統的集成奠定基礎。技術元數據也可服務于業務人員,通過元數據理清數據關系,讓業務人員能夠更快速的找到想要的數據,進而對數據的來源去向進行分析,支持數據血緣追溯和影響分析。常見的技術元數據包括:存儲位置、數據模型、數據庫表、字段長度、字段類型、ETL腳本、SQL腳本、接口程序、數據關系等
管理元數據:面向IT系統運維技術人員。管理元數據描述了數據的管理屬性,包括管理部門、管理責任人等,通過明確管理屬性,有利于數據管理責任到部門和個人,是數據安全管理的基礎。常見的管理元數據包括:數據所有者、
數據質量定責、數據安全等級等。
二、元數據管理是管理些啥
元數據也是數據,同樣適用數據生命周期管理。

元數據管理平臺從應用層面,可以分為:元
數據采集存儲,元數據管理服務、元數據分析服務以及元數據訪問服務。

元數據采集服務:在
數據治理項目中,通常涉及到的元數據還包括:數據源的元數據,數據加工處理過程的元數據,
數據倉庫或數據主題庫的元數據,
數據應用層的元數據,數據接口服務的元數據等等。元數據采集服務提供各類適配器滿足以上各類元數據的采集,并將元數據整合處理后統一存儲于中央元數據倉庫,實現元數據的統一管理。這個過程中,數據采集適配器十分重要,元數據采集要能夠適配各種DB、各類ETL、各類DW和Report產品,同時還需要適配各類結構化或半結構化數據源。目前市場上的主流
元數據產品還沒有哪一家能做到“萬能適配”,都需要在實際應用過程中做或多或少的定制化開發。
元模型驅動的設計與開發:通過元數據管理平臺實現對應用的邏輯模型、物理模型等各類元模型管理,支撐應用的設計和開發。
元數據不是停留在紙面,作為一個查詢的字典,它更大地發揮作用是在管控。通過元數據實現了全方位的日監控,做到總部級別能夠看到各分子公司每天的業務系統元數據的運轉。只要發現異常,總部這邊會形成T+1的監控機制,當天就會發出通報,通報相關的子公司或者相關的業務單位元數據發生了變更有異常,要趕緊處理,通過這一個管控手段保障了集團信息化系統建設的一致性和版本的管控性。以前沒有抓手,但是通過元數據管控我們實實在在地抓住了核心和根本
?
三、元數據管理的價值是什么
(一)從功能角度
1、一圖在手,天下我有
通過元數據以企業全局視角對企業各業務域的數據資產進行盤點,實現企業數據資源的統一梳理和盤查,有助于發現分布在不同系統、位置的數據,讓隱匿的數據顯性化。數據地圖包括了數據資源的基本信息,存儲位置信息、數據結構信息、各數據之間關系信息,數據和人之間的關系信息,數據使用情況信息等,使數據資源信息詳細、統一、透明,降低“找數據”的溝通成本,為數據的使用和大數據挖掘提供支撐。
2、追根溯源,發現數據問題本質
企業在做數據分析的時候,數據分析結果不正確,原因可能是數據分析過程出現數據問題,也可能是數據源本身就有問題,還可能是數據在加工處理過程中出現了數據問題……。
通過元數據血緣分析,能夠快速定位數據來源和加工處理過程,能夠幫助數據分析人員快速定位數據問題。另外,通過元數據血緣關系分析,可以理解不同數據指標間的關系,分析產生指標的數據源頭波動情況帶來的影響。
(二)從使用對象的角度
1、對技術人員而言,元數據管理平臺將分散、存儲結構差異大的資源信息進行描述、定位、檢索、評估、分析五大操作,以描述和分類的形式實現對信息的格式化,從而為機器處理創造了可能,大大降低了數據治理的人工成本。正因如此,元數據管理已經成為很多大型數據治理項目的基礎。
?2、對業務人員而言,元數據管理平臺通過對業務指標、業務含義、業務規則、取數口徑、影響范圍等信息進行各方位管控,協助他們快速了解業務相關內容,進行數據資產的管理。
四、元數據管理的高效玩法
元數據管理的高效玩法,那就是工具化!

億信華辰元數據管理平臺,致力于處理技術元數據、業務元數據、管理元數據,幫助各行各業用戶獲得更多的數據洞察力,進而挖掘出隱藏在資源中的價值。
1、 全面支持各類采集適配器:平臺內置豐富的適配器,全面保障各類源頭的元數據自動化采集,一鍵采集對接,同時可支持適配器快速擴展
2、 可擴展元模型,滿足不同管理需求:元數據的應用都基于元模型。億信元數據管理平臺(EsPowerMeta)中的元模型支持CWM(公共倉庫元模型)規范的同時,提供了一套便捷的自定義管理接口功能,可完全自定義擴展,能夠滿足元數據管理快速實施的需要,可適應用戶在不同時期的不同管理需要。
3、 智能獲取元數據,管理維護便捷:億信元數據管理平臺(EsPowerMeta)提供了完善的元模型和元數據維護功能,采用多種方式簡化元數據維護的復雜性。系統支持元數據的自動獲取和時間調度管理,支持手工創建和變更元數據,并配合版本管理,能完整存儲元數據整個生命周期動態和變化,方便用戶跟蹤業務運作的歷史數據。
4、 全文搜索引擎,準確定位目標元數據:億信元數據管理平臺(EsPowerMeta)內置全文搜索引擎,讓各層次用戶可快速定位自己所關心的元數據。EsPowerMeta支持基于名稱、基本屬性、元數據間關系查找的同時,還支持全文搜索。通過多種組合條件的模糊查詢,即可在整個元數據環境中隨時檢索所需元數據。
5、 落地全行業,全中文硬核系產品:目前國內支持全中文內核元數據管理的為數不多的產品之一,具有自主知識產權,已成功實施于多家銀行和政府機構,同時適用于業務用戶、技術用戶和運維管理用戶。
6、 圖形化分析,快速理清元數據關系:億信元數據管理平臺(EsPowerMeta)提供圖形化的元數據基礎分析以及高級應用分析。血緣分析是指從某一實體出發,往回追溯其處理過程,直到數據源接口,可快速追溯數據來源和加工過程,影響分析可掌握元數據之間的相互影響。
五、億信華辰元數據管理平臺成功案例佛山某區政務服務數據管理局元數據管理平臺
建設內容:政務服務數據管理局基于區內各政府部門的數據進行匯總和治理,面向各部門提供統一的數據服務和應用,實現“用數據決策、用數據監管、用數據創業”的數據統籌發展運行機制。本項目通過元數據管理平臺,梳理各類數據來源,實現衛計委、工商局、流管局等各政府部門的元數據自動采集,理清現有的數據流轉流程和數據架構,并基于其構建一套新的數據架構,同時提供數據血緣分析、影響分析等,最后形成全區的政務數據地圖。
項目價值:幫助數據管理局確定數據來源和數據架構,為后續
數據標準建設,數據質量管理打下堅實的基礎,并為政務資源目錄、自主填報系統、教育無紙化等應用提供支撐。
?了解更多關于
元數據管理平臺的知識:
http://m.122re.com/products/espowermeta.html.
(部分內容來源網絡,如有侵權請聯系刪除)