元數據管理是大數據平臺建設的重要組成部分,是企業實現數據資產,資產服務化的重要基礎,在數據管理大環境下和數據安全、
數據質量、數據架構、數據模型等有著千絲萬縷的關系。也是是業務和技術互通的橋梁。因此元數據建設的好壞會對企業整體數據以及管理帶來重要的影響。
元數據管理的難點,個人認為有三個點。
首先是元數據識別,要確定要管理哪些元數據,按元數據的定義來看只要能描述數據的數據都能作為元數據進行管理,但從價值角度講一定要找到對數據業務、數據運維、數據運營、數據創新帶來幫助的元數據進行管理,避免眉毛鼻子一把抓。一般企業元數據建設都是圍繞數據集中的數據平臺進行全鏈路的源、數據平臺、分析系統的元數據數據管理,圍繞這條主線,進一步管理業務元數據和操作元數據。在建設過程中要圍繞本企業數據管理問題域進行虛實結合的建設。
其次是元模型的構建,元模型其核心結構要穩定,因為元數據的建設不是一蹴而就的,需要慢慢的積累和演變,因此存儲元數據的元模型結構一定要進行抽象出穩定的結構,比如:針對關系抽象出組合關系和依賴關系、針對模型要抽象出每一類型元數據父類或基類以方便其靈活擴展。
最后是元數據間的關系,從元
數據應用的角度來看,光分析元數據的結構對
數據分析人員和數據應用的價值還不是那么的突出。元數據管理的價值主要在其關系的豐富程度,舉個不恰當的例子,猶如一個人如果其社會關系足夠的豐富,那么其處理各種事情就游刃有余,元數據也類似數據分析和應用一定是從其關系中探尋出數據的價值進而指導業務或進行數據創新。從長期的實踐中發現,基于信息項或字段的元數據關系構建是最穩定的。
(部分內容來源網絡,如有侵權請聯系刪除)