- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-05-25來源:他說她多情瀏覽數:272次
元數據的定義 如果按照傳統的定義,元數據是關于數據的數據,是為了描述數據的相關信息而存在的數據,例如記錄數據的存儲位置、模型定義、生命周期、血緣關系等信息。例如我們看一部電影,電影本身就是數據,那么元數據就是用來描述這部電影的數據。

幫助數據平臺了解自己本身的情況:例如我有哪些數據、我存儲的數據有多大、如何找到我所需要的數據、我的數據何時產出等信息,當我們拿到這些信息后,就可以做對應的運維報警等工作;
幫助數據平臺制定數據統計的標準:例如數據口徑如何統一、計算指標如何統一、數據之間的關系如何、數據的上下游關聯數據是什么等信息,打通了上下游數據之間的關聯關系,就可以為數據質量及維護可視化奠定基礎。
可以說,元數據有重要的應用價值,對于數據管理,提供諸如計算、存儲、成本、質量、安全、模型等方面有重大的利用價值。阿里巴巴在OneData體系中,建設的相關平臺是:數據地圖。因為平臺屬于內部使用,因此不便于對外透露。但你可以設想一下,一個平臺,擁有的數據表,在百萬數量級,是一種怎樣的體驗。可以說,跨部門、跨平臺之間的數據信息同步,基本上都是要數據地圖平臺來進行的,對于維護百萬張臨時表和幾萬張常用表來說,區分它們的安全級別、使用頻率、重復性、數據質量等信息,真的需要一個團隊去專門的維護。數據地圖在整個數據體系中,承擔的是一種管理者的角色,通過圖形化的方式來展示數據信息,并標明數據計算中所必要的各種信息參數,不僅數據開發人員可以使用,對于產品和運營來說也是非常友好的。它包含的內容有如下幾個部分:快速的搜索定位:通過搜索引擎的方式來查找相關數據,支持精確查詢、模糊查詢、表名查詢、字段查詢、備注查詢等方式;
標準化的圖形展示:采用圖形化的方式來組織頁面邏輯,例如采用類似Wifi圖標的形式來標注數據質量級別,肉眼可見的便捷,方便使用者所需要的關鍵信息;
積累歷史數據信息:在很多場景下,歷史數據是不需要重復計算的,直接拉取能夠極大的避免重復開發。例如針對新用戶的統計,可以拉取歷史用戶信息,和每日用戶登錄日志進行關聯,用于生產每日新增用戶;
直接關聯分析工具:因為數據的信息直接存儲在平臺上,因而可以調用報表插件來快速看到直觀的報表信息,不需要二次加工開發,很大的提升了開發的效率。
數據平臺本身仍在不斷的完善和開發中,更多的功能和更強的能力會被開發出來,以上提到的是其中的幾個場景。(三)元數據平臺該如何搭建 標準的建設思路圖如下:
