- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2025-12-16來源:大魚的數據人生瀏覽數:108次
在數據治理里,這三個詞出現頻率極高:
元數據(Metadata) 數據字典(Data Dictionary) 數據資源目錄(Data Catalog / Resource Catalog)最常見的“翻車現場”是:大家都覺得自己做了,但又說不清做的是哪一個。
這篇文章只解決一件事:
把三者的定位、內容、邊界、產出物、使用場景一次講透。
把企業數據當成一個“圖書館體系”:
元數據:每本書的基本信息 + 書與書之間的關系(書名、作者、ISBN、頁數、版本;以及“引用了哪本書”“屬于哪一類書架”)
數據字典:讀者能看懂的“詞條解釋 + 規則說明”(這個詞是什么意思?取值有哪些?什么情況下算作A而不是B?)
數據資源目錄:面向全員的“檢索與領取入口”(我能搜到什么數據?這份數據能不能用?怎么申請?找誰負責?)
一句話記住:
元數據管“事實與關系”,字典管“語義與口徑”,目錄管“發現與獲取”。
定義(更落地的版本)
元數據是對數據對象及其關系的結構化描述。
對象包括:表、字段、數據集、指標、接口、任務……
關系包括:血緣、依賴、影響、歸屬、版本……
元數據從哪里來?很多人誤以為“元數據都是系統自己長出來的”,更準確是兩類:
技術元數據(可自動采集)表結構、字段類型、分區、作業依賴、血緣、存儲位置、行數、更新時間等
管理/業務元數據(需要人為定義,但要結構化落庫)
責任人、分級分類、共享級別、主題域歸屬、數據標簽、保留期限、合規要求等
元數據典型產出物 數據對象清單(有哪些庫/表/數據集/任務) 血緣與影響分析(從哪來、到哪去、改了影響誰) 數據生命周期信息(更新頻率、留存、冷熱分層) 安全與合規屬性(分級分類、敏感標記) 定義(別被帶偏)
數據字典是對數據元素(字段/枚舉)與指標口徑(KPI)的系統化定義與約束說明。
它不是“命名規范手冊”(那更像數據標準),它更像:
字段/指標的官方釋義 取值/口徑的邊界條件 變更的版本與追溯 數據字典通常包含兩塊A. 字段級字典(Data Element Dictionary)
字段中文名/英文名 業務含義 取值范圍/枚舉(如:M/F/U) 口徑說明與例外情況 數據質量規則(可選) 負責人/維護人、版本、生效時間
B. 指標口徑字典(Metric Dictionary)
指標名稱、定義 計算邏輯(可落地到SQL/配置更好) 時間窗口、去重規則、過濾條件 業務范圍(包含/不包含哪些渠道、訂單類型) 版本與變更原因 數據字典典型產出物 數據元素清單(字段級詞條) 指標口徑庫(指標級詞條) 術語表(同義詞、別名映射:GMV/成交額/含稅不含稅等) 版本管理與變更記錄(誰改的、何時、為何) 定義(以“使用”為中心)
數據資源目錄是對組織數據資源進行登記、分類、編目后形成的檢索與獲取清單。
它解決的問題很實際:
我們有哪些數據可以用? 這份數據適合什么場景? 能不能共享?共享到什么范圍? 怎么申請?多久能給?找誰? 數據資源目錄典型內容(建議最小必備) 資源名稱、資源編碼、主題分類 數據提供方/責任部門、Owner 資源簡介與適用場景 開放屬性(開放/有條件/不開放) 更新頻率、覆蓋范圍(時間/區域/業務線) 獲取方式(API/表/文件/報表)、申請入口、SLA 關聯鏈接(指向元數據詳情、字典詞條、樣例數據、使用手冊) 數據資源目錄典型產出物 目錄條目(可被搜索、可被理解) 申請與授權流程(工單/審批/自動授權) 使用記錄與審計(誰用過、用來干嘛)
? 
遇到任何“我們是不是做了XX”的爭論,你讓大家各自回答這三句,基本就不吵了:
我想知道:這張表從哪來、到哪去、改了影響誰?→ 這是 元數據(血緣/影響分析)
我想知道:這個字段/指標到底是什么意思,怎么算,有沒有版本?
→ 這是 數據字典(語義/口徑)
我想知道:公司有什么數據能用,我怎么申請,找誰負責?
→ 這是 數據資源目錄(發現/獲取)
很多人把字典/標準/模型混在一起,建議你在團隊里明確這三條邊界:
數據標準(Data Standards):命名規范、編碼規則、建模規范、質量標準(“應該怎么做”) 數據模型(Data Model):實體關系、維度事實、主題域結構(“應該怎么設計”) 數據字典(Data Dictionary):字段/指標釋義、枚舉、口徑、版本(“這到底是什么意思”)
如果你問“先做哪個”,給一個更穩、更容易出成果的順序:
Step 1:先把“技術元數據”采起來(快速可見) 表/字段/任務/血緣/影響分析能跑起來讓大家先“看得見家底”,項目不至于空轉。
Step 2:并行做“關鍵域的數據字典”(別一上來全量) 先挑最核心、爭議最多、影響最大的領域:
客戶、產品、組織、訂單、財務口徑、經營指標……
先把“指標口徑”抓住(往往比字段更能止血) Step 3:把可共享的資源“產品化”進目錄(讓人用起來) 目錄條目必須包含:負責人、開放屬性、獲取方式、申請入口、SLA否則就是“擺設目錄”。
元數據讓數據“可追溯”,
數據字典讓數據“可理解”,
數據資源目錄讓數據“可獲取”。
三者協同,數據才從“系統里的存量”變成“組織里可用的資產”。