- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2026-01-26來源:數據工匠俱樂部瀏覽數:6次
“本體”這個源于哲學領域的詞匯,終于在信息科學領域里引發了一場新的思考(炒作)和創新(機會)。本體能被計算機所識別、模擬和處理,就必須經過“數據本體”這個中間概念。作為一名數據管理人員,初聽“數據本體”這個詞感覺很抽象,看它的定義卻又有“老酒裝新瓶”之嫌,不就是數據管理里的元數據、數據架構、數據標準這幾方面工作的整合嗎?換個角度不就是主數據管理的擴展升級版嗎?
本著事物都是螺旋上升,歷史總是曲折前進這一基本原理,結合近一年人工智能技術的快速躍變,筆者認真對比和思考了數據本體與當下主流數據管理的范圍和關系,認識到數據本體確實為數據管理這壇老酒帶來了新的意義和任務,兩者上下承接,相互成就,最終目標是使人工智能可以脫離人工干預,成為真正自主的智能。
一概念辨析
1.數據本體
數據本體源于哲學概念“本體”(Ontology),在信息科學中被定義為"對領域概念體系的規范化描述",是對數據領域內概念、概念屬性、概念間關系的規范化、形式化描述,強調數據的語義一致性、可理解性、可復用性和互操作性。
可以認為數據本體回答了“數據”的哲學三問:我是誰?我從哪里來?我到哪里去?從而使語義離散的數據聚合為了數據本體,就具備了一定意義上的能動性和智能決策的基礎。
我是誰:數據的業務含義、語義、屬性、規則;
我從哪里來:語境、上下關系、數據之間的語義關聯,概念間的邏輯聯系,
我到哪里去:實現機器對數據語義(含義)的理解和自動推理,實現語義搜索、知識圖譜構建、自動決策等。
2.數據管理三個基礎要素
上述數據本體的哲學三問,很容易與數據管理中的三個數據資源的管理工具和要素關聯起來,即:元數據、數據標準、數據架構,本文內暫稱它們為數據管理三要素。
|
數據架構 |
元數據 |
數據標準 |
|
|
定義 |
一套規則、政策、標準和模型,用于管理和定義數據類型,以及如何在組織和信息中使用、存儲、管理和集成數據。 |
“關于數據的數據”。描述數據的基本含義、內容、結構、管理信息等。 |
為保障數據一致性和質量而制定的規范性文件,規定了數據如何被定義、命名、格式化和使用。 |
|
目標 |
是企業戰略、企業架構、業務架構在數據治理層面的映射。 |
幫助人(和數據系統)查找、理解、管理和使用數據。 |
實現數據的統一規范,便于交換和集成。 |
|
主要內容 |
數據目錄 數據模型 數據規則 數據分布與流向 |
業務元數據 技術元數據 管理元數據 |
對象類數據標準(數據元標準、主數據標準、指標數據標準); 基礎類數據標準 |
3.數據本體與數據管理三要素
基于數據本體和數據管理中三個基礎要素的概念解析,我們進一步對比兩者的不同。數據本體不是現有數據管理的優化和簡單升級,也不是元數據、數據架構、數據標準的簡單相加,而是伴隨智能技術質變的一種管理思路和方式的躍遷,面向的目標是最終實現機器或系統的自主決策和行為。
|
數據本體 |
數據管理三要素 |
|
|
管理方式 |
基于語義的智能化管理 |
基于工具的流程化管理 |
|
管理目標 |
提高數據的機器可讀性,實現數據的語義智能管理。 |
實現數據可用性,優化數據資源的物理管理過程。 |
|
主要任務 |
消除語義斷層,構建智能知識圖譜,實現本體的自動化、自主化運行。 |
打破信息孤島,進行數據規則統一和融合,支撐上層應用,方便人類進行決策和行為。 |
4.主數據與數據本體
數據本體與主數據兩者雖不是同一層級和顆粒度的概念,但兩者也有一些重疊和易混淆之處,有必要梳理一下,以便更好地理解數據本體的內涵,明晰兩者的關系,在實踐過程中更容易做好銜接與升級。
主數據是描述組織核心業務實體(事務對象)關鍵的、共享的、統一的、相對穩定的數據,是組織的核心業務實體(如客戶、產品、供應商、員工)的唯一、準確、權威的數據源。
|
數據本體 |
主數據 |
|
|
抽象程度 |
高度抽象的邏輯模型,聚焦“是什么、有什么關系”,不涉及具體數據值 |
具象的業務數據,聚焦“具體是什么值”,是對本體概念的實例化 |
|
覆蓋范圍 |
覆蓋范圍更寬泛,可涵蓋企業全域數據的概念體系,包括主數據、交易數據、參考數據等所有數據類型的語義定義 |
覆蓋范圍更聚焦,僅針對核心業務實體,不包含交易數據(如訂單流水)、臨時數據等 |
|
價值定位 |
“賦能數據的語義化和智能化”,是實現數據知識化,進而業務智能化,達到自動化決策和行動。 |
“保障核心數據的一致性和共享性”,是實現業務流程協同的基礎。 |
二數據本體與數據管理的聯系
1.數據本體對數據管理三要素的"升維整合"
數據本體不是元數據、主數據、數據標準的簡單組合拳,而是“增強升級、升維整合”,它從更高維度解決了傳統數據管理流程難以解決的“語義鴻溝”問題。數據本體提供“語義依據”—— 沒有本體的統領,數據管理的各環節很容易變成“各自為戰”,出現“貌合神離”的治理痛點。
對于數據架構:數據本體提供語義層的關系網絡,而非簡單的實體間的有向圖,如:客戶與訂單關系,從原來的關聯變為“提交”,給實體間的連線賦予了具體的業務含義和動作。
對于元數據:數據本體將元數據轉化為可推理的知識單元,將對數據的描述升級為對實體的業務屬性和規則的全面透視掃描,不同組織的數據本體進行對接時,即使字段名稱、規則不同,也可根據字段語義自動進行匹配。如:一個系統中是姓名字段,另一系統是姓和名兩個字段,則兩個系統數據對接時,可自動匹配,而不需要轉換。
對于數據標準:數據本體實現標準的動態語義校驗,如:檢測采購單中的商品、型號、規格和兼容性是否滿足物料需求,價格與數量是否滿足成本要求,是否滿足優惠條件等。
2.數據管理對數據本體的"基礎支撐"
數據本體的構建不是從零開始,也不是憑空搭建,而是基于已有數據管理的基礎。如果組織已具備了較成熟和較優質的數據管理基礎,數據架構、元數據、數據標準的管理信息都是比較完整、真實、準確的,那么構建數據本體的基礎框架、基礎結點信息、實體范圍、語義邊界就基本具備了。
三面向數據本體的數據管理進階
基于良好的數據管理基礎,構建數據本體的管理,具體到數據架構、元數據、數據標準這三方面,還要做全面的升級和擴展。升級的核心邏輯是:以數據本體的“語義、規則、關聯”為導向,重構三個要素的管理目標、方式和工具。

1.數據架構管理:從“技術架構”到“語義架構”
傳統數據架構多聚焦存儲架構、系統架構等技術設計,缺乏對數據語義的統籌。數據本體的架構需要完成數據語義的整合。
升級要求:以數據本體為實體,實現“語義驅動架構設計”,特別是對概念級數據架構進行升級或重構,定義組織全域數據的本體概念、業務區域和關系,作為架構設計的頂層設計。構建本體語義和行為導向的數據分層與流轉架構;關注語義的一致性而非簡單書面的一致性;通過模塊化、虛擬技術等方式增加架構的彈性擴展能力。
2.元數據管理:從“被動記錄”到“主動賦義”
元數據是描述數據的數據。傳統元數據管理做的是:數據是什么,元數據就記錄成什么,且多為技術元數據采集,缺乏對業務語義的關聯映射。
升級要求:拓展元數據覆蓋范圍,對齊本體概念的各維度,補全業務元數據(如業務術語、指標口徑、業務規則),或增設語義元數據(如數據與本體概念的映射關系、概念間的語義關聯),形成“管理-技術-業務-語義”四位一體的元數據體系。建立元數據到本體概念的映射規則庫,通過自動匹配+人工校準進行同步,本體發生變更時,觸發聯動更新,確保映射關系的時效性:基于自然語言處理(NLP)等技術,進行語義定義和標簽;強化關聯分析能力,增強本體關系的血緣分析、影響分析功能,挖掘數據間的隱性關聯,補充數據本體的關系定義。
3.數據標準管理:從“規則固化”到“規則自適應”
傳統數據標準多聚焦格式、編碼、命名規范等技術規范,缺乏與業務語義的綁定,業務邏輯規則不足甚至缺失。
升級要求:以數據本體為單元,重構數據標準的層級體系,基于數據本體的概念層級制定數據本體的行為標準,建立行動層、語義層、技術層的不同層面的規則與標準,并隨數據本體和業務邏輯的變化而動態調整。建立“本體-標準-本體”的標準制定與校驗互證機制,構建自動化校驗鏈路;將數據標準規則嵌入數據本體模型,推動數據標準的動態迭代,適配本體的演進。
四總結
數據向數據本體轉變的過程就像從“被動的有機算料”進化為“自驅的智能生物”的過程。數據管理也需要完成相應的向“數據本體管理”的轉換。數據架構管理構建數據本體為單元的全域數據本體的多維地圖;元數據管理完成數據本體的語義構建;數據標準管理負責數據本體的語義一致性和行為規則的構建。三者協同改進,滿足數據本體管理的新目標和新任務。
上一篇:AI與可信數據空間的關系...