- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2024-06-26來源:Richer瀏覽數:583次
數據(Data),或稱數據資源,是指所有能輸入到計算機并被計算機程序處理的符號的介質的總稱,是用于輸入電子計算機進行處理,具有一定意義的數字、字母、符號和模擬量等的通稱,是組成信息系統的最基本要素。
1.2. 大數據
大數據(Big Data)指一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。
大數據包括結構化、半結構化和非結構化數據,非結構化數據越來越成為數據的主要部分。大數據技術的不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那么這種產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。
1.3. 數據源
數據源(Data Source)是提供某種所需要數據的器件或原始媒體。在數據源中存儲了所有建立數據庫連接的信息。就像通過指定文件名稱可以在文件系統中找到文件一樣,通過提供正確的數據源名稱,可以找到相應的數據庫連接。
常見的數據源類型有:關系數據庫、時序數據庫、鍵值存儲數據庫、列存儲數據庫、文檔數據庫、圖形數據庫、搜索引擎存儲、對象數據庫、MPP數據庫、大數據庫、工具或文件等。
1.4. 數據倉庫
數據倉庫(Data Warehouse)是為企業所有級別的決策制定過程,提供所有類型數據支持的數據集合。一般情況下,它是主要職能是數據存儲,為了給組織輸出分析性報告,為支撐決策的目的而創建的。同時,也可以提供指導業務流程改進,監視和管理數據接入時間、數據成本、數據質量。
由于數據倉庫是數據匯總的數據存儲空間,一般情況下,會對數據倉庫進行分層,常見分層有貼源層(ODS)、數據整合層(EDW)、主題模型層(FDM)、共性計算層/共性加工層(ADM)、應用集市層/數據集市層(ADS)。每種分層組合會根據具體實施情況,完成數據倉庫分層設計。
1.5. 數據中臺
數據中臺是一套可持續“讓企業的數據用起來”的機制,一種戰略選擇和組織形式,是依據企業特有的業務模式和組織架構,通過有形的產品和實施方法論支撐,構建一套持續不斷把數據變成資產并服務于業務的機制。數據中臺需要具備數據匯聚整合、數據提純加工、數據服務可視化、數據價值變現四個核心能力,讓組織的員工、客戶、伙伴能夠方便地應用數據。
數據中臺是一種概念、理論,并不是一個獨立系統的名稱,它是在數據倉庫(數據中心)的基礎上引申出來的新的概念。職能定位是所有數據的匯聚之所,以及為上層數據應用提供支撐的平臺基礎,即數據賦能。
若想全面了解數據中臺,區分數據倉庫和數據中臺的異同,需要從數據來源、建設目標、數據應用三個層面進行說明。
在數據來源層面:
數據倉庫的數據來源主要是業務數據庫,數據格式也是以結構化數據為主。
數據中臺的數據來源期望是全域數據包括業務數據、日志數據、埋點數據、爬蟲數據、外部數據等。數據格式可以是結構化數據,也可以是非結構化的數據。
在建設目標層面:
數據倉庫建設主要用來做BI報表,目的性單一,只抽取和清洗該相關分析報表用到基礎數據。若新增一張報表,需要從ODS到ADS做一遍數據加工。
建立數據中臺的目標是為了融合組織的全部數據,打通數據之間的隔閡,消除數據標準和口徑不一致的問題。數據中臺通常會對來自多方面的的基礎數據進行清洗,按照主題域概念建立多個以事物為主的主題域比如用戶主題域,商品主題域,渠道主題域,門店主題域等等。數據中臺遵循三個one的概念:One Data, One ID, One Service,基于該理念,數據中臺不僅僅是匯聚企業各種數據,而且讓這些數據遵循相同的標準和口徑,對事物的標識能統一或者相互關聯,并且提供統一的數據服務接口,完成數據賦能。
在數據應用層面:
數據倉庫主要是面向BI報表,數據應用的建設就是傳統煙囪式建設,每次都從頭再來的開發方式。
數據中臺上的數據應用不僅僅只是面向于BI報表,更多面向營銷推薦、用戶畫像、AI決策分析、風險評估、經營分析等。而且這些數據應用,基于數據中臺已經匯總、沉淀完畢,能快速為相關系統提供數據,完成快速數據開發工作,同時之前工作成果都能被多個應用共享。
1.6. 數據管理
數據管理(Data Management)是為實現數據和信息資產價值的獲取、控制、保護、交付以及提升,對政策、實踐和項目所做的計劃、執行和監督。
一般包含以下三層含義:
(1)數據管理包含一系列業務職能,包括政策、計劃、實踐和項目的計劃和執行;
(2)數據管理包含一套嚴格的管理規范和過程,用于確保業務職能得到有效履行;
(3)數據管理包含多個由業務領導和技術專家組成的管理團隊,負責落實管理規范和過程。
1.7. 數據治理
國際數據管理協會(DAMA)給出的定義:數據治理是對數據資產管理行使權力和控制的活動集合。
《GBT34960.5-2018 信息技術服務 治理 第5部分》給出的定義:數據資源及其應用過程中相關管控活動、績效和風險管理的集合。數據治理域包括數據管理體系和數據價值體系。
國際數據治理研究所(DGI)給出的定義:數據治理是一個通過一系列信息相關的過程來實現決策權和職責分工的系統,這些過程按照達成共識的模型來執行,該模型描述了誰(Who)能根據什么信息,在什么時間(When)和情況(Where)下,用什么方法(How),采取什么行動(What)。
另一種解釋:
俠義數據治理為了滿足內部風險管理和外部監管合規的需要。通過一系列信息相關的過程來實現決策權和職責分工的系統。
廣義的數據治理是對數據資產管理行使權力和控制的活動集合(規劃、監控和執行),指導其他數據管理職能如何執行,在高層次上執行數據管理制度。組織為實現數據資產價值最大化所開展的一系列持續工作過程,明確數據相關方的責權、協調數據相關方達成數據利益一致、促進數據相關方采取聯合數據行動。
最終目標是提升數據的價值,數據治理非常必要,是企業實現數字戰略的基礎,它是一個管理體系,包括組織、制度、流程、工具。
再來一種解釋:
數據治理(Data Governance)是指將數據作為企業資產而展開的一系列的具體化工作,是對數據的全生命周期管理。
數據治理從詞組組成上分數據和治理,治理有改革的意思。既然有改革,那么就需要有相關制度、流程、工具完成對數據的重新梳理、歸類,以滿足數據的使用要求。
數據治理的目標是提高數據質量(準確性和完整性),保證數據的安全性(保密性、完整性及可用性),實現數據資源在各組織機構部門的共享;推進信息資源的整合、對接、共享和綜合應用,從而提升企業管理水平,充分發揮信息化在經營管理中的作用。
數據治理相關制度、流程會引申出數據治理咨詢,如《數據治理組織架構及人才管理方案》、《數據治理實施路徑》、《數據應用場景實施路徑》、《元數據管理辦法及流程》、《數據標準管理辦法及流程》、《數據質量問題分析及整改方案》、《未來N年數據治理發展規劃》等;數據治理工具會引申出相關管理系統,如元數據管理系統、數據安全系統、數據標準系統、數據質量系統等,一般偏向基于數據治理咨詢成果完成當期數據治理實施與落地。
1.8. 數據資產
數據資產(Data Asset)是指由企業擁有或者控制的,能夠為企業帶來未來經濟利益的,以物理或電子的方式記錄的數據資源,如文件資料、電子數據等。在企業中,并非所有的數據都構成數據資產,數據資產是能夠為企業產生價值的數據資源。
《GBT34960.5-2018 信息技術服務 治理 第5部分》給出的定義:組織擁有和控制的、能夠產生效益的數據資源。
2.1. 數據模型
數據模型(Data Model),經常簡稱為模型,是現實世界數據特征的抽象,用于描述一組數據的概念和定義。數據模型從抽象層次上描述了數據的靜態特征、動態行為和約束條件。數據模型所描述的內容有三部分:數據結構、數據操作(其中ER圖數據模型中無數據操作)和數據約束,形成數據結構的基本藍圖,也是企業數據資產的戰略地圖。數據模型按不同的應用層次分成主題域數據模型、概念數據模型、邏輯數據模型、物理數據模型四種類型。
主題域數據模型:簡稱主題域模型,是最高視角的規劃藍圖,是在較高層次上將企業信息系統中的數據綜合、歸類,并進行分析利用的抽象。一般情況下主題域模型按業務、系統、部門等劃分。
概念數據模型:簡稱概念模型,是一種面向用戶、面向客觀世界的模型,主要用來描述現實世界的概念化結構,與具體的數據庫管理系統(DBMS,Database Management System)無關,一般只有實體集,聯系集的分析結構。
邏輯數據模型:簡稱邏輯模型,是一種以概念模型為基礎,根據業務條線、業務事項、業務流程、業務場景的需要,設計的面向業務實現的數據模型,一般包括具體的功能和處理信息。邏輯模型是面向DBMS的模型,用于指導在不同的DBMS系統中實現。邏輯數據模型常見形式有網狀數據模型、層次數據模型等。
物理數據模型:簡稱物理模型,是一種面向計算機物理表示的模型,描述了數據在儲存介質上的組織結構。物理模型的設計應基于邏輯模型的成果,以保證實現業務需求。它不但與具體的DBMS有關,而且還與操作系統和硬件有關,因此,在設計模型時需要考慮系統性能的相關要求。
2.2. 元模型&元數據
元模型(Meta Model)是關于模型的模型,是描述某一模型的規范,具體來說就是組成模型的元素和元素之間的關系。元模型是相對與模型的概念,離開了模型元模型就沒有了意義。
元數據(Metadata),又稱中介數據、中繼數據,為描述數據的數據(data about data),主要是描述數據屬性(property)的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。元數據是關于數據的組織、數據域及其關系的信息,簡言之,元數據就是關于數據的數據。元數據按用途不同分為技術元數據、業務元數據、操作元數據、管理元數據。
數據模型、元模型、元數據之間的關系:模型是數據特征的抽象,是組建元模型的理論基礎。元模型是元數據的模型,是存儲元數據的數據模型,由于元數據的多樣性,因此不同類型及子類對應的元模型也不盡相同,需要根據具體的元數據進行設計。
技術元數據
技術元數據(Technical Metadata):描述數據系統中技術領域相關概念、關系和規則的數據;包括數據平臺內對象和數據結構的定義、源數據到目的數據的映射、數據轉換的描述等。
技術元數據如果細分,還可以分為結構性技術元數據和關聯性技術元數據。
結構性技術元數據:結構性技術元數據提供了在信息技術的基礎架構中對數據的說明,如數據的存放位置、數據的存儲類型、數據的血緣關系等。
關聯性技術元數據:描述了數據之間的關聯和數據在信息技術環境之中的流轉情況。技術元數據的范圍主要包括:技術規則(計算/統計/轉換/匯總)、數據質量規則技術描述、字段、衍生字段、事實/維度、統計指標、表/視圖/文件/接口、報表/多維分析、數據庫/視圖組/文件組/接口組、源代碼/程序、系統、軟件、硬件等。
在實踐中,技術元數據的采集的內容會根據不同數據庫做具體內容的調整,如關系數據庫常見的表、字段、存儲過程、函數、視圖,鍵值存儲數據庫就誒有視圖、存儲過程這種概念。
業務元數據
描述數據系統中業務領域相關概念、關系和規則的數據;包括業務術語、信息分類、指標、統計口徑等。從另一個維度來說,業務元數據是數據倉庫環境的關鍵元數據,是用戶訪問時了解業務數據的途徑,內容來源包括多個方面:用例建模(Case Modeling)工具、控制數據庫、數據庫目錄和數據抽取/轉換/加載的工具。
在實踐中,常見的數據指標、數據元素(數據元)、數據標簽、報表表頭等都屬于業務元數據。
操作元數據
與元數據管理相關的組織、崗位、職責、流程,以及系統日常運行產生的操作數據。操作元數據管理的內容主要包括:與元數據管理相關的組織、崗位、職責、流程、項目、版本,以及系統生產運行中的操作記錄,如運行記錄、應用程序、運行作業。
簡單理解,操作元數據是描述數據處理過程的數據。
在實踐中,一般操作元數據主要存儲的數據是:數據ETL信息、數據加工處理策略數據信息、數據處理調度信息、數據處理異常信息等。
管理元數據
描述了數據的管理屬性,包括管理部門、管理責任人等,通過明確管理屬性,有利于數據管理責任到部門和個人,是數據安全管理的基礎。常見的管理元數據包括:數據所有者、數據質量定責、數據安全等級等。
簡單理解,管理元數據是描述數據管理歸屬的數據。
在實踐中,一般管理元數據主要存儲的數據是:數據歸屬信息(業務歸屬、系統歸屬、運維歸屬、數據權限歸屬)、各個數據庫里面創建的用戶訪問庫\表\視圖\存儲過程等的權限信息(含數據安全信息)等。
元模型怎么基于不同業務場景、數據庫類型定義,技術元數據、業務元數據、操作元數據如何采集,等后續編制《元數據管理系統建設》文章時具體陳述。
2.2. 數據標準
數據標準(Data Standards)是指保障數據的內外部使用和交換的一致性和準確性的規范性約束。在數字化過程中,數據是業務活動在信息系統中的真實反映。由于業務對象在信息系統中以數據的形式存在,數據標準相關管理活動均需以業務為基礎,并以標準的形式規范業務對象在各信息系統中的統一定義和應用,以提升企業在業務協同、監管合規、數據共享開放、數據分析應用等各方面的能力。
數據標準是一個從業務、技術、管理三方面達成一致的規范化體系,同時也是是建立一套符合自身實際,涵蓋定義、操作、應用多層次數據的標準化體系。它包括基礎類標準和指標類標準。
基礎類數據標準
基礎類數據標準是為了統一組織所有業務活動相關數據的一致性和準確性,解決業務間數據一致性和數據整合,按照數據標準管理過程制定的數據標解決業務間數據一致性和數據整合,按照數據標準管理過程制定的數據標準。
基礎類數據標準主要的內容,包括數據元、代碼集、數據集、編碼規則。
數據元( Data Element),也稱為數據元素,是用一組屬性描述其定義、標識、表示和允許值的數據單元,在一定語境下,通常用于構建一個語義正確、獨立且無歧義的特定概念語義的信息單元。數據元可以理解為數據的基本單元,將若干具有相關性的數據元按一定的次序組成一個整體結構即為數據模型。對應的是數據元標準。
代碼集是用于說明信息基本數據集中數據元素的分類編碼。代碼基于某一個代碼集的分類編碼下的可排序數據集合,一般情況下代碼是無序的對象集合,包含唯一值CODE,和對應的值VALUE。為了擴展性,體現樹狀代碼模式,還會有父類CODE。由于代碼一詞在業務人員理解中會產生開發代碼的概念,有時候會將代碼集改成編碼集,對應的是編碼標準。
指標類數據標準
指標類數據標準一般分為基礎指標標準和計算指標(又稱組合指標)。基礎指標具有特定業務和經濟含義有特定業務和經濟含義,且僅能通過基礎類數據加工獲得,計算指標通常由兩個以上基礎指標計算得出。
2.3. 數據質量
數據質量(Data Quality)是保證數據應用效果的基礎,是描述數據價值含量的指標。
衡量數據質量的指標體系有很多,典型的指標有:完整性(數據是否缺失)、規范性(數據是否按照要求的規則存儲)、一致性(數據的值是否存在信息含義上的沖突)、準確性(數據是否錯誤)、唯一性(數據是否是重復的)、時效性(數據是否按照時間的要求進行上傳)。
通常從技術方面、業務方面、管理方面尋找數據質量問題。
技術方面
在技術方面,一般從數據庫表設計、數據生產、數據采集、數據傳輸、數據裝載、數據存儲整個數據生命周期的各個環點尋找數據質量問題。
數據庫表設計環節:在業務系統建設時對表結構、字段約束、數據校驗規則的設計不合理,造成數據錄入無校驗或校驗不當,引起數據重復、不準確、不完整等。
數據生產環節:指業務系統產生生產數據,在業務系統中未控制數據寫入權限、對數據收集頁面未做數據校驗、對數據重復提交未做限制、數據之間的邏輯未做控制等引發數據重復、不準確、不一致等。各個業務系統通用或者依賴數據未做統一的管理,各業務系統各自為政,煙囪式建設系統,導致系統之間的數據不一致。
數據采集環節:數通過API、DB Link等方式獲取數據,在采集點、采集頻率、采集內容、映射關系、采集參數和流程設置的不合理,導致的數據采集效率低下、采集失敗、數據丟失、數據映射與轉換失敗等問題。
數據傳輸環節:網絡不可控、數據傳輸過程中未加密,造成數據傳輸環節數據被篡改、丟失引發的數據質量問題。
數據加工環節:指通過ETL、數據開發等方式,在編制數據清洗規則、數據轉換規則、數據裝載規則時,未做合理的限制、驗證等方式,造成數據重復、映射錯誤等問題。
數據存儲環節:數據存儲區設置不合理、人為在數據存儲上調整數據,引發數據丟失、無效、失真、重復等問題。
業務方面
在業務方面,由于需求不清晰、需求頻繁變更、數據輸入格式不規范、數據造假造成數據質量問題。
需求不清晰:業務規則、業務流程、業務采集信息項不清晰,影響設計環節構建的數據模型不合理,進而引發數據生產環節數據質量問題。
需求頻繁變更:一般也是由于需求不清晰導致需求變更頻繁,影響數據在技術層面所有環節,在頻繁變更的情況下,稍有疏忽或者設計不合理或者數據遷移邏輯錯誤,導致數據質量問題頻繁發生,且不好治理。
數據輸入格式不規范:一般主要針對大范圍內容數據的輸入場景,由于輸入內容的大小寫、全半角、特殊字符未留心注意,造成數據失真、數據丟失等問題。
數據造假:操作人員為了提高或降低考核指標,亦或是快速完成相關數據收集工作,對一些數據在錄入時進行了處理,使得數據真實性無法滿足質量要求。
管理方面
在管理方面,主要是對數據質量認知薄弱,沒有或者未履行數據質量制度,數據認責、數據考核機制匱乏,導致數據管理方面缺失引發的數據質量問題。
數據質量認知:沒有認識到數據質量的重要性,關注系統建設缺少對數據生產的關注,認為系統是萬能的,數據質量差些也沒關系。
數據質量制度:數據質量問題從輸入、發現、指派、處理、優化沒有一個統一的流程和制度支撐,造成數據生產時數據不規范、數據丟失、數據沖突等問題,接下來的數據發現、指標、處理、優化也沒有控制和管理,出現數據問題也沒有相應的數據認責、考核機制做到行為約束,導致整個數據質量問題沒有形成閉環。
影響數據質量也可以從客觀因素和主觀因素分析。在數據各環節流轉中,由于系統異常和流程設置不當等客觀因素,引起的數據質量問題。在數據各環節處理中,由于人員數據意識低和管理缺陷等主觀因素,造成操作不當而引起的數據質量問題。
2.4.?數據交換
數據交換(Data Switching)在基于數據中臺、數據倉庫、數據治理場景下,不是指基于多個數據終端設備(DTE)之間,為任意兩個終端設備建立數據通信臨時互連通路的過程;而是指將分散建設的若干應用信息系統中的數據進行整合,使若干個應用子系統進行信息/數據的傳輸及共享,提高信息資源的利用率,成為進行信息化建設的基本目標,保證分布異構系統之間互聯互通。
簡單理解,當前的數據交換主要將應用系統產生的數據,通過數據卸數、數據裝數完成異構數據庫(源)之間的互聯互通。常見的數據交換模式有庫到庫、庫到文件、文件到庫、文件到文件。
2.5. 數據服務
數據服務(Data Service)是將全企業級的數據提供服務能力,通過服務化包裝,以服務接口的方式對業務系統提供數據。
數據服務除了將原來散布各處的數據服務整合,實現數據服務的統一對接及出口,也可以支持基于數據服務配置數據API,通過統一接入統一管理的方式,實現全企業級數據服務的發布、申請、對接調用、鑒權、監控、限流管控,從而實現數據服務的統一管控。
數據服務是從系統應用層面為數據使用方提供安全、統一的數據。
2.6. 數據生命周期
任何事物都具有一定的生命周期,數據也不例外。數據生命周期(Data Life Cycle)是從數據的產生、加工、使用乃至消亡,基于有一個科學的管理辦法,將極少或者不再使用的數據從系統中剝離出來,并通過核實的存儲設備進行保留,不僅能夠提高系統的運行效率,更好的服務客戶,還能大幅度減少因為數據長期保存帶來的儲存成本。
數據生命周期一般包含在線階段、歸檔階段(有時還會進一步劃分為在線歸檔階段和離線歸檔階段)、銷毀階段三大階段,管理內容包括建立合理的數據類別,針對不同類別的數據制定各個階段的保留時間、存儲介質、清理規則和方式、注意事項等。
2.7. 數據開發
數據開發(Data Development)指圍繞數據全生命周期打造全流程統一標準化的工具能力,對數據模型設計、數據加工處理程序開發、測試、上線等進行統一管理的活動。一般情況下,數據開發包含離線開發和實時開發。
離線開發,又叫做離線數據開發,指通過編制數據加工表達式處理昨天或者更久前的數據,時間單位通常是天、小時。
實時開發,又叫做實時數據開發,處理即時收到數據,時效主要取決于傳輸和存儲速度,時間單位通常是秒、毫秒。
2.8. 數據安全
數據安全(Data Security)為數據處理系統建立和采用的技術和管理的安全保護,保護計算機硬件、軟件和數據不因偶然和惡意的原因遭到破壞、更改和泄露。由此計算機網絡的安全可以理解為:通過采用各種技術和管理措施,使網絡系統正常運行,從而確保網絡數據的可用性、完整性和保密性。
數據分類目錄,又稱數據目錄,指根據組織數據的屬性或特征,將其按照一定的原則和方法進行區分和歸類,并建立起一定的分類體系和排列順序,以便更好地管理和使用組織數據的過程。
數據目錄是數據保護工作中的一個關鍵部分,是建立統一、準確、完善的數據架構的基礎,是實現集中化、專業化、標準化數據管理的基礎,也是數據資產盤點重要的依賴數據。

數據分級,又稱敏感等級,是指在數據分類的基礎上,采用規范、明確的方法區分數據的重要性和敏感度差異,按照一定的分級原則對其進行定級,從而為組織數據的開放和共享安全策略制定提供支撐的過程。

靜態脫敏,是將數據抽取進行脫敏處理后,下發至測試庫,脫敏后的數據與生產環境隔離,滿足業務需要的同時保障生產數據庫的安全。靜態脫敏是不可逆的動作,可以概括為數據的“搬移并仿真替換”。
動態脫敏,是基于脫敏規則,對敏感數據的查詢和調用結果進行實時脫敏,確保返回數據可用性和安全性。動態脫敏可以概括為“邊脫敏,邊使用”。
3.1. 業務數據業務數據(Business Data)是業務處理過程中或事物處理所產生的數據,也稱交易數據。業務數據生成主要有三種情況:一、業務交易過程中產生的數據,例如:計劃單、銷售單、生產單、采購單等,這部分數據多數人為產生;二、系統產生的數據,包括,硬件運行狀況、軟件運行狀況、資源消耗狀況、應用使用狀況、接口調用狀況、服務健康狀況等;三、自動化設備所產生的數據,IOT物聯網的各類設備運行數據、生產采集數據等等。不論來源何處,這里數據有一個共同的特點就是時效性強、響應高、數據量大。
3.2. 主數據主數據(Master Data)是指用來描述企業核心業務實體的數據,是企業核心業務對象、交易業務的執行主體。是在整個價值鏈上被重復、共享應用于多個業務流程的、跨越各個業務部門和系統的、高價值的基礎數據,是各業務應用和各系統之間進行數據交互的基礎。從業務角度,主數據是相對“固定”的,變化緩慢。主數據是企業信息系統的神經中樞,是業務運行和決策分析的基礎。例如客戶、企業組織機構和員工、產品、渠道、科目等。
3.3. 數據價值數據價值(Data Value)是對數據內在價值的度量,可以從數據成本和數據應用價值兩方面來開展。數據成本一般包括采集、存儲和計算的費用(人工費用、IT設備等直接費用和間接費用等)和運維費用(業務操作費、技術操作費等)。數據應用價值主要從數據的分類、使用頻次、使用對象、使用效果和共享流通等方面計量。
3.4.資產目錄數據資產目錄(Data Asset Catalog),簡稱資產目錄,是指對數據中有價值、可用于分析和應用的數據進行提煉形成的目錄體系。編制數據資產目錄主要是建立業務場景和數據資源的關聯關系,降低理解系統數據的門檻。
4.1. 數據管理&數據治理&數據資產的關系數據管理包含數據治理,“治理是整體數據管理的一部分”這個概念目前已經得到了業界的廣泛認同。數據管理包含多個不同的領域,其中一個最顯著的領域就是數據治理。數據資產是在數據治理的基礎上,核心是如何實現數據價值,體現數據價值,完成數據賦能。數據管理、數據治理、數據資產管理三者關系如圖所示。

GB/T34960《信息技術服務治理》第5部分提到,數據治理框架包含頂層設計、數據治理環境、數據治理域和數據治理過程四大部分。

頂層設計包含數據相關的戰略規劃、組織構建和架構設計,是數據治理實施的基礎。數據治理環境包含內外部環境及促成因素,是數據治理實施的保障。數據治理域包含數據管理體系和數據價值體系,是數據治理實施的對象。數據治理過程包含統籌和規劃、構建和運行、監控和評價以及改進和優化,是數據治理實施的方法。
在數據治理域中,數據管理體系主要組織應圍繞數據標準、數據質量、數據安全、元數據管理和數據生存周期等,開展數據管理體系的治理,至少包括:a) 評估數據管理的現狀和能力,分析和評估數據管理的成熟度;b) 指導數據管理體系治理方案的實施,滿足數據戰略和管理要求;c) 監督數據管理的績效和符合性,并持續改進和優化。
數據價值體系主要組織應圍繞數據流通、數據服務和數據洞察等,開展數據資產運營和應用的治理,至少包括:a) 評估數據資產的運營和應用能力,支撐數據價值轉化和實現;b) 指導數據價值體系治理方案的實施,滿足數據資產的運營和應用要求;c) 監督數據價值實現的績效和符合性,并持續改進和優化。
4.3.數據治理&數據資產&數據的關系
從數據層面來看,數據體系包括治理、管理和應用三個部分。治理是負責解決人與人、人與數據之間的事,管理負責各個職能領域,應用則是數據價值的實現。根據這三個維度,數據治理重點在治理,一般包含數據治理咨詢和數據治理實施,是數據在治理與管理的結合;數據資產偏重的是資產,一般重點體現數據的價值和數據的應用,基于數據資產盤點及價值分析,展示數據資產的價值和提供數據應用。
或者說,數據治理是在高層次上執行數據管理制度,對數據行使權力和控制的活動集合(規劃、監控和執行),數據資產重點是發現數據價值,通過提供數據應用的能力助力企業發展、提升企業運營能力。
數據是企業信息化的原料,數據治理是企業信息化的基石,數據資產基于數據治理的數據,挖掘數據價值,通過數據運營、數據分析的手段,為企業賦能,助力企業信息化的騰飛。