- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2024-07-10來源:帥到靈魂深處瀏覽數:1546次
引言部分,總領全篇文章的中心內容。
數據資源目錄是構建數據資產體系的最基礎操作,通過資源目錄的定義,能夠讓數據管理方掌握自己有哪些數據,哪些數據是共享的,哪些數據有什么安全等級等等,并在識別出自身數據資源的基礎上,進一步構建數據資源目錄,在數據資產規范體系的基礎上發揮數據價值,達到數據可見、可管、可用。
01數據資源目錄的理解
數據資源目錄是通過對信息資源依據規范的元數據描述,按照一定的分類方法進行排序和編碼的一組信息,用以描述各個信息資源的特征,以便于對信息資源的檢索、定位與獲取。也就是說,數據資源目錄是站在數據管理的全局視角,對所有的數據資源進行編目的一組信息,是實現信息資源共享、業務協同和數據開放的基礎,是各部門之間信息共享及數據開放的依據。
02數據資源目錄的實施步驟
信息資源目錄編制工作包括對數據資源目錄的范圍定義、資源目錄架構設計、數據資產盤點和數據目錄發布四個階段:

圖一:數據資產目錄實施步驟
一、定義范圍
在進行數據資源編目之前,需要由數據管理部門組織對數據資產目錄的范圍進行定義,要搞清楚資源編目的活動會涉及到哪些部門的數據、哪些應用系統的數據以及這些數據的分布情況,以便對后續的資源目錄盤點進行范圍確認。通過這一環節,形成資源編目需要收集信息的主要來源。
二、數據目錄架構設計
1、元數據構成
數據資源目錄當中的很多屬性信息是來源于元數據(圖二),上面也提到了數據資源目錄是通過對信息資源依據規范的元數據描述,所以這里我們先要理清楚有哪些元數據信息是需要先定義好的。通常主要包括:
信息資源名稱:描述數據資源內容的標題。
信息資源名稱:描述數據資源內容的標題。
信息資源代碼:數據資源唯一且不變的標識代碼。
信息資源分類:可以依據組織的業務需求和應用需求自行劃分數據資源的分類。(常用分類包括行業分類、業務分類、管理對象分類、主題分類、信息類別分類)
數據資源提供方:提供數據資源的部門。
數據資源提供方代碼:提供數據資源的部門代碼。
數據資源摘要:對數據資源內容或關鍵字段的概要描述。
數據資源格式:對數據資源存在方式的描述,如電子文件、電子表格、數據庫、圖形圖像、流媒體、自描述格式、其他等。
數據項信息:對結構化數據資源的細化描述,包括數據項名稱、數據類型、數據項共享類型、數據項開放類型等。
共享屬性:對數據資源共享屬性的描述,包括共享類型、共享條件、共享方式等。
開放屬性:對數據資源是否面向組織外部開放及開放條件的描述,包括是否向社會開放、有條件開放、無條件開放。
更新周期:數據資源更新的頻度,可以分為實時、每日、每周、每月、每季度、每年等。
發布日期:數據資源提供方發布數據資源的日期。
關聯資源代碼:數據資源在目錄中重復出現時的關聯性標注。
2、數據分類編碼
數據資源目錄的分類是根據數據資源內容的屬性或特征,結合行業和業務調整,對數據資源進行一定原則和方法進行區分和歸類。按照國標內容的要求,信息資源目錄的編碼原則與方法應遵循《GB_T 7027-2002 信息分類和編碼的基本原則與方法》中混合分類方法的規定。分類類目編碼應遵循《GB 18030-2022信息技術 中文編碼字符集》的規定,采用英文字母和阿拉伯字母。

圖二:數據分類方式
3、數據分級定義
數據分級主要是從數據的保護措施角度考慮,通過數據定級讓數據管理者意識到當前的數據資產當中有哪些數據安全等級是比較高的,應如何針對性的管理,當然說到數據分級,就要談到相關的法律法規。
數據安全法:第二十一條 國家建立數據分類分級保護制度,根據數據在經濟社會發展中的重要程度,以及一旦遭到篡改、破壞、泄露或者非法獲取、非法利用,對國家安全、公共利益或者個人、組織合法權益造成的危害程度,對數據實行分類分級保護。
網絡數據安全管理條例(征求意見稿):第五條 國家建立數據分類分級保護制度。按 照數據對國家安全、公共利益或者個人、組織合法權益的影 響 和重要程度,將數據分為一般數據、重要數據、核心數據,不同級別的數據采取不同的保護措施。
在國家標準《GB/T 25069-2010信息安全技術術語》中,沒有定義信息或數據分級,但有安全分級的定義,其內涵實際上是包括了信息的分級:安全分級(security classification):根據業務信息和系統服務的重要性和受損影響,確定實施某種程度的保護,并對該保護程度給以命名。依據訪問數據或信息需求,而確定的保護程度,同時賦予相應的保護等級。例:“絕密”、“機密”、“秘密”。
在數據分級的概念上,目前各行業對于分級的粒度也有所不同,如運營商、銀行、政務、醫療等不同行業對分級的定義,大體上是參考以下部分國標:
GB /T ?39477 -2020 信息安全技術 政務信息共享 數據安全技術要求
GB/T 35273 -2020 信息安全技術 個人信息安全規范
GB/T 38667-2020 信息技術 大數據 數據分類指南
GB/T 38664.1-2020 信息技術 大數據 政務數據開放共享 第 1 部分:總則
《中華人民共和國數據安全法》
《中華人民共和國個人信息保護法》
《政務信息資源共享管理暫行辦法》(國發〔2016〕51 號)

圖三:政務數據分級定義


圖四:移動公司數據分級定義
3、共享屬性定義
信息資源目錄按共享類型分為無條件共享、有條件共享、不予共享等三種類型。
可提供給所有部門共享使用的信息資源對應目錄屬于無條件共享類。
可提供給相關部門共享使用或僅能夠部分提供給所有部門共享使用的信息資源對應目錄屬于有條件共享類。
不宜提供給其他部門共享使用的信息資源對應目錄屬于不予共享類。
三、數據資源盤點
明確了數據資產目錄的結構之后,接下來就是對數據資產進行盤點,規定如何完成數據目錄的劃分,這是定義數據資源目錄最復雜的問題。
一般做這項工作至少需要4-5個人,同時牽頭組織人還需要具備以下技能:
掌握業務,如果不懂,組內必須有人要懂
熟悉有哪些部門,每個部門的職責是什么
針對數據庫有比較深的理解
針對數據架構有比較深的理解
針對數據治理實施方法論有比較深的理解
數據資產盤點的成果是數據資產清單或數據資產目錄,它能從全局層面直觀的展現單位擁有的數據資產情況,幫助數據管理方進行更有效的數據利用和管理,明確數據保護目標,協助完成數據安全保護體系的構建。
數據資產盤點應該以數據價值為導向,以統一標準為核心。因此,在進行數據資產盤點前,我們需要明確以下幾點:
單位在日常經營活動中,積累了體量龐大的數據
只有可控的、能帶來利益的數據才是數據資產
數據使用和保護的前提是知道有哪些數據、在哪里
統一的數據定義和價值標準,將有利于數據的使用和管理
明確數據的歸屬,將為跨業務的數據使用和數據安全保護落實提供便利
數據資產盤點主要分為:收集元數據信息、數據分類劃分、數據分級劃分、數據共享屬性確定。
(1)收集元數據信息
元數據信息在收集環節可以不完全依賴技術元數據、管理元數據和操作元數據的劃分來區分,根據調研的不同對象,可以按照部門元數據和數據中臺元數據兩個方向來收集,這樣通過元數據的收集,可以記錄不同的數據對象分別來源哪個應用系統,數據庫及部門等信息。

關于元數據的實施開展,請本號另一篇文章《元數據管理如何開展實施》
(2)數據分類定義
數據分類的定義需要有業務專家參與,對數據的分類沒有十分嚴格的邊界,因為很多數據是跨業務環節,所以需要由業務專家牽頭,結合數據清單識別數據的不同業務屬性,主題域屬性進行劃分。

圖六:數據分類
(3)數據分級定義
數據分級即結合數據涉密等級標準,對數據的安全等級進行評估,數據安全分級的方式應采用自下而上的方式進行定義,即先對數據項當中的敏感數據進行識別,定義敏感字段的等級,數據項的分級由當前數據項中敏感等級最高的級別作為定義級別。這里可以輔助《數據安全分級目錄》模板進行定義。

圖七:數據安全分級目錄
(4)共享屬性定義
數據的共享屬性需要由數據管理方與數據歸屬方共同確認數據的共享屬性,判斷哪些數據字段是可共享的,哪些數據是不可共享的,這其中還牽扯到數據安全的責權問題,所以數據共享屬性最終的確認是由多方進行評審。

圖八:數據共享屬性定義
(5)其他屬性定義
其他屬性主要是針對與數據信息項字段的定義,這里結合目錄編制需求可以自行擴展,基本包含數據的類型、數據長度、數據精度、數據屬性等,這些內容也是元數據管理的基本內容。

圖九:其他屬性定義
四、形成資產目錄
數據資產目錄是數據資產盤點的最終成果,也是數據資產管理的第一步。它所有數據進行匯總,構建出一張全局的數據地圖,清晰的展現出企業擁有的數據內容、數據量、數據價值、數據存儲位置以及數據歸屬和責任人,幫助企業掌握其擁有的所有數據及數據價值,為相關單位進行數據使用、數據價值挖掘以及數據保護提供指導依據,同時指導相關單位進行數據規劃和數據體系搭建。
(1)目錄評審
數據資產目錄填報完成之后,需要由數據管理方與相關業務方共同進行評審,主要針對數據的分級分類定義、共享屬性定義、權屬定義進行多方確認,通過確認達成一致的認可,作為數據主管部門長期維護的數據資產內容。
(2)目錄發布及維護
經會商確認后的數據資產目錄應形成版本管理,由數據管理方實時更新數據資產目錄內容,提供數據業務單位了解數據信息,作為數據使用環節的參考依據
(3)目錄服務
數據資產目錄服務主要包括數據資產目錄訂閱和數據共享交換應用。以數據服務的方式開放對資產目錄的訪問以及共享數據的使用,使數據資產在規范化的前提下發揮數據價值。
相關數據資產模板請關注公眾號獲取