- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2023-08-09來源:愛情轉移瀏覽數:565次

三種元數據關系緊密,互為支撐。業務元數據指導技術元數據,技術元數據以業務元數據為參考進行設計,操作元數據為另外兩種元數據管理提供支撐。3. 元數據管理五大步驟
(1)定義元數據戰略:制定元數據戰略計劃,深度協同利益相關方,評估現有的元數據資源和信息架構,對關鍵員工重點訪談,制定戰略目標。(2)理解元數據需求:梳理元數據需求,需要由更新頻次,同步情況,歷史信息,訪問權限,存儲結構,運維要求,管理要求,質量要求等具體需求點滿足。(3)定義元數據架構:通常分為3類:集中式,分布式和混合式,不同技術框架滿足不同情境需求,可結合自身情況因地制宜選擇。(4)創建和維護元數據:結合企業業務范圍,梳理和整合元數據,把技術元數據,與業務,流程和管理元數據集成在一起,使元數據管理變得規范統一。(5)查詢、報告和分析元數據:元數據存儲庫應具有前端可視化應用程序,支持查詢和分析,從而滿足各類數據資產管理的需求。4. 元數據管理應用(1)數據資產地圖:由元數據字典自動生成的數據資產全景地圖,通過可視化方式展示數據處理過程,滿足不同場景下業務分析需求。
(2)元數據血緣關系:描述不同數據之間的聯系。當下游的數據出現錯誤,可以通過血緣關系快速找到上游的數據來源,了解數據處理過程,定位錯誤原因。(3)元數據影響度分析:描述數據由誰產生,去了哪里,經過哪些加工,哪些應用或部門使用了這些數據。當數據出現問題的時候,可以迅速定位錯誤并進行解決。二、主數據1. 定義主數據是用來描述企業核心業務實體的數據,比如客戶、合作伙伴、員工、產品、物料單、賬戶等;它是具有高業務價值的、可以在企業內跨越各個業務部門被重復使用的數據,并且存在于多個異構的應用系統中。主數據管理是指一整套的用于生成和維護企業主數據的規范、技術和方案,以保證主數據的完整性、一致性和準確性。
2. 主數據項目管理實施架構通過現狀分析與評估、規劃管理體系、建設實施方案,平臺落地部署四個步驟,逐步推動主數據項目管理的落地實施。
3.主數據項目實現階段的十大重要環節
(1)主數據標準化體系以物料為例, 完整的物料標準化體系主要包括物料數據標準的制定和物料數據標準化管理相關基礎能力建設兩大內容。(2)分類設計原則四大原則:不重不漏;粗細顆粒度合理;滿足業務需求;符合行業習慣。(3)編碼設計編碼設計需遵守全局性,唯一性、擴展性等原則。不同編碼方式滿足不同業務場景,各有優劣,可參考下表。
(4)屬性標準梳理:可以從業務標準、技術標準、管理標準三個層面來梳理。(5)管控流程設計:在業務系統建設過中進行流程審核以及校驗。(6)歷史數據整合:分為數據接入、初步標記、分類清理、先分后合、整理清洗、檢查反饋6個步驟。(7)數據切換策略:以下是三種數據切換策略各自優缺點。
(8)數據生產與維護策略:有集中式和分布式兩種。
(9)主數據分發策略:主數據的分發方式有以下三種。
(10)主數據集成示例
三、數據標準1. 定義數據標準是指保障數據的內外部使用和交換的一致性和準確性的規范性約束。數據標準管理是一套由管理制度、管控流程、技術工具共同組成的體系,基于該體系應用統一的數據定義、數據分類、編碼等實現數據的標準化。2. 分類(1)業務標準規范:包括業務的定義,標準的名稱,標準的分類等。(2)技術標準規范:是從技術角度定義數據標準,包括數據的類型、格式、編碼規則等。(3)管理標準規范:比如數據標準的管理者及使用者有哪些,如何增刪改查,訪問標準等。3. 數據標準管理實施步驟
(1)制定目標和界定范圍:首先明確數據標準目標,然后根據企業自身的管理和業務發展需求制定數據標準。
(2)數據標準調研:調研企業數據標準現狀,梳理問題點,為后續的數據標準落地提供支撐和指導。(3)明確組織和流程:確定數據治理管控委員會,數據標準管理崗,數據標準管理專員等崗位角色及責權分配,同步制定標準變更、落地、管理流程,充分保障數據標準落實。(4)數據標準編制與發布:通過收集國標、行標要求,結合企業自身管理和業務要求,經過各部門的協調溝通后,制定出初版的數據標準管理文檔。經過數據標準審核后,正式發布。(5)數據標準宣貫:向內部組織數據標準宣貫會,提升企業內部人員對數據標準管理的理解及重視程度,讓數據標準可以更好更快實行,從而發揮價值。(6)數據標準平臺落地運營:落地數據標準管理平臺,通過管理、技術、業務不同維度驗證有效性,確定滿足要求后,投入到實際場景中。此外,還需定期評估,保障數據標準與企業管理經營發展的適應性。
四、數據質量1. 定義數據質量是指數據符合數據消費者的使用目的,需要滿足業務場景具體的需求。數據質量包含兩個維度:數據自身的質量和數據的過程質量。數據質量管理是對數據整個生命周期每個階段里可能引發的數據質量問題,進行識別、度量、監控等一系列管理活動,不斷改善組織的管理水平進一步提高數據質量。2. 四種常見數據質量問題(1)數據缺失:指的是一些重要數據未被填充。針對缺失數據,可通過基礎統計分析,找到未填寫數據,進行填充。(2)數據異常:指的是數據與實際業務有較大差別,影響數據分析結果。針對異常數據,需要基于基礎數據,判斷數據變量是否超出合理范圍,如果異常,系統會自動報警提醒。(3)數據不一致:指的是在數據集成匯總的時候,多個系統分布的相同數據,出現不一致的現象。針對數據不一致,可以基于數據抽取規則,對于大部分相同但不一致的數據,進行鑒別和修訂。(4)數據重復或錯誤:指的是一些數據出現重復統計,數據填寫錯誤。針對重復數據,可以在系統中設置過濾限定條件,自動查重,清除重復數據.3. 數據質量評判六大維度全國信息技術標準化技術委員會提出了數據質量評價指標(參考GB/T36344-2018 ICS 35.24.01),具體參考下圖。
4. 數據質量管理七部曲
(1)定義高質量數據通過全面了解痛點、風險和業務驅動因素,梳理業務流程、系統應用情況、技術結構和數據依賴關系,對數據質量改進的目標達成一致。(2)定義數據質量戰略數據質量優先級必須與業務戰略一致,定義數據質量框架有助于指導戰略及開展數據質量管理活動。(3)識別關鍵業務和質量規則根據監管要求、財務價值和對客戶的直接影響等因素對數據進行優先級排序。在確定關鍵數據后,識別梳理數據質量特征要求的業務規則。(4)執行初始數據質量評估確定關鍵的業務需求和數據后,通過執行初始數據質量評估了解數據,定義可操作的改進計劃,通過評估結果確認問題及優先級,并作為數據質量規劃的基礎。(5)識別改進方向并確定優先級在經過初步數據質量評估后,識別改進措施,確定優先級,可以通過對大數據集進行全面的數據分析來了解問題的廣度,或與利益相關方進行溝通,分析問題的業務影響,最終討論確定優先順序。(6)定義數據質量改進目標根據數據質量改進帶來的業務價值進行量化,設定具體的、可實現的目標。(7)開發和部署數據質量操作圍繞數據質量方案制定實施計劃,管理數據質量規則和標準、監控數據與規則的執行一致性,識別質量問題,并報告質量水平。五、數據資產1. 定義數據資產是是指由個人或企業擁有或者控制的,能夠為企業帶來經濟利益的,以物理或電子的方式記錄的數據資源。數據資產管理是指對數據資產進行規劃、控制和提供的一組活動職能,包括開發、執行和監督有關數據的計劃、政策、方案、項目、流程、方法和程序,從而控制、保護、交付和提高數據資產的價值。2. 數據資產盤點(1)自上而下梳理以業務視角,通過對企業的制度文件、業務流程、業務單據等進行梳理分析,逐層分解,梳理數據資產的逐級目錄、業務屬性等。
(2)自下而上盤點以技術視角,從IT系統—數據庫表—數據結構出發,進行自下而上總結,逐步明確數據資產相關的技術屬性。3. 數據資產目錄通過數據資產目錄,能夠明確數據在哪里、由誰負責,如何使用等一系列問題。
4、數據資產管理4大步驟
(1)統籌規劃:是數據資產管理實施的第一階段,包括評估管理能力、發布數據戰略、建立企業責任體系三個步驟,為后續數據資產管理和運營錨定方向。(2)管理實施:該階段的目標主要是通過建立數據資產管理的規則體系,依托數據資產管理平臺工具,以數據生命周期為主線,全面開展數據資產管理各項活動,推動第一階段成果落地。(3)稽核檢查:稽核檢查階段是保障數據資產管理實施階段涉及各管理職能有效落地執行的重要一環。該階段包括檢查數據標準執行情況、稽核數據質量、監管數據生命周期等具體任務。(4)資產運營:資產運營階段是數據資產管理實現價值的最終階段,該階段包括開展數據資產價值評估、數據資產運營流通等。六、數據交換1. 定義數據交換共享是指為了滿足不同信息系統之間數據資源的共享需要,依據一定的原則,采取相應的技術,實現不同信息系統之間數據資源共享的過程。
2. 數據交換與共享方法(1)電子或數字文件傳輸數據可以通過電子或數字文件傳輸進行交換,通過文件傳輸(通信)協議在兩個系統之間傳輸文件(數據)。各組織需要考慮與使用不同文件傳輸協議帶來的安全風險;文件傳輸協議包括FTPS、HTTPS和SCP。(2)便攜式存儲設備在某些情況下,可能需要使用便攜式存儲設備交換數據, 例如可移動磁盤(數字視頻光盤 (DVD))或通用串行總線 (USB)等)。組織需要考慮被傳輸數據的影響級別以及數據將要傳輸到的系統的影響級別,以確定所交換的數據是否采取了足夠的措施。(3)電子郵件組織經常通過電子郵件以附件的形式共享數據。組織需要考慮參與組織的電子郵件基礎設施的影響級別和已經實施的安全控制,以確定是否實施了足夠的控制措施來保護正在交換的數據,例如,在中等影響級別受保護的電子郵件基礎設施不足以保護高影響級別的數據。(4)數據庫數據庫共享或數據庫事務信息交換,包括來自另一個組織的用戶對數據的訪問。組織需要考慮的是提供數據訪問而不是傳輸數據的可行性,以減少重復數據集以及數據機密性和完整性損失的風險。(5)文件共享服務文件共享服務包括但不限于通過基于 Web 的文件共享或存 儲共享數據和訪問數據(例如 Drop Box、Google Drive、MS Teams 或 MS One Drive)。使用基于Web的文件共享或存儲系統,該系統無法讓數據所有者了解服務器所在位置,或對設施、服務器和數據的物理和邏輯訪問。3. 數據交換共享的五個原則(1)一致性原則:提供數據共享服務前,要確定每項數據的源頭單位, 由源頭單位對數據的準確性、一致性負責。減少數據“搬家”,從而減少向下游二次傳遞所造成的數據不一致問題。(2)黑盒原則:數據使用方不用關注技術細節,滿足不同類型的數據共享服務需求。(3)敏捷響應原則:數據共享服務一旦建設完成,并不需要按數據使用方重復構建集成通道,而是通過“訂閱”該數據共享服務快速獲取數據。(4)自助使用原則:數據共享服務的提供者并不需要關心數據使用方怎么“消費”數據,避免了供應方持續開發卻滿足不了數據使用方靈活多變的數據使用訴求的問題。(5)可溯源原則:所有數據共享服務的使用都可管理,數據供應方能夠準確、及時地了解“誰”使用了自己的數據,確保數據使用的合理。七、數據安全1. 定義數據安全是保護數字信息資產免遭未經授權的訪問、披露、修改或盜竊的做法。數據安全治理是基于安全合規要求、業務發展需要和風險承受能力等多重因素,實現業務與安全融合發展的安全建設機制。2. 數據安全管理能力(1)組織治理數據安全治理組織可采用5層結構,即決策層、管理層、執行層、監督層和參與層。
(2)制度治理數據安全制度體系主要從4個層面進行建設。
3. 數據安全技術能力數據安全技術能力治理主要是對技術措施的建設,圍繞數據全生命周期的各個階段采取相應的安全防護措施,包括分類分級、數據庫審計、加密傳輸、數據防泄漏、數據脫敏、數據水印、用戶行為分析等。4. 數據安全運營能力通過構建數據安全隱患發現及處置機制、數據安全風險評估機制、數據安全突發事件應急響應機制、數據安全監控與審計機制,形成規范化、流程化、智能化運營的長效安全運營體系。
八、數據生命周期1. 定義數據生命周期分為:采集、存儲、整合、呈現與使用、分析與應用、歸檔和銷毀幾個階段。數據生命周期管理是一種基于策略的方法,用于管理信息系統的數據在整個生命周期內的流動:從數據創建和初始的存儲,直到被刪除或銷毀。2.?常見的數據生命周期管理模型在數據管理領域,學術界和企業界的許多研究人員提出了不同的數據生命周期管理模型,如下圖所示。
3. 數據生命周期管理的四個階段(1)“入”期該階段不僅僅指數據的創建,有效的數據資產管理應在數據的產生之前開始。首先應該做好規劃和計劃,包括數據資產盤點、數據治理計劃、數據需求計劃等;然后對數據標準進行定義,制定數據管理規范,確保數據按照標準產生。(2)“存”期面對不同數據結構、數據形式、時效性、性能要求和存儲與計算成本等因素,應該使用適合的存儲形式與計算引擎。(3)“用”期該階段是數據真正產生價值的周期。在“用”期間要特別強調“數據復用”,這對于節省成本,提高效率非常重要。未來企業或組織在評估一個數據產品是否值得開發關鍵的一個指標應該看能否復用。(4)“出”期“出”期是將生命周期步入尾聲的數據保存到低性能廉價的存儲介質或直接銷毀,是必不可少的步驟。對于數據的銷毀,企業應該有嚴格的管理制度,建立數據銷毀的審批流程。只有通過流程審批的數據才可被銷毀。