日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

首頁 行業百科 數據治理與數據中臺的關系

數據治理與數據中臺的關系

|億信華辰大數據知識庫2021-12-03

隨著信息化建設以及互聯網技術的發展,數據治理及數據中臺建設項目,涉及的細分領域也越來越多。下面介紹什么是數據治理,什么是數據中臺,兩者之間有什么關系?

    什么是數據治理
    數據治理是針對數據管理的質量控制規范,它將嚴密性和紀律性植入企業的數據管理、利用、優化和保護過程中。它是對數據資產管理行使權力和控制的活動集合(規劃、監督和執行)。傳統的數據治理內容通常包含數據標準管理、元數據管理、數據質量管理、數據安全管理、數據生命周期管理等內容。
    什么是數據中臺
    而數據中臺是一套可持續“讓企業的數據用起來”的機制,是一種戰略選擇和組織形式,是依據企業特有的業務模式和組織架構,通過有形的產品和實施方法論支撐,構建的一套持續不斷把數據變成資產并服務于業務的機制。
    數據治理與數據中臺的關系
    數據中臺和數據治理工作準確來說都是一個體系性的工作。下面從它們具體落地實踐中的技術領域,介紹兩者的關系。
    數據倉庫
    數據中臺建設中,由于會和實時業務應用深度結合,對數據的實時性的要求高,因此數倉建設一般會定位為統一實時數倉的建設。并且數據中臺會存儲更多的用戶類的行為數據及其它原始數據,它要求的數據存儲量級更大,會混合使用分布式關系數據庫、NoSQL、甚至分布式文件系統等多種存儲服務,而數據治理更多聚焦結構化數據,主要使用一些分布式數據庫及NoSQL數據庫。
    數據治理中,一般將數據倉庫中的數據分為4層,包括ODS(貼源層數據)、基礎數倉層、MDM(主數據)、數據集市層;而數據中臺會增加2層,包括標簽數據層和ADS(應用數據層),以對接實時線上業務的數據應用及用戶運營。
    ETL
    數據治理一般采用ETL(Extract-Transform-Load,抽取-轉換-存儲),而數據中臺使用ELT(Extract-Load-Transform,抽取-存儲-轉換),先優先保障數據存儲,再進行異步批量處理。采用ELT除了在處理效率方面有優勢外,另一個好處是存儲的數據更全面,防止遺漏一些當前無法識別出來的潛在的有價值的數據。
    數據抽取方面,數據治理工作主要聚焦于存在于應用系統中的,數據庫中的企業的經營類數據,而數據中臺還會關注用戶行為數據、原始日志數據等,數據來源除了數據庫之外,還有日志埋點、音視頻等非結構化和半結構化數據。由于數據中臺統一實時數倉的建設要求,所以在數據抽取上有實時抽取的需求,這涉及到數據源的實時監控以及在數據接收機處理端的數據訂閱服務及消費服務。這些實時能力在數據治理中一般不涉及。
    主數據管理
    主數據是組織中需要跨業務、跨部門、跨系統共享的核心業務實體數據,是企業的核心數據,這些數據由于應用廣泛,必須嚴格保證其唯一性、一致性、準確性、實時性。數據治理及數據中臺建設都離不開主數據管理,兩者使用的方法及數據定義、處理方式沒有大的區別。部分數據中臺產品中,會將相當一部分標簽數據也納入主數據管理范疇之中。
    元數據管理
    數據中臺會包含標簽及標簽類目的定義及開發工作,對用戶、業務、市場進行打標,在此基礎上構建人、事、物的“畫像”,以方便進行精細化運營業務的開展。而標簽的開發必然涉及特征工程及算法的應用,這也是數據中臺和數據治理很重要的一個區別,一般數據治理工作主要是為特征工程及算法開發提供準確、一致的數據,但本身并不介入特征工程及算法開發工作。
    數據安全
    數據安全管控貫徹整個數據治理及數據中臺建設,一般都會采用多級授權的機制,上級數據管理員會將某一個數據域或者數據主題下的模型或者表的權限整體授權給下一級數據管理員,再由下一級數據管理員進行更細化的授權控制。數據中臺由于介入業務應用,因此使用人員中增加了業務運營人員,在數據授權人群上會更廣泛一些。
    數據質量
    傳統數據治理工作中,對數據質量的要求會比較高。所以在數據抽取中會采用ETL模式,邊抽取邊檢查、轉換,以保證存儲的數據必須是準確、完整、一致。而數據中臺由于容納的數據更多,因此在數據質量管控上會采用更靈活的策略,一般采用ELT的方式,存儲全量的原始數據,允許存在一定的冗余。另外,由于數據中臺存儲的數據量更大,進行全量數據管控成本太高,所以一般會根據數據新鮮度及價值進行分級的質量檢測管控。
    數據應用門戶
    數據中臺建設會介入特征工程領域及算法開發,開展數據智能、數據科研、預測分等。因此在數據應用門戶上還必須為這些數據應用及開發能力提供相應的功能,所以,數據中臺的應用門戶的復雜度要遠超數據治理。
    數據服務接口
    數據中臺由于存儲了大量標簽數據,比數據治理多提供了實時服務接口。

如何選擇數據治理平臺

    目前市場上數據治理平臺百花齊放,各有優缺點。其中,億信華辰憑借雄厚的實力處于大數據領域前沿,因此,旗下自主研發的睿治數據治理平臺成為國內主流。睿治數據治理平臺融合數據集成、數據交換、實時計算存儲、元數據管理、數據標準管理、數據質量管理、主數據管理、數據資產管理、數據安全管理、數據生命周期管理十大產品模塊,打通數據治理各個環節,十大產品模塊可獨立或任意組合使用,快速滿足政府、企業各類不同的數據治理場景。
認為本內容有幫助
0
您可能需要的數據產品
億信華辰助力政企數字化轉型
customer

在線咨詢

在線咨詢

點擊進入在線咨詢