日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

數據架構與數據倉庫精解:從基礎到實踐的全面指南

時間:2024-05-12來源:可能否瀏覽數:429

一、什么是架構?

了解數據架構之前首先需要了解到底什么是架構?

把一個整體(完成人類生存的所有工作)切分成不同的部分(分工),由不同角色來完成這些分工,并通過建立不同部分相互溝通的機制,使得這些部分能夠有機的結合為一個整體,并完成這個整體所需要的所有活動,這就是架構。

舉例理解:最開始人類是住在山洞里,住在樹上的,主要是為了躲避其他猛獸的攻擊,以及減少自然環境的變化。為了完成這些目標,人類開始學會在平地上用樹木和樹葉來建立隔離空間的設施,這就是建筑的開始。但是完全隔離也有很多壞處,慢慢就產生了門窗等設施。建筑的本質就是從自然環境中,劃出一塊獨占的空間,但是仍然能夠通過門窗等和自然環境保持溝通。這個時候架構就已經開始了。

人們對建筑的需求慢慢的越來越多,空間的切分也會變成很多種,組合的方式也會有很多種,比如每個人住的房子,需要區分廚房、洗手間、書房、臥室等等,這個時候人們就開始有意識的去設計房子,架構師就慢慢的出現了。一切都是為了滿足人的越來越高的需求,提升質量,減少時間,更有效率的切分空間,并且讓空間之間更加有機的進行溝通。這就是建筑的架構以及建筑的架構的演變。

二、數據架構

內容概要:此部分內容重點回答數據架構包含什么內容以及數據架構基本內容輸出示例

數據架構可以讓管理者從企業的全局視角了解企業、客戶和市場,通過數據更好地支撐企業運營。企業數據架構規劃的目標是打破信息孤島,實現企業信息數據共享。

1、數據架構基本概念

TOGAF由國際標準權威組織The Open Group制定。The Open Group于1993年開始應客戶要求制定系統架構的標準。TOGAF是一個架構框架,它是事實上的全球標準,可用來規劃、開發、實現、治理和維護一個架構。

國際數據管理協會(DAMA)是一個全球性數據管理和業務專業志愿人士組成的非營利協會,致力于數據管理的研究和實踐。DAMA國際自1980年成立以來,一直致力于數據管理的理論研究、實踐、教訓及相關知識體系的建設,在數據管理領域累積了極為深厚的知識沉淀和豐富經驗。

數據架構是什么有多重解讀和方案,但是隨著業界理論體系的不斷完善,以及企業級數據治理工作的不斷深入,目前的領先企業、數據治理組織的理論準備工作已經逐步收斂到四個方向,即:數據資產目錄、數據標準、數據模型、數據分布。

以上,可以稱為數據架構體系的“四個基本內容”,具體而言應該包括:梳理企業的數據資產、制定數據標準并持續維護、建立數據模型,包括概念模型、邏輯模型和物理模型、管控數據分布,包括數據源頭和流向。

業務視角:數據資產目錄、數據標準 。

IT視角:數據模型、數據分布。

2、數據架構基本內容介紹

數據資產目錄

數據資產目錄:通過分層結構的表達,實現對數據的分類和定義,建立數據模型的輸入,形成完善的企業業務數據資產地圖。通過數據資產目錄,可以解決數據在哪里、數據誰負責,數據如何用等一系列問題。從數據本身出發,按對象進行數據全生命周期管理。

數據標準

數據標準:數據標準定義公司層面需共同遵守的屬性層數據含義和業務規則,是公司層面對某個數據的共同理解,這些理解一旦確定下來,就應作為企業層面的標準在企業內被共同遵守。業務視角而言用于統一業務側語言和理解,明確定義每個屬性,所遵從的業務定義和用途、業務規則、同義詞,并對名稱進行統一定義,避免重復。

數據模型

數據模型:是從數據視角對現實世界特征的模擬和抽象,根據業務需求抽取信息的主要特征,反映業務信息(對象)之間的關聯關系。數據模型不僅能比較真實地模擬業務(場景),同時也是對重要業務模式和規則的固化。具體包括概念模型、邏輯模型和物理模型。

信息鏈:表達數據在業務流程的流轉。

數據流:表達數據在IT系統的流轉。

三、數據架構的設計和管理

在說清數據架構的組件之后,更加實際的問題是如何設計數據架構,實現理論的落地。無疑,數據架構的設計因行業而異,也因企業而異,但是也有一些共性和原則。總結而言無非是:面向業務對象進行架構設計,以及面向業務對象實現架構落地。

所謂面向業務對象進行架構設計,即是企業數據架構的設計應當以業務對象為基石,展現業務對象的屬性特征,描摹業務對象間的關聯關系。面向業務對象實現架構落地則是針對數據模型而言的,因為數據架構最為重要的交付產物就是數據模型。

四、數據倉庫架構

內容概要:此部分內容重點回答數據倉庫的精髓是什么,為什么會出現ODS以及數據集市,為什么在ODS-DW-DM架構之上還要對數據倉庫再進行分層。

傳統數倉架構:(ODS-數據倉庫-數據集市)ODS

需要ODS的理由:業務系統是非集成且難以處理的。當組織需要集成數據并且無法修改或者改造已有的系統環境時,就需要用到ODS。ODS出現的動因還源自于組織有時需要對集成數據進行在線更新。同時ODS保留原始數據,與業務系統基本同構(可能會增加管理字段), ODS集成了所有(有入倉的)的數據 。

數據倉庫基本介紹

1)數據倉庫的誕生

隨著計算機使用的爆炸式增長,人們創建的數據量和數據類型也都有了爆炸性增長,人們開始希望擁有集成化數據,而不僅僅滿足于從某個應用程序獲取數據,人們需要以一種內聚式的方式看待數據。于是,數據倉庫誕生了。

2)數據倉庫的精髓

數據倉庫的精髓就在于顆粒化的數據。數據倉庫中顆粒化的數據為商業智能和許多其它形式的分析奠定了基礎。它就像一桶滿滿的沙粒,可以采用多種方式重塑這些沙粒的形態。數據倉庫是所有數據的集合,包括日志信息、數據庫數據、文本數據、外部數據等都集成在數據倉庫中。

數據倉庫的好處

分析師能夠很快獲取數據。數據已經存在于數據倉庫之中靜待分析。而且在開始分析之前無需再做集成工作。 對于所有分析師而言,數據的集成都是一致的。不會出現一個分析師這樣來集成數據,而另一個分析師那樣來集成數據的情況。 數據協調具有了現實的可行性。如果兩個分析師得到的結果出現了差異,進行數據協調工作也只是一個簡單問題。 如果需要建立全新的分析,數據倉庫能夠為之提供數據基礎。 如果有必要進行合規性檢查或者審計,會有可信的數據基礎來支持分析。

五、數據集市(DM)

為了滿足各種獨特視角對匯總數據和合計數據的不同需求,人們采用了一種不同的數據結構-數據集市。不同的組織都有其自己的數據視角。所有的數據都源自數據倉庫中的顆粒化數據。

六、數據倉庫分層

數倉為何分層?

其核心都是為了讓數據倉庫在應對分析場景、業務應用場景時更高效。數倉分層保障了數據在進入數據倉庫之前都經過清洗和過濾,使原始數據不再雜亂無章,優化了查詢過程,有效的提高了數據獲取、統計和分析的效率。同時,數倉分層實現了各種不同維度數據的關聯,使多維分析更加方便,為從多角度、多層次地數據分析和決策制定提供便捷。

作為一名數據的規劃者,我們肯定希望自己的數據能夠有秩序地流轉,數據的整個生命周期能夠清晰明確被設計者和使用者感知到。直觀來講就是如圖這般層次清晰、依賴關系直觀。

但是,大多數情況下,我們的數據體系是復雜、層級混亂的。因此,我們需要一套行之有效的數據組織和管理方法來讓我們的數據體系更有序,這就是談到的數據分層。

1.不要在意分層的命名,也可以叫做:1、2、3層,但為了與別人的理解保持一致,還是需要跟各自公司的數據開發同事溝通清楚,明確各層的數據含義。

2. 有些公司的實踐中,會在數據倉庫中分三層以上,比如會將DW層分解為兩層,分別為輕度匯總層、中度匯總層。這是跟著業務需要走了,理解分層的目的即可。

常見數倉分層如下:

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢