日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

首頁 行業(yè)百科 什么是數(shù)據(jù)倉庫

什么是數(shù)據(jù)倉庫

|億信華辰大數(shù)據(jù)知識庫2022-04-12

什么是數(shù)據(jù)倉庫

數(shù)據(jù)倉庫(DW),是為企業(yè)所有級別的決策制定過程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個數(shù)據(jù)存儲,出于分析性報告和決策支持目的而創(chuàng)建。

一、數(shù)據(jù)倉庫的定義
數(shù)據(jù)倉庫(DW),是為企業(yè)所有級別的決策制定過程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個數(shù)據(jù)存儲,出于分析性報告和決策支持目的而創(chuàng)建。 為需要業(yè)務智能的企業(yè),提供指導業(yè)務流程改進、監(jiān)視時間、成本、質量以及控制。它是一個面向主題的、集成的、非易失的、隨著時間變化的,用于支持管理人員決策的數(shù)據(jù)集合,數(shù)據(jù)倉庫包含粒度化的企業(yè)數(shù)據(jù),在不同的粒度級別上對數(shù)據(jù)進行聚合,這樣,數(shù)據(jù)倉庫中就存在最細節(jié)的原始數(shù)據(jù)、輕度聚合數(shù)據(jù)、高度聚合數(shù)據(jù)。
二、數(shù)據(jù)倉庫的特點
集成性:數(shù)據(jù)倉庫需要將多個數(shù)據(jù)源的數(shù)據(jù)存到一起,但是這些數(shù)據(jù)以前的存儲方式不同,所以需要經(jīng)過抽取、清洗、轉換的過程。
主題性:數(shù)據(jù)倉庫是針對某個主題來進行組織,比如滴滴出行,司機行為分析就是一個主題,所以可以將多種不同的數(shù)據(jù)源進行整合。而傳統(tǒng)的數(shù)據(jù)庫主要針對某個項目而言,數(shù)據(jù)相對分散和孤立。
時變性:會定期接收到新的數(shù)據(jù),反應出最新的數(shù)據(jù)變化。
穩(wěn)定性:保存的數(shù)據(jù)是一系列歷史快照,不允許修改,只能分析。
三、數(shù)據(jù)倉庫的價值
隨著大數(shù)據(jù)時代的到來,面對爆發(fā)式增長的數(shù)據(jù),如何將這些數(shù)據(jù)有序、有結構的分類和組織存儲是我們面臨的一個挑戰(zhàn)。而數(shù)據(jù)倉庫理論可以將數(shù)據(jù)有序的組織和存儲起來之后(即模型)。而優(yōu)秀的數(shù)據(jù)倉庫價值主要體現(xiàn)在以下幾個方面:
成本:實現(xiàn)公共數(shù)據(jù)的共享,提升復用能力,降低大數(shù)據(jù)系統(tǒng)的存儲和計算成本;
性能:良好的數(shù)據(jù)模型以及適當?shù)臄?shù)據(jù)冗余和維度退化以提升查詢分析速度,減少數(shù)據(jù)獲取的成本;
效率:良好的數(shù)據(jù)模型極大的改善用戶使用數(shù)據(jù)的體驗,提高使用數(shù)據(jù)的效率;
質量:實現(xiàn)應用與源數(shù)據(jù)的解耦,降低源數(shù)據(jù)變動對應用的影響,提升應用的健壯性,同時減少數(shù)據(jù)計算錯誤的可能性。
四、數(shù)據(jù)倉庫如何實現(xiàn)
數(shù)據(jù)倉庫分為4層:ODS層(原始數(shù)據(jù)層)、DWD層(明細數(shù)據(jù)層)、DWS層(服務數(shù)據(jù)層)、ADS層(數(shù)據(jù)應用層)。
ODS層(原始數(shù)據(jù)層):存放原始數(shù)據(jù),直接加載原始日志、數(shù)據(jù),數(shù)據(jù)保存原貌不做處理;
DWD層(明細數(shù)據(jù)層):結構與粒度原始表保持一致,對ODS層數(shù)據(jù)進行清洗(去除空值、臟數(shù)據(jù)、超過極限范圍的數(shù)據(jù));
DWS層 (服務數(shù)據(jù)層):以DWD為基礎,進行輕度匯總;
ADS層 (數(shù)據(jù)應用層):為各種統(tǒng)計報表提供數(shù)據(jù)。

五、主流數(shù)據(jù)倉庫平臺
數(shù)據(jù)倉庫平臺PetaBase-V作為Vertica基于億信分析產(chǎn)品的定制版,提供面向海量數(shù)據(jù)的秒級分析服務,采用無共享大規(guī)模并行架構(MPP),可線性擴展集群的計算能力和數(shù)據(jù)處理容量,基于列式數(shù)據(jù)庫技術,使 PetaBase-V 擁有高性能、高擴展性、高壓縮率、高健壯性等特點,可完美解決報表計算慢和明細數(shù)據(jù)查詢等性能問題,實時數(shù)據(jù)倉庫平臺主要面向結構化實時存儲的應用場景,適合保險,金融等電子化依賴程度高的行業(yè)。


點擊查看更多數(shù)據(jù)治理/數(shù)據(jù)倉庫相關文章:

企業(yè)上商業(yè)智能BI前是否需要建數(shù)據(jù)倉庫

DAMA數(shù)據(jù)管理體系

數(shù)據(jù)治理平臺搭建方法論

認為本內(nèi)容有幫助
0
您可能需要的數(shù)據(jù)產(chǎn)品
億信華辰助力政企數(shù)字化轉型
customer

在線咨詢

在線咨詢

點擊進入在線咨詢