日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數(shù)據(jù)治理平臺(tái)

睿治作為國(guó)內(nèi)功能最全的數(shù)據(jù)治理產(chǎn)品之一,入選IDC企業(yè)數(shù)據(jù)治理實(shí)施部署指南。同時(shí),在IDC發(fā)布的《中國(guó)數(shù)據(jù)治理市場(chǎng)份額》報(bào)告中,連續(xù)四年蟬聯(lián)數(shù)據(jù)治理解決方案市場(chǎng)份額第一。

關(guān)于數(shù)倉(cāng)基礎(chǔ)知識(shí)的超全概括

時(shí)間:2023-01-13來(lái)源:掏心止痛瀏覽數(shù):196

1、什么是數(shù)據(jù)倉(cāng)庫(kù)

數(shù)據(jù)倉(cāng)庫(kù),英文名稱(chēng)為Data Warehouse,可簡(jiǎn)寫(xiě)為DW或DWH。數(shù)據(jù)倉(cāng)庫(kù),是為企業(yè)所有級(jí)別的決策制定過(guò)程,提供所有類(lèi)型數(shù)據(jù)支持的戰(zhàn)略集合。它出于分析性報(bào)告和決策支持目的而創(chuàng)建。為需要業(yè)務(wù)智能的企業(yè),提供指導(dǎo)業(yè)務(wù)流程改進(jìn)、監(jiān)視時(shí)間、成本、質(zhì)量以及控制。

2、數(shù)據(jù)倉(cāng)庫(kù)能干什么?

年度銷(xiāo)售目標(biāo)的指定,需要根據(jù)以往的歷史報(bào)表進(jìn)行決策,不能拍腦袋

如何優(yōu)化業(yè)務(wù)流程

例如:一個(gè)電商網(wǎng)站訂單的完成包括:瀏覽、下單、支付、物流,其中物流環(huán)節(jié)可能和中通、申通、韻達(dá)等快遞公司合作。快遞公司每派送一個(gè)訂單,都會(huì)有訂單派送的確認(rèn)時(shí)間,可以根據(jù)訂單派送時(shí)間來(lái)分析哪個(gè)快遞公司比較快捷高效,從而選擇與哪些快遞公司合作,剔除哪些快遞公司,增加用戶(hù)友好型。

簡(jiǎn)而言之就是匯總八方數(shù)據(jù),清洗后提供對(duì)我服務(wù)。

3、數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)

1. 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是面向主題的

與傳統(tǒng)數(shù)據(jù)庫(kù)面向應(yīng)用進(jìn)行數(shù)據(jù)組織的特點(diǎn)相對(duì)應(yīng),數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是面向主題進(jìn)行組織的。什么是主題呢?首先,主題是一個(gè)抽象的概念,是較高層次上企業(yè)信息系統(tǒng)中的數(shù)據(jù)綜合、歸類(lèi)并進(jìn)行分析利用的抽象。

在邏輯意義上,它是對(duì)應(yīng)企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對(duì)象。面向主題的數(shù)據(jù)組織方式,就是在較高層次上對(duì)分析對(duì)象的數(shù)據(jù)的一個(gè)完整、一致的描述,能完整、統(tǒng)一地刻劃各個(gè)分析對(duì)象所涉及的企業(yè)的各項(xiàng)數(shù)據(jù),以及數(shù)據(jù)之間的聯(lián)系。所謂較高層次是相對(duì)面向應(yīng)用的數(shù)據(jù)組織方式而言的,是指按照主題進(jìn)行數(shù)據(jù)組織的方式具有更高的數(shù)據(jù)抽象級(jí)別。說(shuō)白了就個(gè)寫(xiě)作文一樣,寫(xiě)什么你總的有個(gè)主題思想??!

2. 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是集成的

數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是從原有的分散的數(shù)據(jù)庫(kù)數(shù)據(jù)抽取來(lái)的。操作型數(shù)據(jù)與分析型數(shù)據(jù)之間差別甚大。

數(shù)據(jù)倉(cāng)庫(kù)的每一個(gè)主題所對(duì)應(yīng)的源數(shù)據(jù)在原有的各分散數(shù)據(jù)庫(kù)中有許多重復(fù)和不一致的地方,且來(lái)源于不同的聯(lián)機(jī)系統(tǒng)的數(shù)據(jù)都和不同的應(yīng)用邏輯捆綁在一起;

數(shù)據(jù)倉(cāng)庫(kù)中的綜合數(shù)據(jù)不能從原有的數(shù)據(jù)庫(kù)系統(tǒng)直接得到。因此在數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前,必然要經(jīng)過(guò)統(tǒng)一與綜合。

這一步是數(shù)據(jù)倉(cāng)庫(kù)建設(shè)中最關(guān)鍵、最復(fù)雜的一步,所要完成的工作有:

要統(tǒng)一解決源數(shù)據(jù)中所有矛盾之處,如字段的同名異義、異名同義、單位不統(tǒng)一、字長(zhǎng)不一致等

進(jìn)行數(shù)據(jù)綜合和計(jì)算。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)綜合工作可以在從原有數(shù)據(jù)庫(kù)抽取數(shù)據(jù)時(shí)生成,但許多是在數(shù)據(jù)倉(cāng)庫(kù)內(nèi)部生成的,即進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后進(jìn)行綜合生成的

大部分情況下一般數(shù)倉(cāng)的建立是由大數(shù)據(jù)部門(mén)負(fù)責(zé)構(gòu)建,而別的分析業(yè)務(wù)部門(mén)是無(wú)權(quán)直接用線(xiàn)上的table的

3. 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是不可更新的

數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢(xún),一般情況下并不進(jìn)行修改操作。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)反映的是一段相當(dāng)長(zhǎng)的時(shí)間內(nèi)歷史數(shù)據(jù)的內(nèi)容,是不同時(shí)點(diǎn)的數(shù)據(jù)庫(kù)快照的集合,以及基于這些快照進(jìn)行統(tǒng)計(jì)、綜合和重組的導(dǎo)出數(shù)據(jù),而不是聯(lián)機(jī)處理的數(shù)據(jù)。

數(shù)據(jù)庫(kù)中進(jìn)行聯(lián)機(jī)處理的數(shù)據(jù)經(jīng)過(guò)集成輸入到數(shù)據(jù)倉(cāng)庫(kù)中,一旦數(shù)據(jù)倉(cāng)庫(kù)存放的數(shù)據(jù)已經(jīng)超過(guò)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)存儲(chǔ)期限,這些數(shù)據(jù)將從當(dāng)前的數(shù)據(jù)倉(cāng)庫(kù)中刪去。因?yàn)閿?shù)據(jù)倉(cāng)庫(kù)只進(jìn)行數(shù)據(jù)查詢(xún)操作,所以數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng)相比數(shù)據(jù)庫(kù)管理系統(tǒng)而言要簡(jiǎn)單得多。

4.?數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是隨時(shí)間不斷變化的

數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)不可更新是針對(duì)應(yīng)用來(lái)說(shuō)的,也就是說(shuō),數(shù)據(jù)倉(cāng)庫(kù)的用戶(hù)進(jìn)行分析處理時(shí)是不進(jìn)行數(shù)據(jù)更新操作的。但并不是說(shuō),在從數(shù)據(jù)集成輸入數(shù)據(jù)倉(cāng)庫(kù)開(kāi)始到最終被刪除的整個(gè)數(shù)據(jù)生存周期中,所有的數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)都是永遠(yuǎn)不變的。

數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是隨時(shí)間的變化而不斷變化的,這是數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)的第四個(gè)特征。這一特征表現(xiàn)在以下3方面:

數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間變化不斷增加新的數(shù)據(jù)內(nèi)容。數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)必須不斷捕捉OLTP數(shù)據(jù)庫(kù)中變化的數(shù)據(jù),追加到數(shù)據(jù)倉(cāng)庫(kù)中去,也就是要不斷地生成OLTP數(shù)據(jù)庫(kù)的快照,經(jīng)統(tǒng)一集成后增加到數(shù)據(jù)倉(cāng)庫(kù)中去;但對(duì)于確實(shí)不再變化的數(shù)據(jù)庫(kù)快照,如果捕捉到新的變化數(shù)據(jù),則只生成一個(gè)新的數(shù)據(jù)庫(kù)快照增加進(jìn)去,而不會(huì)對(duì)原有的數(shù)據(jù)庫(kù)快照進(jìn)行修改。形象來(lái)說(shuō)就是對(duì)數(shù)據(jù)進(jìn)每日全量數(shù)據(jù)的收集

數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間變化不斷刪去舊的數(shù)據(jù)內(nèi)容。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)也有存儲(chǔ)期限,一旦超過(guò)了這一期限,過(guò)期數(shù)據(jù)就要被刪除。只是數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的數(shù)據(jù)時(shí)限要遠(yuǎn)遠(yuǎn)長(zhǎng)于操作型環(huán)境中的數(shù)據(jù)時(shí)限。在操作型環(huán)境中一般只保存有60到90天的數(shù)據(jù),而在數(shù)據(jù)倉(cāng)庫(kù)中則需要保存較長(zhǎng)時(shí)限的數(shù)據(jù)(如5~10年),以適應(yīng)DSS(Decision Support System)進(jìn)行趨勢(shì)分析的要求

數(shù)據(jù)倉(cāng)庫(kù)中包含有大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)中很多跟時(shí)間有關(guān),如數(shù)據(jù)經(jīng)常按照時(shí)間段進(jìn)行綜合,或隔一定的時(shí)間片進(jìn)行抽樣等等。這些數(shù)據(jù)要隨著時(shí)間的變化不斷地進(jìn)行重新綜合。因此,數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)特征都包含時(shí)間項(xiàng),以標(biāo)明數(shù)據(jù)的歷史時(shí)期

4、數(shù)據(jù)倉(cāng)庫(kù)發(fā)展歷程

5

數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別

????

6

OLTP跟OLAP

數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別實(shí)際講的是OLTP與OLAP的區(qū)別。

操作型處理:叫聯(lián)機(jī)事務(wù)處理OLTP(On-Line Transaction Processing),也可以稱(chēng)面向交易的處理系統(tǒng),它是針對(duì)具體業(yè)務(wù)在數(shù)據(jù)庫(kù)聯(lián)機(jī)的日常操作,通常對(duì)少數(shù)記錄進(jìn)行查詢(xún)、修改。用戶(hù)較為關(guān)心操作的響應(yīng)時(shí)間、數(shù)據(jù)的安全性、完整性和并發(fā)支持的用戶(hù)數(shù)等問(wèn)題。傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)作為數(shù)據(jù)管理的主要手段,主要用于操作型處理

分析型處理:叫聯(lián)機(jī)分析處理OLAP(On-Line Analytical Processing)一般針對(duì)某些主題的歷史數(shù)據(jù)進(jìn)行分析,支持管理決策,ETL

7

數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)分層(重點(diǎn))

1. 數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)

數(shù)據(jù)倉(cāng)庫(kù)標(biāo)準(zhǔn)上可以分為四層:ODS(臨時(shí)存儲(chǔ)層)、PDW(數(shù)據(jù)倉(cāng)庫(kù)層)、DM(數(shù)據(jù)集市層)、APP(應(yīng)用層)。

各個(gè)系統(tǒng)的元數(shù)據(jù)通過(guò)ETL同步到操作性數(shù)據(jù)倉(cāng)庫(kù)ODS中,對(duì)ODS數(shù)據(jù)進(jìn)行面向主題域建模形成DW(數(shù)據(jù)倉(cāng)庫(kù)),DM是針對(duì)某一個(gè)業(yè)務(wù)領(lǐng)域建立模型,具體用戶(hù)(決策層)查看DM生成的報(bào)表。

臨時(shí)存儲(chǔ)數(shù)據(jù)運(yùn)營(yíng)層:ODS(Operational Data Store):ODS層是這樣一種數(shù)據(jù)存儲(chǔ)系統(tǒng),它將來(lái)自不同數(shù)據(jù)源的數(shù)據(jù)(各種操作型數(shù)據(jù)庫(kù)、外部數(shù)據(jù)源等)通過(guò)ETL(Extract-Transform-Load)過(guò)程匯聚整合成面向主題的、集成的、企業(yè)全局的、一致的數(shù)據(jù)集合(主要是最新的或者最近的細(xì)節(jié)數(shù)據(jù)以及可能需要的匯總數(shù)據(jù))。從數(shù)據(jù)粒度上來(lái)說(shuō)ODS層的數(shù)據(jù)粒度是最細(xì)的。ODS層的表通常包括兩類(lèi),一個(gè)用于存儲(chǔ)當(dāng)前需要加載的數(shù)據(jù),一個(gè)用于存儲(chǔ)處理完后的歷史數(shù)據(jù)。歷史數(shù)據(jù)一般保存3-6個(gè)月后需要清除,以節(jié)省空間。但不同的項(xiàng)目要區(qū)別對(duì)待,如果源系統(tǒng)的數(shù)據(jù)量不大,可以保留更長(zhǎng)的時(shí)間,甚至全量保存

數(shù)據(jù)倉(cāng)庫(kù)層:DW(Data Warehouse):為數(shù)據(jù)倉(cāng)庫(kù)層,DW層的數(shù)據(jù)應(yīng)該是一致的、準(zhǔn)確的、干凈的數(shù)據(jù),即對(duì)源系統(tǒng)數(shù)據(jù)進(jìn)行了清洗(去除了雜質(zhì))后的數(shù)據(jù)。這一層的數(shù)據(jù)一般是遵循數(shù)據(jù)庫(kù)第三范式的,其數(shù)據(jù)粒度通常和ODS的粒度相同。在DW層會(huì)保存BI系統(tǒng)中所有的歷史數(shù)據(jù),例如保存10年的數(shù)據(jù)

DW : Data Warehouse 翻譯成數(shù)據(jù)倉(cāng)庫(kù),DW由下到上分為 DWD、DWB、DWS。DWD:Warehouse Detail 細(xì)節(jié)數(shù)據(jù)層,有的也稱(chēng)為 ODS層,是業(yè)務(wù)層與數(shù)據(jù)倉(cāng)庫(kù)的隔離層 DWB:Data Warehouse Base 基礎(chǔ)數(shù)據(jù)層,存儲(chǔ)的是客觀數(shù)據(jù),一般用作中間層,可以認(rèn)為是大量指標(biāo)的數(shù)據(jù)層。DWS:Data Warehouse Service 服務(wù)數(shù)據(jù)層,基于DWB上的基礎(chǔ)數(shù)據(jù),整合匯總成分析某一個(gè)主題域的服務(wù)數(shù)據(jù),一般是寬表。

數(shù)據(jù)集市層:DM(Data Mart):為數(shù)據(jù)集市層,這層數(shù)據(jù)是面向主題來(lái)組織數(shù)據(jù)的,通常是星形或雪花結(jié)構(gòu)的數(shù)據(jù)。從數(shù)據(jù)粒度來(lái)說(shuō),這層的數(shù)據(jù)是輕度匯總級(jí)的數(shù)據(jù),已經(jīng)不存在明細(xì)數(shù)據(jù)了。從數(shù)據(jù)的時(shí)間跨度來(lái)說(shuō),通常是DW層的一部分,主要的目的是為了滿(mǎn)足用戶(hù)分析的需求,而從分析的角度來(lái)說(shuō),用戶(hù)通常只需要分析近幾年(如近三年的數(shù)據(jù))的即可。從數(shù)據(jù)的廣度來(lái)說(shuō),仍然覆蓋了所有業(yè)務(wù)數(shù)據(jù)。

應(yīng)用層:Application層:這層數(shù)據(jù)是完全為了滿(mǎn)足具體的分析需求而構(gòu)建的數(shù)據(jù),也是星形或雪花結(jié)構(gòu)的數(shù)據(jù)。從數(shù)據(jù)粒度來(lái)說(shuō)是高度匯總的數(shù)據(jù)。從數(shù)據(jù)的廣度來(lái)說(shuō),則并不一定會(huì)覆蓋所有業(yè)務(wù)數(shù)據(jù),而是DM層數(shù)據(jù)的一個(gè)真子集,從某種意義上來(lái)說(shuō)是DM層數(shù)據(jù)的一個(gè)重復(fù)。從極端情況來(lái)說(shuō),可以為每一張報(bào)表在APP層構(gòu)建一個(gè)模型來(lái)支持,達(dá)到以空間換時(shí)間的目的數(shù)據(jù)倉(cāng)庫(kù)的標(biāo)準(zhǔn)分層只是一個(gè)建議性質(zhì)的標(biāo)準(zhǔn),實(shí)際實(shí)施時(shí)需要根據(jù)實(shí)際情況確定數(shù)據(jù)倉(cāng)庫(kù)的分層,不同類(lèi)型的數(shù)據(jù)也可能采取不同的分層方法。

2. 為什么要對(duì)數(shù)據(jù)倉(cāng)庫(kù)分層?

用空間換時(shí)間,通過(guò)大量的預(yù)處理來(lái)提升應(yīng)用系統(tǒng)的用戶(hù)體驗(yàn)(效率),因此數(shù)據(jù)倉(cāng)庫(kù)會(huì)存在大量冗余的數(shù)據(jù)

解偶,如果不分層的話(huà),如果源業(yè)務(wù)系統(tǒng)的業(yè)務(wù)規(guī)則發(fā)生變化將會(huì)影響整個(gè)數(shù)據(jù)清洗過(guò)程,工作量巨大

通過(guò)數(shù)據(jù)分層管理可以簡(jiǎn)化數(shù)據(jù)清洗的過(guò)程,因?yàn)榘言瓉?lái)一步的工作分到了多個(gè)步驟去完成,相當(dāng)于把一個(gè)復(fù)雜的工作拆成了多個(gè)簡(jiǎn)單的工作,把一個(gè)大的黑盒變成了一個(gè)白盒,每一層的處理邏輯都相對(duì)簡(jiǎn)單和容易理解,這樣我們比較容易保證每一個(gè)步驟的正確性,當(dāng)數(shù)據(jù)發(fā)生錯(cuò)誤的時(shí)候,往往我們只需要局部調(diào)整某個(gè)步驟即可。

8

元數(shù)據(jù)介紹

當(dāng)需要了解某地企業(yè)及其提供的服務(wù)時(shí),電話(huà)黃頁(yè)的重要性就體現(xiàn)出來(lái)了。元數(shù)據(jù)(Metadata)類(lèi)似于這樣的電話(huà)黃頁(yè)。

1. 元數(shù)據(jù)的定義

2. 元數(shù)據(jù)的存儲(chǔ)方式

3. 元數(shù)據(jù)的作用

9

星型模型和雪花模型

在多維分析的商業(yè)智能解決方案中,根據(jù)事實(shí)表和維度表的關(guān)系,又可將常見(jiàn)的模型分為星型模型和雪花型模型。在設(shè)計(jì)邏輯型數(shù)據(jù)的模型的時(shí)候,就應(yīng)考慮數(shù)據(jù)是按照星型模型還是雪花型模型進(jìn)行組織。

1. 星型模型

當(dāng)所有維表都直接連接到事實(shí)表上時(shí),整個(gè)圖解就像星星一樣,故將該模型稱(chēng)為星型模型。

星型架構(gòu)是一種非正規(guī)化的結(jié)構(gòu),多維數(shù)據(jù)集的每一個(gè)維度都直接與事實(shí)表相連接,不存在漸變維度,所以數(shù)據(jù)有一定的冗余,如在地域維度表中,存在國(guó)家A 省B的城市C以及國(guó)家A省B的城市D兩條記錄,那么國(guó)家A和省B的信息分別存儲(chǔ)了兩次,即存在冗余。

2. 雪花模型

當(dāng)有一個(gè)或多個(gè)維表沒(méi)有直接連接到事實(shí)表上,而是通過(guò)其他維表連接到事實(shí)表上時(shí),其圖解就像多個(gè)雪花連接在一起,故稱(chēng)雪花模型。雪花模型是對(duì)星型模型的擴(kuò)展。它對(duì)星型模型的維表進(jìn)一步層次化,原有的各維表可能被擴(kuò)展為小的事實(shí)表,形成一些局部的層次 區(qū)域,這些被分解的表都連接到主維度表而不是事實(shí)表。

如圖所示,將地域維表又分解為國(guó)家,省份,城市等維表。它的優(yōu)點(diǎn)是:通過(guò)最大限度地減少數(shù)據(jù)存儲(chǔ)量以及聯(lián)合較小的維表來(lái)改善查詢(xún)性能。雪花型結(jié)構(gòu)去除了數(shù)據(jù)冗余。

星型模型因?yàn)閿?shù)據(jù)的冗余所以很多統(tǒng)計(jì)查詢(xún)不需要做外部的連接,因此一般情況下效率比雪花型模型要高。星型結(jié)構(gòu)不用考慮很多正規(guī)化的因素,設(shè)計(jì)與實(shí)現(xiàn)都比較簡(jiǎn)單。雪花型模型由于去除了冗余,有些統(tǒng)計(jì)就需要通過(guò)表的聯(lián)接才能產(chǎn)生,所以效率不一定有星型模型高。

正規(guī)化也是一種比較復(fù)雜的過(guò)程,相應(yīng)的數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)、數(shù)據(jù)的 ETL、以及后期的維護(hù)都要復(fù)雜一些。因此在冗余可以接受的前提下,實(shí)際運(yùn)用中星型模型使用更多,也更有效率。

3. 星型模型和雪花模型對(duì)比

星形模型和雪花模型是數(shù)據(jù)倉(cāng)庫(kù)中常用到的兩種方式,而它們之間的對(duì)比要從四個(gè)角度來(lái)進(jìn)行討論。

數(shù)據(jù)優(yōu)化:雪花模型使用的是規(guī)范化數(shù)據(jù),也就是說(shuō)數(shù)據(jù)在數(shù)據(jù)庫(kù)內(nèi)部是組織好的,以便消除冗余,因此它能夠有效地減少數(shù)據(jù)量。通過(guò)引用完整性,其業(yè)務(wù)層級(jí)和維度都將存儲(chǔ)在數(shù)據(jù)模型之中。相比較而言,星形模型使用的是反規(guī)范化數(shù)據(jù)。在星形模型中,維度直接指的是事實(shí)表,業(yè)務(wù)層級(jí)不會(huì)通過(guò)維度之間的參照完整性來(lái)部署

業(yè)務(wù)模型:在雪花模型中,數(shù)據(jù)模型的業(yè)務(wù)層級(jí)是由一個(gè)不同維度表主鍵-外鍵的關(guān)系來(lái)代表的。而在星形模型中,所有必要的維度表在事實(shí)表中都只擁有外鍵

性能:第三個(gè)區(qū)別在于性能的不同。雪花模型在維度表、事實(shí)表之間的連接很多,因此性能方面會(huì)比較低。舉個(gè)例子,如果你想要知道一個(gè)用戶(hù)的詳細(xì)信息,雪花模型就會(huì)進(jìn)行若干表的join最終匯總結(jié)果。而星形模型的連接就少的多,在這個(gè)模型中,如果你需要對(duì)應(yīng)信息,你只要將維度表和事實(shí)表連接即可

ETL:雪花模型加載數(shù)據(jù)集市,因此ETL操作在設(shè)計(jì)上更加復(fù)雜,而且由于附屬模型的限制,不能并行化。星形模型加載維度表,不需要再維度之間添加附屬模型,因此ETL就相對(duì)簡(jiǎn)單,而且可以實(shí)現(xiàn)高度的并行化

總結(jié):雪花模型使得維度分析更加容易,比如針對(duì)特定的廣告主,有哪些客戶(hù)或者公司是在線(xiàn)的? 星形模型用來(lái)做指標(biāo)分析更適合,比如給定的一個(gè)客戶(hù)他們的收入是多少?


(部分內(nèi)容來(lái)源網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除)
立即申請(qǐng)數(shù)據(jù)分析/數(shù)據(jù)治理產(chǎn)品免費(fèi)試用 我要試用
customer

在線(xiàn)咨詢(xún)

在線(xiàn)咨詢(xún)

點(diǎn)擊進(jìn)入在線(xiàn)咨詢(xún)