為什么會有域的概念呢?
首先來看看數(shù)據(jù)倉庫的定義吧,數(shù)據(jù)倉庫是一個(gè)面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用于支持管理決策。
主題域已經(jīng)體現(xiàn)出來了
主題域用于將數(shù)據(jù)集市按照分析視角進(jìn)行劃分,通常是聯(lián)系較為緊密的數(shù)據(jù)主題的集合。可以根據(jù)業(yè)務(wù)的關(guān)注點(diǎn),將這些數(shù)據(jù)主題劃分至不同的主題域。
當(dāng)然,還有另外一種說法。
數(shù)據(jù)倉庫是面向主題(數(shù)據(jù)綜合、歸類并進(jìn)行分析利用的抽象)的應(yīng)用。數(shù)據(jù)倉庫模型設(shè)計(jì)除橫向的分層外,通常也需要根據(jù)業(yè)務(wù)情況進(jìn)行縱向劃分?jǐn)?shù)據(jù)域。數(shù)據(jù)域是聯(lián)系較為緊密的數(shù)據(jù)主題的集合,通常是根據(jù)業(yè)務(wù)類別、數(shù)據(jù)來源、數(shù)據(jù)用途等多個(gè)維度,對企業(yè)的業(yè)務(wù)數(shù)據(jù)進(jìn)行的區(qū)域劃分,將同類型數(shù)據(jù)存放在一起,便于快速查找需要的內(nèi)容。不同使用目的數(shù)據(jù),分類標(biāo)準(zhǔn)不同。例如,電商行業(yè)通常分為交易域、會員域、商品域等。
數(shù)據(jù)域劃分原則:全局性、可理解性和數(shù)量適中。
主題域
主題域通常是 聯(lián)系較為緊密的數(shù)據(jù) 主題的集合。可以根據(jù)業(yè)務(wù)的關(guān)注點(diǎn),將這些數(shù)據(jù)主題劃分到不同的主題域。主題域的確定必須由最終用戶和數(shù)據(jù)倉庫的設(shè)計(jì)人員共同完成。
主題域、主題、實(shí)體間關(guān)系
主題設(shè)計(jì)是對主題域進(jìn)一步分解,細(xì)化的過程。主題域下面可以有多個(gè)主題,主題還可以劃分成更多的子主題,而實(shí)體則是不可劃分的最小單位。主題域、主題、實(shí)體的關(guān)系如下圖所示:

可以顯而易見的看出,主題域是一個(gè)更大的概念,主題是略次之,實(shí)體最小,這里的實(shí)體表示的是實(shí)體對象(對應(yīng)企業(yè)中某一宏觀分析領(lǐng)域所涉及的分析對象)。
主題域劃分
主題域是對某個(gè)主題進(jìn)行分析后確定的主題的邊界。分析主題域,確定要裝載到數(shù)據(jù)倉庫的主題是信息打包技術(shù)的第一步。而在進(jìn)行數(shù)據(jù)倉庫設(shè)計(jì)時(shí),一般是一次先建立一個(gè)主題或企業(yè)全部主題中的一部分,因此在大多數(shù)數(shù)據(jù)倉庫的設(shè)計(jì)過程中都有一個(gè)主題域的選擇過程。
確定主題邊界實(shí)際上需要進(jìn)一步理解業(yè)務(wù)關(guān)系,因此在確定整個(gè)分析主題后,還需要對這些主題進(jìn)行初步的細(xì)化才便于獲取每一個(gè)主題應(yīng)該具有的邊界。對于四個(gè)主題及其在企業(yè)中的業(yè)務(wù)關(guān)系可以確定邊界。

主題的使用
由于數(shù)據(jù)倉庫的設(shè)計(jì)是一個(gè)螺旋發(fā)展的過程。在剛開始,沒有必要在數(shù)據(jù)倉庫的數(shù)據(jù)庫中體現(xiàn)所有的主題,選擇最重要的主題作為數(shù)據(jù)倉庫設(shè)計(jì)的試金石是很有必要的。因此使用主題首先是找到需要分析的主題域。
例如在 AdventureWorks DW 數(shù)據(jù)倉庫的概念模型設(shè)計(jì)中,在對需求進(jìn)行分析后,認(rèn)識到“商品”主題既是一個(gè)銷售型企業(yè)最基本的業(yè)務(wù)對象,又是進(jìn)行決策分析的最主要領(lǐng)域,因而把“銷售分析”主題域定義為要首先建立的主題。通過“商品”主題的建立,經(jīng)營者就可以對整個(gè)企業(yè)的經(jīng)營狀況有較全面的了解。先實(shí)施“商品”主題可以盡快地滿足企業(yè)管理人員建立數(shù)據(jù)倉庫的最初要求,所以先選定“商品”主題進(jìn)行實(shí)施。
通過將主題邊界的劃分應(yīng)用到已經(jīng)得到的關(guān)系模型上還能形成原始的概念模型。這一模型是把主題域的劃分和事務(wù)處理數(shù)據(jù)庫中的表結(jié)合起來的模型,例如在上面的例子中,商品主題可能涵蓋的關(guān)系表有商品表、供應(yīng)關(guān)系表、購買關(guān)系表和倉儲關(guān)系表;倉庫主題可能涵蓋的關(guān)系表有倉庫關(guān)系表、倉庫表、倉庫管理關(guān)系表和管理員表。
數(shù)據(jù)域
數(shù)據(jù)域是指面向業(yè)務(wù)分析,將業(yè)務(wù)過程或者維度進(jìn)行抽象的集合。為保障整個(gè)體系的生命力,數(shù)據(jù)域需要抽象提煉,并長期維護(hù)更新。
在劃分?jǐn)?shù)據(jù)域時(shí),既能涵蓋當(dāng)前所有的業(yè)務(wù)需求,又能讓新業(yè)務(wù)在進(jìn)入時(shí)可以被包含進(jìn)已有的數(shù)據(jù)域或擴(kuò)展新的數(shù)據(jù)域。數(shù)據(jù)域的劃分工作可以在業(yè)務(wù)調(diào)研之后進(jìn)行,需要分析各個(gè)業(yè)務(wù)模塊中有哪些業(yè)務(wù)活動。
數(shù)據(jù)域是 CDM 層的頂層劃分,是對企業(yè)業(yè)務(wù)的抽象提煉,面向業(yè)務(wù)分析,包含當(dāng)前所有業(yè)務(wù)需求,也便于未來擴(kuò)展。
數(shù)據(jù)域的使用
數(shù)據(jù)域可以按照用戶企業(yè)的部門劃分,也可以按照業(yè)務(wù)過程或者業(yè)務(wù)板塊中的功能模塊進(jìn)行劃分。例如在線教育公司可以劃分為如下數(shù)據(jù)域,數(shù)據(jù)域中每一部分都是實(shí)際業(yè)務(wù)過程經(jīng)過歸納抽象之后得出的。

數(shù)據(jù)域和主題域到底有什么區(qū)別呢?
主題域是針對數(shù)據(jù)集市提出的概念,數(shù)據(jù)集市是面向主題,從業(yè)務(wù)驅(qū)動進(jìn)行分析場景的建設(shè)。
數(shù)據(jù)域是阿里數(shù)據(jù)中臺 CDM 層建設(shè)中提出的,是數(shù)據(jù)驅(qū)動業(yè)務(wù),是對數(shù)據(jù)的分類,更好的數(shù)據(jù)賦能業(yè)務(wù)。
總結(jié)
數(shù)據(jù)域是對數(shù)據(jù)的分類,主題域和業(yè)務(wù)域是對業(yè)務(wù)的分類。
主題域和數(shù)據(jù)域最終都是對數(shù)據(jù)的分類,只是一個(gè)是數(shù)據(jù)視角,一個(gè)是業(yè)務(wù)視角。
根本的目的是:統(tǒng)一規(guī)則,方便管理,容易理解,有利于開發(fā)效率,有利于快速服務(wù)業(yè)務(wù)場景就可以了。
Tips
個(gè)人建議,在 DWD 層可以按照數(shù)據(jù)域進(jìn)行分類,DWS 層可以按照主題域劃分,ADS 層可以按照分析主題域(業(yè)務(wù)場景)劃分。
數(shù)據(jù)域劃分幾點(diǎn)需要注意的地方
1.不重不漏,確保每個(gè)表都在一個(gè)域里,且只在一個(gè)域里(精確定位)
2.每個(gè)域下都可以根據(jù)需要再分子域,不限定層級(最自由方便)
3.如果分子域就不能放表,表只放在最底層的域中(樹狀目錄管理時(shí)更方便)
4.最好保證每個(gè)域下的子域數(shù)量或表數(shù)量在20個(gè)左右(太多了不方便記憶管理,太少了沒必要?jiǎng)澐郑?
5.【其他】很好用,不好劃分的都放里面(減少域?qū)蛹墧?shù)量有理由理解記憶)
6.數(shù)據(jù)團(tuán)隊(duì)分域可以作為分工的標(biāo)準(zhǔn)(數(shù)據(jù)不重、分工明確、界限清晰)
7.數(shù)據(jù)團(tuán)隊(duì)分域后,可以決定域內(nèi)表的中間命名(看到表名時(shí)可以理解更多信息)
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)