談及企業(yè)數(shù)據(jù)的核心與靈魂,便不得不引出“
主數(shù)據(jù)”這一關(guān)鍵概念。本文將帶您揭開主數(shù)據(jù)的面紗,探討其在企業(yè)數(shù)據(jù)中的地位,辨析主數(shù)據(jù)與參考數(shù)據(jù)、
數(shù)據(jù)標(biāo)準(zhǔn)的微妙差異,并闡述數(shù)據(jù)標(biāo)準(zhǔn)、
數(shù)據(jù)質(zhì)量與主數(shù)據(jù)的相互關(guān)聯(lián)。通過生動(dòng)形象的類比,我們期望能夠?yàn)槟罱ㄆ鹨蛔斫庵鲾?shù)據(jù)及其相關(guān)知識(shí)的橋梁。
01什么是主數(shù)據(jù)
主數(shù)據(jù),作為企業(yè)核心業(yè)務(wù)的關(guān)鍵信息單一來源,支撐著企業(yè)的關(guān)鍵業(yè)務(wù)流程與事務(wù)。這一表述強(qiáng)調(diào)了主數(shù)據(jù)在企業(yè)運(yùn)營中的核心與重要性,將其視為企業(yè)的“黃金數(shù)據(jù)”。
具體而言,主數(shù)據(jù)是描述企業(yè)核心業(yè)務(wù)的主體,主要有資產(chǎn)、地點(diǎn)、客戶、供應(yīng)商以及產(chǎn)品等。這些主數(shù)據(jù)共同具備四個(gè)顯著特性:唯一性、共享性、穩(wěn)定性與有效性。
為了更直觀地理解這些特性,我們可以對(duì)比一些非主數(shù)據(jù)。以訂單為例,雖然每個(gè)微信訂單號(hào)都是唯一的,且在一定程度上具有共享性(即在訂單從產(chǎn)生到結(jié)束的整個(gè)流程中),但其生命周期相對(duì)較短,且其共享范圍也僅限于該流程內(nèi)部。此外,盡管訂單會(huì)被多個(gè)系統(tǒng)使用,但其穩(wěn)定性與長期有效性并不如主數(shù)據(jù)。訂單的有效性僅限于其生命周期內(nèi),而不像產(chǎn)品那樣會(huì)在多個(gè)系統(tǒng)中長期穩(wěn)定地使用。
因此,像訂單這類信息,由于其不具備主數(shù)據(jù)的全部特性,我們一般不將其列為主數(shù)據(jù)的范疇。這一判斷標(biāo)準(zhǔn)有助于我們更清晰地界定主數(shù)據(jù)與非主數(shù)據(jù)的界限,從而更好地進(jìn)行數(shù)據(jù)管理與利用。
02企業(yè)數(shù)據(jù)范圍
企業(yè)數(shù)據(jù)的范疇廣泛,包括交易數(shù)據(jù)、主數(shù)據(jù)、分析數(shù)據(jù)、IOT物聯(lián)網(wǎng)數(shù)據(jù)等。在此,小億大致將企業(yè)相關(guān)數(shù)據(jù)劃分為企業(yè)外部數(shù)據(jù)和企業(yè)內(nèi)部數(shù)據(jù)兩大類進(jìn)行詳細(xì)闡述。其中,物聯(lián)網(wǎng)數(shù)據(jù)是一個(gè)既涵蓋企業(yè)內(nèi)部又涉及企業(yè)外部的重要領(lǐng)域。
就企業(yè)內(nèi)部而言,首先企業(yè)的核心關(guān)鍵數(shù)據(jù),即主數(shù)據(jù)。進(jìn)一步擴(kuò)展,則涵蓋了企業(yè)日常的經(jīng)營數(shù)據(jù),如采購數(shù)據(jù)、銷售數(shù)據(jù)、生產(chǎn)數(shù)據(jù)等。基于這些經(jīng)營數(shù)據(jù)和主數(shù)據(jù),我們可以進(jìn)一步生成企業(yè)內(nèi)部所需的分析數(shù)據(jù),這些數(shù)據(jù)主要是通過生產(chǎn)經(jīng)營的加工匯總得出的,包括業(yè)績統(tǒng)計(jì)、關(guān)鍵KPI指標(biāo)、
財(cái)務(wù)報(bào)表以及決策支持?jǐn)?shù)據(jù)等,它們共同構(gòu)成了企業(yè)內(nèi)部的關(guān)鍵數(shù)據(jù)體系。此外,企業(yè)還會(huì)涉及傳感器、設(shè)備、儀表等相關(guān)數(shù)據(jù),以及日志數(shù)據(jù)和監(jiān)控?cái)?shù)據(jù)等,這些都屬于物聯(lián)網(wǎng)數(shù)據(jù)的范疇。
另一方面,企業(yè)外部數(shù)據(jù)主要涉及兩大板塊。首先是與企業(yè)有一定聯(lián)系的相關(guān)數(shù)據(jù),如友商數(shù)據(jù)、電商數(shù)據(jù)、銀行貸款數(shù)據(jù)以及工商、稅務(wù)、法院等涉及企業(yè)的數(shù)據(jù)。這些數(shù)據(jù)雖然與企業(yè)有一定的距離,但仍然是企業(yè)運(yùn)營中不可或缺的信息來源。
再往上,則可能涉及一些更為社會(huì)化的數(shù)據(jù),如社交媒體數(shù)據(jù)(包括微信等社交平臺(tái)的數(shù)據(jù))、政府公開的政策法規(guī)數(shù)據(jù)等。這些數(shù)據(jù)看似與企業(yè)距離較遠(yuǎn),但實(shí)際上,它們同樣對(duì)企業(yè)的運(yùn)營產(chǎn)生著重要影響。例如,政策法規(guī)的變化可能直接影響企業(yè)的經(jīng)營策略,而社交媒體數(shù)據(jù)則能反映出消費(fèi)者的需求和偏好,為企業(yè)的市場營銷提供有力支持。
從重要性而言,企業(yè)數(shù)據(jù)的價(jià)值挖掘和利用是一個(gè)從內(nèi)到外的過程。首先,我們需要做好組織內(nèi)部的數(shù)據(jù)管理和分析工作,提升組織力。然后,逐步向外擴(kuò)展,將外部數(shù)據(jù)納入企業(yè)的數(shù)據(jù)體系中,為企業(yè)的經(jīng)營決策提供更為全面和準(zhǔn)確的信息支持。這樣,企業(yè)數(shù)據(jù)才能真正發(fā)揮其價(jià)值,為企業(yè)的持續(xù)發(fā)展提供有力保障。
03容易混淆的3個(gè)概念
接下來,小億將闡述幾個(gè)容易混淆的概念:參考數(shù)據(jù)、主數(shù)據(jù)以及數(shù)據(jù)標(biāo)準(zhǔn)。
之所以將這三個(gè)概念放在一起討論,是因?yàn)樗鼈冊?a href="http://m.122re.com/data-governance.html" title="數(shù)據(jù)治理" target="_blank">數(shù)據(jù)治理理論中緊密相連,比如參考數(shù)據(jù)和主數(shù)據(jù)在DAMABOK中是同一章節(jié),而主數(shù)據(jù)和數(shù)據(jù)標(biāo)準(zhǔn)在實(shí)際項(xiàng)目中則常常引發(fā)人們的困惑。例如,人們可能會(huì)疑問:建立了主數(shù)據(jù)體系后,是否還需要制定數(shù)據(jù)標(biāo)準(zhǔn)?反之亦然。這兩者之間到底有多少交集,又有多少不重疊的部分?它們各自在哪些領(lǐng)域更為擅長,能在數(shù)據(jù)治理的哪個(gè)環(huán)節(jié)提供不同的解決思路或解決不同的問題?
為了解答這些疑問,將對(duì)這三個(gè)概念進(jìn)行詳細(xì)講解。

1.參考數(shù)據(jù)
參考數(shù)據(jù)管理的是對(duì)定義的數(shù)據(jù)域中關(guān)聯(lián)的數(shù)據(jù)值進(jìn)行管理,包括標(biāo)準(zhǔn)化術(shù)語、代碼值、唯一標(biāo)識(shí)符,以及其他數(shù)據(jù)取值所需的業(yè)務(wù)定義等。
簡單來說就是我們?nèi)粘Kf的碼表或維度,如郵編、地區(qū)、性別、學(xué)歷等。這些參考數(shù)據(jù)相對(duì)固定,無論是維度的編碼規(guī)范還是命名方式,無論是國家標(biāo)準(zhǔn)還是行業(yè)標(biāo)準(zhǔn),都遵循一定的標(biāo)準(zhǔn)。它們已經(jīng)具備了宏觀和微觀的參考面,形成了具有參考價(jià)值的數(shù)據(jù)。
2.主數(shù)據(jù)
企業(yè)主數(shù)據(jù)是指企業(yè)內(nèi)部一致共享的業(yè)務(wù)主體。主數(shù)據(jù)則更多地關(guān)注數(shù)據(jù)的源頭管理,它不僅僅局限于軟件層面,而是對(duì)數(shù)據(jù)本身進(jìn)行源頭上的管理和控制。
3.數(shù)據(jù)標(biāo)準(zhǔn)
至于數(shù)據(jù)標(biāo)準(zhǔn),它實(shí)際上是對(duì)數(shù)據(jù)過程的管理。與主數(shù)據(jù)相比,數(shù)據(jù)標(biāo)準(zhǔn)在本質(zhì)上存在區(qū)別。數(shù)據(jù)標(biāo)準(zhǔn)更注重?cái)?shù)據(jù)在流轉(zhuǎn)過程中的規(guī)范性、一致性和準(zhǔn)確性,以確保數(shù)據(jù)在整個(gè)生命周期內(nèi)都能保持高質(zhì)量。對(duì)于主數(shù)據(jù)而言,也有主數(shù)據(jù)的數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)標(biāo)準(zhǔn)不僅確保了數(shù)據(jù)在采集、存儲(chǔ)、處理和傳遞過程中的高質(zhì)量,還為主數(shù)據(jù)的源頭管理提供了規(guī)范和指導(dǎo)。
主數(shù)據(jù)與數(shù)據(jù)標(biāo)準(zhǔn)是相互關(guān)聯(lián)、相輔相成的。數(shù)據(jù)標(biāo)準(zhǔn)為主數(shù)據(jù)的源頭管理提供了規(guī)范和指導(dǎo),而主數(shù)據(jù)的源頭管理則確保了數(shù)據(jù)在整個(gè)生命周期內(nèi)的高質(zhì)量。通過制定和實(shí)施主數(shù)據(jù)的數(shù)據(jù)標(biāo)準(zhǔn),企業(yè)可以更好地管理和利用主數(shù)據(jù),支持企業(yè)的決策和業(yè)務(wù)發(fā)展。
04一個(gè)類比闡述區(qū)別
下面,我將通過舉例和形象類比的方式,重點(diǎn)闡述主數(shù)據(jù)和數(shù)據(jù)標(biāo)準(zhǔn)的區(qū)別。由于參考數(shù)據(jù)相對(duì)容易理解,因此在此不再贅述。

首先,我們來看一個(gè)日常
數(shù)據(jù)倉庫(DW)三層建設(shè)的標(biāo)準(zhǔn)流程(如上圖),這一流程大家應(yīng)該較為熟悉。而主數(shù)據(jù)的應(yīng)用路徑則有所不同,它并未進(jìn)入數(shù)據(jù)倉庫,而是直接從業(yè)務(wù)系統(tǒng)的源頭對(duì)數(shù)據(jù)進(jìn)行處理和管控。相比之下,數(shù)據(jù)標(biāo)準(zhǔn)則是在數(shù)據(jù)從生產(chǎn)環(huán)節(jié)產(chǎn)生后進(jìn)入數(shù)據(jù)倉庫或數(shù)據(jù)湖的過程中,對(duì)數(shù)據(jù)流轉(zhuǎn)加工進(jìn)行監(jiān)督和落標(biāo)管理。
為了更形象地說明這一點(diǎn),舉了一個(gè)可能不太恰當(dāng)?shù)睦樱嘈拍軌驇椭蠹依斫狻V鲾?shù)據(jù)就像交警,而數(shù)據(jù)標(biāo)準(zhǔn)則像協(xié)警。交警主要出現(xiàn)在關(guān)鍵和主要的路口,擁有執(zhí)法權(quán)和處罰權(quán),負(fù)責(zé)維護(hù)交通秩序和制定交通法規(guī)。而協(xié)警則出現(xiàn)在各個(gè)路口,協(xié)助管理交通,但沒有執(zhí)法權(quán),只能配合交警處理相關(guān)事務(wù)。
在這個(gè)類比中,主數(shù)據(jù)就像交警一樣,在數(shù)據(jù)流程的關(guān)鍵環(huán)節(jié)進(jìn)行管控和治理,確保數(shù)據(jù)的準(zhǔn)確性和一致性。而數(shù)據(jù)標(biāo)準(zhǔn)則像協(xié)警一樣,在數(shù)據(jù)流轉(zhuǎn)的過程中提供監(jiān)督和指導(dǎo),確保數(shù)據(jù)符合既定的標(biāo)準(zhǔn)和規(guī)范。
此外,還想穿插一個(gè)與主數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)緊密相關(guān)的概念,那就是數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量可以類比為查酒駕的執(zhí)法人員,他們不僅查酒駕,還可以查毒駕、違章、超速等。在數(shù)據(jù)流轉(zhuǎn)的各個(gè)環(huán)節(jié)中,數(shù)據(jù)質(zhì)量負(fù)責(zé)檢查數(shù)據(jù)的準(zhǔn)確性和合規(guī)性,確保數(shù)據(jù)符合既定的質(zhì)量規(guī)則。
因此,主數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)質(zhì)量這三者緊密相連,共同構(gòu)成了數(shù)據(jù)治理的核心。它們既可以作為整個(gè)數(shù)據(jù)治理過程的重要組成部分,也可以結(jié)合使用,對(duì)數(shù)據(jù)的質(zhì)量進(jìn)行全方位的把控和提升。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除)