“產(chǎn)業(yè)數(shù)字化、數(shù)字產(chǎn)業(yè)化”的發(fā)展要求讓數(shù)據(jù)資產(chǎn)的建設(shè)變得尤為重要,在政企數(shù)據(jù)、行業(yè)數(shù)據(jù)、用戶數(shù)據(jù)的交換融合、多維分析、綜合應(yīng)用的大勢所趨之下,數(shù)據(jù)的安全、質(zhì)量、時效性、類目等要求勢必會逐步提高,建設(shè)可溯源、可管控、可量化的數(shù)據(jù)治理體系是構(gòu)建企業(yè)數(shù)據(jù)上層應(yīng)用的重要基礎(chǔ),也是企業(yè)數(shù)字化轉(zhuǎn)型的必經(jīng)之路。那么到底應(yīng)該怎么做數(shù)據(jù)治理呢?
首先需要理解數(shù)據(jù)治理的本質(zhì)是什么。當(dāng)很多認(rèn)知和行為模式不一樣的數(shù)據(jù)生產(chǎn)者同時在生產(chǎn)數(shù)據(jù)內(nèi)容時,就會產(chǎn)生混亂的結(jié)果,這個也叫熵增。數(shù)據(jù)治理的本質(zhì),就是減熵,翻譯成大家都聽得懂的話,就是需要做規(guī)范化,或者叫標(biāo)準(zhǔn)化。而做標(biāo)準(zhǔn)化,又分為標(biāo)準(zhǔn)化的設(shè)計、標(biāo)準(zhǔn)化的執(zhí)行兩個方面。
標(biāo)準(zhǔn)化的設(shè)計可以有很多方向,這里大概列一下比較通用的標(biāo)準(zhǔn)化設(shè)計的方向,僅供參考:
① 數(shù)據(jù)表標(biāo)準(zhǔn)化
大多數(shù)企業(yè)發(fā)展到一定階段都會做數(shù)倉的建設(shè),數(shù)倉建設(shè)本身就是對數(shù)據(jù)表進(jìn)行規(guī)范化設(shè)計和管理。即使沒有數(shù)倉,我們也可以簡單地從以下兩個方面來做數(shù)據(jù)表的標(biāo)準(zhǔn)化管理:
? 數(shù)據(jù)表分層和分類。數(shù)據(jù)表分dwd、dws、mid、dm、dim層,以及按營銷、商品、采購、倉儲等域區(qū)分,同時有商品、部門、用戶等主鍵用于權(quán)限隔離。
? 權(quán)限控制規(guī)范。不同層級表的讀寫權(quán)限控制,有公共庫和業(yè)務(wù)庫的區(qū)分,全量表和增量表的區(qū)分。
② 任務(wù)標(biāo)準(zhǔn)化
sql或者etl任務(wù),在執(zhí)行過程中的讀寫操作,是性能消耗的最大影響點(diǎn),同時也決定了數(shù)據(jù)表數(shù)量和數(shù)據(jù)量的生成速度。任務(wù)的標(biāo)準(zhǔn)化對于數(shù)據(jù)治理而言重要性非常高,可以考慮從以下三個方向:
? 任務(wù)本身規(guī)范。包括命名規(guī)范,執(zhí)行規(guī)范,全量表增量表的使用規(guī)范等。
? 任務(wù)之間的規(guī)范。依賴關(guān)系要有且清晰,以及層級清晰,層級也不宜太多。
? 性能最優(yōu)。需要考慮單任務(wù)的執(zhí)行效率,精準(zhǔn)使用不同層級的表,以及不過度生產(chǎn)數(shù)據(jù)、不重復(fù)生成數(shù)據(jù)。在真正治理過程中發(fā)現(xiàn)性能異常的任務(wù),往往都是因?yàn)闆]有做性能優(yōu)化導(dǎo)致。
③ 報表頁面標(biāo)準(zhǔn)化
報表在企業(yè)內(nèi)會被大規(guī)模使用,核心報告也在被高層關(guān)注,對報告的標(biāo)準(zhǔn)化管理,能很直觀地體現(xiàn)數(shù)據(jù)治理效果:
? 分層報表管理。核心公共報表統(tǒng)一管理 vs. 自由報表單獨(dú)域或者目錄,移動端統(tǒng)一管理 vs. PC端自由產(chǎn)出,部門級核心報告 vs. 次核心報告分層等。
? 目錄規(guī)范。一般是建議按照業(yè)務(wù)屬性、部門屬性、項(xiàng)目屬性進(jìn)行劃分,方便做權(quán)限管理。
? 頁面規(guī)范。這個就比較細(xì)致了,包含對于表頭,排版,顏色,字體,對齊,圖表大小,篩選器位置,統(tǒng)計表和明細(xì)表規(guī)則等等一系列的規(guī)范。
④ 指標(biāo)標(biāo)準(zhǔn)化
在數(shù)據(jù)治理中,指標(biāo)的問題是看似簡單但往往是問題最大的一類。我們常見的指標(biāo)混亂問題,包括同樣的指標(biāo)多口徑共存,口徑范圍不清晰,規(guī)則不清晰,邏輯不嚴(yán)謹(jǐn)?shù)鹊葐栴},均需要做標(biāo)準(zhǔn)化處理:
? 指標(biāo)和指標(biāo)體系設(shè)計。參考阿里的原子指標(biāo)、派生指標(biāo)、衍生指標(biāo),不詳細(xì)講。
? 指標(biāo)規(guī)范。需要從命名,口徑,范圍,邏輯,時間等等維度進(jìn)行規(guī)范,建議做指標(biāo)管理平臺或建設(shè)企業(yè)的指標(biāo)白皮書。
? 指標(biāo)歸屬。核心指標(biāo)歸屬IT/數(shù)據(jù)部門統(tǒng)一管理,并且需要做自上而下的宣導(dǎo),以及統(tǒng)一性保障(錯也一起錯)。而業(yè)務(wù)部門自己開發(fā)的指標(biāo),在命名上就需要做一些區(qū)分,以及在使用場景上需要規(guī)避跟核心指標(biāo)產(chǎn)生信息沖突。
⑤ 權(quán)限管理標(biāo)準(zhǔn)化
需要對指標(biāo)、數(shù)據(jù)表等進(jìn)行機(jī)密性分層,以及按不同部門不同層級的成員進(jìn)行權(quán)限的劃分,同時需要跟高層協(xié)商審批的規(guī)范,包含系統(tǒng)or郵件申請,不同類型申請對應(yīng)的審核人。容易忽視的一點(diǎn)是,報表的權(quán)限和數(shù)據(jù)表的權(quán)限之間,需要保持權(quán)限的統(tǒng)一。
任何階段的數(shù)據(jù)治理,標(biāo)準(zhǔn)化建設(shè)都是必不可少。中小企業(yè)對于這塊容易忽視,在跑得快的過程中沒有及時將規(guī)則制定清晰,會為以后留下不少坑。
在做好標(biāo)準(zhǔn)化的設(shè)計后,下一步標(biāo)準(zhǔn)化的執(zhí)行,難度會大很多,需要的是做一系列的流程建設(shè),為標(biāo)準(zhǔn)化落實(shí)下去保駕護(hù)航,方向包含以下幾點(diǎn):
? 監(jiān)控機(jī)制。對于任務(wù)、頁面、數(shù)據(jù)表等,進(jìn)行監(jiān)控,以及針對異常項(xiàng)報警,郵件或消息提醒。
? 復(fù)盤機(jī)制。月度或季度進(jìn)行項(xiàng)目的復(fù)盤,針對治理的效果、目標(biāo)達(dá)成進(jìn)行反饋,以及頭部異常客戶通曬。
? 責(zé)任劃分。責(zé)任到人,各方分別需要做的事情和承擔(dān)的責(zé)任進(jìn)行同步。
? 培訓(xùn)機(jī)制。使用規(guī)范的培訓(xùn),確保大家有統(tǒng)一的行為準(zhǔn)則。
? 啟動專項(xiàng)。拉齊相關(guān)方,拉高層站臺,組織項(xiàng)目啟動會,并且做價值和目標(biāo)的同步。