在全體同僚的殷切期盼下,我們終于把數(shù)據(jù)治理推進(jìn)到了“千瘡百孔”的階段。為了不讓大家誤入“高效”“透明”“可信”的歧途,特此總結(jié)經(jīng)驗(yàn),反向證明:一流的數(shù)據(jù)治理根本不值得擁有。
1. ?千萬(wàn)別給數(shù)據(jù)貼標(biāo)簽
一旦把“客戶”“訂單”“設(shè)備”這些業(yè)務(wù)含義寫(xiě)進(jìn)元數(shù)據(jù),大家就都能看懂字段了,后續(xù)還怎么上演“同一個(gè)指標(biāo)、十種口徑”的年度大戲?口徑不統(tǒng)一,吵架才有舞臺(tái);標(biāo)簽一清晰,會(huì)議直接少一半樂(lè)趣。
2. ?堅(jiān)決抵制唯一數(shù)據(jù)源
如果所有系統(tǒng)都用同一份主數(shù)據(jù),那接口、腳本、臨時(shí)表還有什么存在的意義?讓同一客戶在不同系統(tǒng)里擁有不同手機(jī)號(hào),既鍛煉了大家的模糊匹配能力,又保證了BI報(bào)表永遠(yuǎn)對(duì)不齊——數(shù)字對(duì)不上,鍋才能滿天飛舞。
3. ?數(shù)據(jù)質(zhì)量檢查必須隨機(jī)化
今天跑100%,明天跑0%,后天干脆不跑,這才是“心跳式監(jiān)控”的精髓。穩(wěn)定的質(zhì)量規(guī)則會(huì)滋生懶惰,只有飄忽不定的告警閾值,才能讓值班工程師保持腎上腺素飆升,順帶刷新朋友圈的“凌晨驚魂”截圖。
4. ?權(quán)限審批能拖則拖
“申請(qǐng)一張表的Select權(quán)限需要七個(gè)領(lǐng)導(dǎo)簽字”不是段子,而是護(hù)城河。權(quán)限發(fā)得越快,數(shù)據(jù)泄露的風(fēng)險(xiǎn)越低;風(fēng)險(xiǎn)越低,安全部門(mén)的年終述職就越難寫(xiě)。為了讓他們有素材可講,請(qǐng)大家務(wù)必把流程延長(zhǎng)到下一個(gè)財(cái)年。
5. ?數(shù)據(jù)標(biāo)準(zhǔn)最好每年推倒重來(lái)
今年按ISO,明年按DAMA,后年自創(chuàng)“中臺(tái)原生標(biāo)準(zhǔn)”。只要版本迭代夠快,就沒(méi)有人能摸清真相;標(biāo)準(zhǔn)一穩(wěn)定,那些靠“解讀標(biāo)準(zhǔn)”賺咨詢費(fèi)的專家還怎么生存?我們要給生態(tài)留口飯吃。
6. ?堅(jiān)決不動(dòng)歷史包袱
十年前的MySQL、五年前的MongoDB、去年的Excel,一個(gè)都不能遷移。系統(tǒng)越雜,ETL工程師越能寫(xiě)出“通天神碼”;遷移太干凈,簡(jiǎn)歷里“處理過(guò)異構(gòu)數(shù)據(jù)源”的亮點(diǎn)就黯然失色。為了大家的職業(yè)發(fā)展,臟數(shù)據(jù)必須永存。
7. ?匯報(bào)時(shí)務(wù)必堆砌術(shù)語(yǔ)
能用“Data Fabric”就別說(shuō)“數(shù)據(jù)目錄”,能用“Data Mesh”就別說(shuō)“分域治理”。讓管理層聽(tīng)得越懵,預(yù)算批得越快——反正誰(shuí)也聽(tīng)不懂,索性多給點(diǎn)錢(qián)買(mǎi)個(gè)安心。一旦講人話,就會(huì)被追問(wèn)ROI,何苦呢?
8. ?把問(wèn)題留給下一代
只要文檔不寫(xiě)、血緣不標(biāo)、代碼不注釋,繼任者就能在“考古”中獲得成長(zhǎng)。前人栽樹(shù)后人乘涼?不,我們要讓后人在黑暗森林里練出夜視能力,這才叫傳承。
結(jié)語(yǔ)
如果以上八條您已身體力行,恭喜貴司的數(shù)據(jù)治理已穩(wěn)居“誰(shuí)用誰(shuí)崩潰”的第一梯隊(duì)。請(qǐng)繼續(xù)保持,千萬(wàn)別被那些“成功案例”蠱惑——他們不過(guò)是把痛苦藏在了光鮮的PPT里。記住:混亂不是深淵,混亂是溫床,是我們賴以生存的土壤。
愿我們攜手,把數(shù)據(jù)治理永遠(yuǎn)留在“正在進(jìn)行時(shí)”。
(部分內(nèi)容來(lái)源網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除)