近年來,隨著大數據產業的蓬勃發展,企業和政府對于自身的
數據價值產生了重新認知。數據越來越多,怎么管?如何用?才能讓數據發揮價值,成為了眾多企業的一個難題!
有效的
數據治理可以確保企業數據全面、一致、可信,從而全面釋放數據的價值,提高業務流程效率、提升業務增長的機會,驅動企業
數字化轉型。
這聽起來很簡單,但事實上數據治理對每個企業都是一項很大的挑戰。數據治理在為企業提供價值的時候,往往會遇到很多問題,比如:沒有明確的戰略需求,
數據標準缺失,數據源頭不清晰,
數據質量缺乏監管等。這就需要我們要有統一的數據標準和良好的數據質量來構建數據治理體系。
01明確的數據標準
企業進行數據治理的過程中,頂層設計和組織建設尤其關鍵。我們需要將數據治理視作一項戰略層面的活動,要有明確的目標和方向,使得數據治理最終能夠滿足業務需求,為業務創造價值。
根據企業自身的戰略需求以及數據現狀可以從以下幾點切入:
1.對企業業務進行定義,并對每個業務中的業務活動進行梳理,同時需要收集各類業務單據、用戶視圖,梳理每個單據和用戶視圖之間的數據對象。
2.針對數據對象進行分析,明確每個數據所包含的數據項,同時,梳理并確定出該業務中所涉及的數據指標和指標項。
3.梳理和明確所有數據指標的關系,并對數據之間的關系進行標準化定義。數據關系也是數據標準管理的內容。
4.通過以上梳理、分析和定義,確定出
主數據標準管理的范圍。
對數據進行充分調研后,企業就可以針對性的制定
數據治理方案。對于不同業務類別的數據項,則需要梳理出數據之間的聯系,方便進行數據之間的關聯分析。
數據標準是企業數據治理的一部分,是一個涉及范圍廣、業務復雜、數據繁雜的工程。數據標準的實施絕非是一個部門的事情,需要從整個組織考慮,建立專業的數據治理體系。
02以價值為導向的數據治理
數據治理在為企業提供價值的時候,往往會遇到很多問題,主要表現為以下三點:
1.部門各自為政,數據反復清洗加工、分析工具重復采購、挖掘成果小范圍使用、先進經驗未能共享;
2.數據割裂:管理條線間數據割裂、數據來源間未能打通、數據脫敏后喪失價值,比如我們在做洗錢交易識別時發現交易對手的唯一標示全部是星號,這就是選取了錯誤的脫敏方式導致的不可恢復的錯誤后果;
3.缺乏系統性管理:缺乏全面的圍繞客戶、風險、運營、財務等全面規劃分析場景,執行過程隨意,流程體系不健全,保障不到位,數據和模型資產流失嚴重。
數據治理便是為數據資產保值增值而服務的。其目標是消除歧義、減少數據孤島,降低數據使用成本,提高對業務的響應,提高對數據隱私安全保護。
實施數據治理可以為數據管理提供可信任的數據,減少數據重復,增強業務和IT對于數據的信心,改善數據的及時性和可用性,建立通用的數據詞匯表,以確保訪問正確的信息,定義企業范圍(或站點/項目范圍)的值以獲取公共參考數據,提供信息和指導,以協助有關數據的合規性和監管工作。
過去提到數據治理,更多的被認為是IT部門的事,其實不是這樣的。就拿數據質量舉例吧,數據來自業務,它產生于業務,獲取自業務系統,數據質量標準也是業務部門訂的,數據人只是幫業務人員落地質量檢驗,但是數據有質量問題,是不能直接解決的。業務部門如果不太關心數據質量,比如說最近金融監管部門對洗錢行為監管更嚴格了,很多銀行希望買套系統或者寄希望于AI算法識別洗錢行為,但是很多金融機構對最基本客戶信息還不了解,連客戶基本的聯系方式和地址都存在大量缺失,這很難保證客戶的真實性。
舉個例子,一間屋里注冊了六家公司,這些公司肯定是空殼公司。數據質量如果由IT負責很難滿足要求,因為業務人員辦理業務的時候根本不去核實這個地址的真實性,地址寫不寫他都不太關心。把數據質量提升的工作壓到IT人員根本解決不了問題。

提到數據治理,很多人關注的是自頂向下的制度設計,而忽視自底向上業務的驅動。很多時候是IT閉門造車,還提出基于IT架構的數據治理。
感覺這很專業啊,但是我舉個例子,比如我今天想吃飯了,得看看家里有什么菜,至于符不符合口味不知道,有什么就吃什么。
這是基于IT架構的數據治理,只管盤點現有系統和現有數據。這個方法確實有其用處,但是不應該作為數據治理的主導。因此,以往的數據治理經常出現有數據治理組織架構,卻無合適的人到崗;有數據標準等規章制度,而在新舊系統上無法落地。
因此,ThoughtWorks數據智能事業部呼吁國內企業回到價值導向的數據治理的初心,提出精益數據治理,不僅從上至下,并且自底向上,圍繞業務場景,以價值驅動數據治理的具體體現。
精益數據治理講求價值驅動,圍繞場景,減少浪費,持續改進。體現為以下五個特點:
1.從業務愿景出發識別價值,在適當的時間為內部客戶提供價值是精益數據治理的關鍵要求,通過對齊業務戰略和目標來識別有價值的數據利用場景。
2.構建價值流,識別出場景后,在源數據和場景之間建立價值流,價值流是將產品或服務帶給用戶所需的資源和信息流,需要構建和改進價值流,避免浪費。
3.使價值從源頭流向用戶,“流”使價值能夠以經過最少的階段和活動便能交付,無縫流是精益數據治理的關鍵要求。減少浪費是精益數據治理的重要策略,我們發現,所有的數據質量的問題,都能夠與精益思想的7種浪費一一對應起來,解決了數據生產的浪費問題,就大部分解決了數據質量問題。
4.拉動價值流,只有在內部客戶有需求時,流程才能運行,此階段強調僅在有需求時才需要響應。
5.不斷迭代,精益求精,持續改進以追求完善,實現可持續變革。
數據治理組織建設中,企業需要綜合考量數據規模、數據治理難度、業務復雜性等因素,建設一個規模合適,同時能深刻理解業務需求的數據治理組織。
對于大多數初創企業來講,至少要設置數據治理負責人、
數據分析師、數據管家、系統管家這四個基本角色,以保證數據治理整個鏈路中的要求和目標能夠得到落地實施。而對于大型企業而言,則要更多地關注數據和信息的體系化管理,注重激勵制度的完善以及內部多個部門之間的高效安全協同。
(部分內容來源網絡,如有侵權請聯系刪除)