以下是我用來確定一家公司所處階段及其邁向分析驅動型文化的下一步的方法:
零階段:
處于零階段的公司要么完全缺乏對元數據的認識,要么看不到它的價值。許多非常早期的組織或技術含量非常低的公司到目前為止都做得很好,不需要在這個領域進行投資。
這些公司通常擁有規模有限的單一數據源,并且其數據和分析 (D&A) 環境的整體成熟度非常低。這些組織沒有關于其元數據的文檔,因此,其余屬性是無關緊要的。無利用率、無流程、無連接、零可訪問性。
零階段之后的下一個階段通常發生在公司因規模或運營規模的增加而開始面臨痛苦時。它從孤立的項目開始,記錄元數據以符合指標定義,并降低人們離開公司并帶走他們的分析專業知識的風險。
意識到:
記錄元數據的好處越來越明顯,但過程是高度非正式的。文檔仍然在孤島和靜態文檔(如 Google Docs、Git 或 Confluence)中完成,沒有連接到數據系統,也沒有圍繞文檔更新的過程。正在記錄的元數據僅限于最常用的表和列。此外,重點僅放在工程和 IT 等技術職能部門使用的數據上。通常,由于信息共享和透明度(特別是數據和分析)方面的限制,這些組織對分析的訪問也非常受限。
下一階段是形式化的開始。隨著數據的治理和業務用例開始逐漸增加,對更透明的數據訪問的需求也在增加。這通常是組織開始尋找正式解決方案的階段。并采取第一步將數據推送給每個功能使用。
數據驅動:
這是采用成為關鍵因素的第一階段,因為數據和分析解決方案的采用是衡量公司數據驅動程度的代理指標。
幾乎每個組織都表達了更多的數據驅動的愿望,但數據驅動的定義是非常主觀的,具有截然不同的環境和流程的公司通常將自己定義為數據驅動。
在這種情況下,數據驅動不是最后階段,因為數據只是故事的一半。如果沒有關于如何正確使用它的說明,它的價值值得懷疑,甚至會造成損壞(我喜歡將數據與烘焙組件進行比較的類比。如果沒有詳細準確的食譜,你的蛋糕將無法按照應有的方式組合在一起或可以)。處于數據驅動階段的公司至少已經實施了數據字典。他們已經將多個數據庫中的所有模式映射到列級別,并開放了對該文檔的訪問權限,以訪問治理和財務等其他功能(只是一個數據字典,它仍然沒有真正提供分析功能)。這些數據字典解決方案仍然嚴重依賴人工干預,
從這里開始的下一階段將公司帶入企業信息管理領域。這就是治理框架和業務流程對組織的成長和穩定至關重要的地方,因此元數據文檔的形式化不再是“可有可無”。那是“治理”階段……
治理:
直到最近幾年,這個階段是為財富 500 強公司、聯邦或政府辦公室以及重視合規性的大型企業集團保留的。
他們實施企業
數據治理和數據編目解決方案是因為他們不得不這樣做,而不是因為他們想要這樣做。差異可能看起來很小,但實施過程卻大不相同,而且眾所周知,采用率很低。
有了完整的數據目錄解決方案,組織就有了正式的流程來記錄數據和業務詞匯表。他們著手進行項目以映射盡可能多的數據并將業務詞匯表直接與數據聯系起來(盡管仍然非常手動)。在這個階段,公司認識到他們可以通過提供透明、可靠和值得信賴的數據來獲得競爭優勢,供分析和業務團隊使用。這些公司在受管控的環境中優化了自助服務分析。
由于這些組織數據格局的規模,該過程需要盡可能自動化,并盡量減少手動更改管理。
下一階段是巨大的文化轉變,如開頭所述,當采用成為關鍵因素時就會發生。除此之外,公司需要開始推動流程并實施解決方案以推動采用。采用是衡量文化變革是否成功的唯一標準。
分析驅動:
使用有趣的烘焙類比,分析驅動意味著所有成分都以最高質量提供,并且每個人都可以訪問多種易于遵循的食譜。
如果數據可用且分析定義明確,正式流程和決策制定將更加直觀、快速,最重要的是,可靠!
在這個階段,分析和數據科學團隊不再忙于重做工作或質疑分析的準確性,他們能夠投入時間進行新的探索、試驗,并利用他們帶來的數據發揮創造力,以推動業務增長。
為了達到這個階段,公司需要首先為業務服務的現代技術。它不是關于編目數據——而是關于創建一個統一的、全局的、實時的語義層和一種將數據和業務術語結合在一起的語言。
語義層需要跨越每個數據源并包括每個模式、表和列,但除此之外,它還需要在其業務上下文和要提取的查詢中涵蓋所有公司的分析、正式的業務問題和官方業務指標數據的結果。有了這些流程,每個職能部門的每個人都可以訪問可重復使用的分析,并獲得始終一致的準確性和結果證據。
很容易看出這個階段如何打破孤島、推動采用并創建真正的分析驅動文化。
(部分內容來源網絡,如有侵權請聯系刪除)