- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-01-20來源:首烏瀏覽數:204次
? ? ? 總結:“數據堆棧”現代化的起點在于您的員工。請評估現有技能,并確保后續會吸納更多新鮮血液。另外,請制定起明確的計劃,思考如何培訓現有員工以引導他們發展為數據科學家,所需的培訓內容又與“AI專家”有什么不同。
? ? ? ?過去十年當中,數據、人工智能與分析領域發生了巨大的變化:從Hadoop的迭起興衰,到云計算這一核心驅動力的普及執法。2021年,Gartner發布預測稱云計算將是一種“必然”。到2022年,公有云服務將在90%的數據與分析創新項目中發揮重要作用。麥肯錫方面則警告稱,要發展成為數據驅動組織,企業必須有能力使用云數據倉庫、開放數據湖與實時分析平臺對原有IT資產進行現代化改造。波士頓咨詢集團則建議,大家應重新調整數據與數字平臺(DDP)的構建方法,并將其與云服務提供的全新租戶架構融合起來:? ? ? ?數據與核心事務系統彼此分離
? ? ? ?通過API在系統之間創建模塊化接口
? ? ? ?將數據即服務交付給全渠道智能業務層
? ? ? ?最后,風險投資公司Andreessen Horowitz呼吁采用“統一數據基礎設施”,借此適應行業中的最新架構變化。
? ? ? ?說了這么多,很多朋友是不是感覺有點頭暈?面對這么多建議乃至最佳實踐,CIO到底該怎么做?我的建議很簡單:首先明確哪些因素對員工乃至企業的業務產出影響最大。接下來,我們將從近期三大數據架構變化的角度出發,有針對性地找到答案:
? ? ? ?曾幾何時,IT部門發起過一輪為期多年的轉型旅程,努力將企業內的所有數據都集中在數據倉庫當中。支撐這一愿景的基本思路在于,IT部門應該維持一套事實(或者說「數據」)版本,并將其交付給企業內的各個業務部門。數據將在這里集中接受清洗、維護與保護。在此過程中,行業意識到這樣的愿景存在很多問題:數據的移動比預期中要更困難、也更昂貴,而且將IT服務擴展至業務需求的挑戰性也遠高于我們的想象。在本地存儲、保護及維護數據的高昂成本,導致IT部門無法真正靈活地將任意數量的數據納入數據倉庫,由此帶來的效果與最初目標可以說南轅北轍。而云數據倉庫之所以能夠蓬勃發展,依靠的就是其使得企業能夠以更快的速度與更低的成本通過自助服務模式快速配置海量以往根本無法獲取的資源。此外,由于送入數據倉庫的數據源能夠比以往更加分散,因此企業需要一種同時具備批處理與實時處理模式的敏捷系統,負責在本地系統、SaaS應用程序以及第三方來源之間隨時提取數據。用業務術語來說,云數據倉庫對于組織之所以具有重大意義,是因為它允許您以一種經濟高效、安全且敏捷的方式,幫助員工以必要的速度訪問必要的信息,最終據此做出正確決策。
? ? ? ?這類概念相信大家已經聽過很多次了,這里最重要的是確定哪些術語對您的團隊及其需求真正具有意義。以往,大多數企業從“受信”源系統中提取到的數據,而后對其進行轉換(即「準備」)并加載至目標數據存儲當中(即ETL流程)。請注意,這里的“受信”是加了引號的。選擇此流程的一大原因在于數據存儲成本:ETL能夠幫助團隊減少實際加載至數據倉庫內的數據量。但這同時也引發了負面影響:負責“T”部分的團隊必須決定要傳遞多少數據、采取怎樣的數據傳遞形式。設想一下,這樣的數據在落入最終用戶手中時必然引發大麻煩:不同團隊可能會根據自己的情況需要不同的數據類型、樣式與規模,但這一切恐怕都與“T”團隊的預設匹配不上。問題的常規解決方法就是回歸“E”團隊,這通常是一支遠離數據使用者的技術團隊。雖然效果不錯,但這又會給企業即時達成業務目標的能力造成巨大損失。ELT則認為團隊應首先提取出盡可能多的數據,將其加載以供分析人員與科學家使用,之后在實際分析前的最后一個環節內執行轉換。這種方法的實現基礎同樣源自云數據倉庫,云服務的經濟性讓這套方案真正擁有了成本可行性。但在考慮使用這套方案之前,請確保您的團隊已經擁有或者有能力掌握新流程所需要的各項技能。
總而言之,ELT的核心優勢在于,只要您認為數據儲備是越多越好,那么我們就能保證提取過程和業務用戶對龐大數據總量的訪問能力。
? ? ? ?隨著低代碼/無代碼趨勢的興起,以及對于富數據應用程序的需求,您的員工需要以更敏捷、更靈活的方式應對日常工作。換言之,我們應該將可組合應用程序作為業務生態系統中的一大主體,同時保證相關數據的訪問安全。在我看來,可組合應用程序與智能應用程序是CIO們絕對不可忽視的兩大重要趨勢:Okta在其2021年《Business at Work》報告中提到,目前每家組織平均擁有88款應用程序,包括技術或媒體等特定行業組織的應用程序數量甚至可能翻倍(分別為155款與133款)。
