隨著數據資產管理生態系統的不斷發展,現有的實踐體系也在迅速發展,可以從數據對象、
數據采集、處理架構、組織職能、管理手段和應用范圍六個方面來預測其發展趨勢。
數據對象紛繁復雜。目前,企業數據管理的主要數據對象仍然是結構化的文本數據。未來,隨著網絡爬蟲、視頻處理、語音識別、自然語言處理、圖像處理、人臉識別等相關技術逐漸成熟并被產業界進一步深度應用,城市數據、視頻數據、語音數據、圖形圖像數據等將被越來越多的進行管理和應用。預計到2020年,66%的企業將采用高級分類處理方案來采集、保存并處理非結構化的數據,以提高分析效率。
數據采集途徑豐富。隨著傳感器、5G及NB-IoT的發展,數據采集及傳輸途徑也將得以擴充。由社交媒體和機器人過程自動化(RPA)等轉型技術創建的新數據通道將為
數據治理和
數據質量組織帶來機遇和挑戰。這些渠道的數據,其規模、數量、速度和變化(SVVV)等特征與
主數據管理和數據治理的傳統領域的特征顯著不同。數據采集的變化和傳統數據管理架構產生了“差異”,這樣的“差異”要求管理組織采用不同的方法來管理數據質量和標準,以滿足相關數字業務流程所要求的靈活性。
處理架構更新換代。由于越來越多的文件、文本、日志等半結構化、非結構化數據加入形成“數據湖”,數據的處理架構也在發生變化。支持主流
大數據分析平臺的處理架構以及批處理、流計算等技術正在被應用于數據資產管理。預計到2020年,主流的分析架構都將包含基于目標進行優化的解決方案,其中三分之一的產品會將關系型及非關系型數據的處理結合在一起。數據處理的底層架構將全面采取包括分布式文件系統、MPP數據庫、傳統數倉、流計算引擎、交互式計算引擎、離線計算引擎在內的“計算&存儲混搭架構”,并逐漸由傳統的“ETL”
數據集成過程向“ELT”轉變。以Hadoop、Spark等分布式技術和組件為核心的數據處理架構,能夠支持批量和實時的數據加載以及靈活的業務需求,將是持續焦點。
組織職能升級變遷。當前主流管理制度體系中,數據管理職能由IT部門來負責,業務部門配合IT部門執行數據管理并提出需求。未來,隨著數據分析與業務融合越來越深入,業務部門將成為
數據應用的主角,在數據資產管理中扮演越來越重要的角色。據Gartner預測,未來50%的全球性組織將聘用首席數據官(CDO,Chief Data Officer),在數據高度監管的銀行金融或醫療健康領域,此類人才需求量更大。這些人員將全面負責實施和監督各級嚴格的數據治理和質量監管政策。
管理手段自動智能。依靠“手工人力”的電子表格數據治理模式即將被“自動智能”的“專業工具”取代,越來越多的數據管理員、業務分析師和數據領導者采用“平臺工具”來獲取
數據價值。隨著機器學習、深度學習技術的成熟,相關專項解決方案和平臺工具系統的技術局限性如效率低、差錯率高、擴展性差等將被一一攻破,能夠有效地解放人力,提高效率和精度。
應用范圍不斷擴大。數據的應用范圍將由傳統的內部應用為主發展為支撐內部和服務外部并重。數據資產的意義價值也從對內強化能力擴展到了對外合作開放上,從而實現數據資產保值到增值的跨越。內部應用一般包括管理優化、研判決策、風險規避、業務拓展、管控成本等。由原來的只應用于領導決策場景擴展到全員業務分析使用。外部運營包括智能推薦、精準營銷、分析報告以及風險防控等。
(部分內容來源網絡,如有侵權請聯系刪除)