- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-03-05來源:綻開的血滴瀏覽數:238次
數據湖并不是一個新概念,它最早是由Pentaho的創始人兼CTO—James Dixon在2010年10月紐約Hadoop World大會上提出來的。?它一經問世,便受到了廣泛關注,尤其是深受一些云技術頭部企業的青睞:AWS、阿里、華為、谷歌、騰訊等紛紛推出基于云技術的數據湖服務產品。?根據Aberdeen的一項調查顯示,實施數據湖技術的組織比同類公司在有機收入增長方面高出9%,數據分析的商業價值充分彰顯。??那么,數據湖究竟是啥?憑啥能夠成為大數據變革的下一個風口? 從存儲數據層面來看: 數據湖技術本質上是實現全量數據單一存儲的高級架構,可以存儲任意規模、任意類型、需求各種速度的數據,包括結構化(傳統數倉承載的數據)和非結構化數據(音視頻、圖片、文本等),通常存儲原始格式的對象塊或者文件。無需任何預處理,消除數據采集和存儲的復雜性,加速應用數據。
?
從數據分析處理層面而言: 數據湖支持多種數據處理技術,可以運行從控制面板、可視化、大數據處理、實時分析到機器學習等不同類型的分析?;?strong>讀取型Schema的特點,數據湖在分析的時候臨時建立Schema和表,用SQL數據分析,既覆蓋傳統數倉可以提供的BI分析和各種報表,還能夠滿足企業多方業務部門自主提取非結構化數據進行靈活分析的多元需求,大大提升了敏捷性和精準度。同時還能與數倉、數據庫無縫集成,擴展現有數據應用,幫助企業大數據中臺實現優化升級。 從企業運用層面的角度看: 數據湖技術打破了“數據孤島”,允許企業中的多種職能角色(如數據科學家、數據開發人員和業務分析師等)通過各自選擇的分析工具和框架(包括Apache Hadoop、Presto和Apache Spark等開源框架和數倉以及各種BI產品)來訪問數據,而無需將數據移至單獨的分析系統,節省定義數據結構、Schema和轉換的時間。不僅能夠實現跨領域、跨平臺、跨媒介的數據分析,還可以提供更全面和更精準的數據分析結果,靈活高效支撐決策制定,真正實現降本增效。?從建設成本方面來看,基于云平臺,可以實現一鍵建湖,數據湖的大小隨需而定,容量規??梢砸罁髽I的需求隨時調試,完全省去了前期購買硬件基礎設施成本,同時大大節省了人力成本和時間成本。
?
同時,數據湖能夠支持機器學習分析,具有提供極高的帶寬、多協議互通、數據共享的能力,可以極大地加速數據挖掘、深度學習等過程,可以滿足人工智能發展的數據分析需求。在應對未來發展方面,能夠進行數據預測,助力企業更好地識別和抓住業務增長的機遇,實現數字創新,不斷優化產品服務,提升客戶體驗,切實落地數智化轉型。