- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2025-09-03來源:數據學堂瀏覽數:112次
數據倉庫適合存儲結構化的、信息密度高的、經過處理后的數據。例如我們通過大數據分析得到的關聯信息、畫像信息等,都可以放在數據倉庫中。
“倉庫”一詞也將它的特點表現得清清楚楚。倉庫,東西要放在規整的貨架上,甚至還會給貨架編號。這里的數據很規范,用起來沒那么靈活。
數據湖適合存儲非結構化的、信息密度低的、未經清洗的數據。例如生產中我們獲取到的日志信息、長文本信息等都可以直接放到數據湖中。
曾經有一段時間,大家對于大數據的存儲形式分裂為了兩派。不斷詢問是選擇數據湖,還是選擇數據倉庫?
選擇數據湖,才能擁有數據的多樣與靈活,有利于將不同的數據組合在一起,發現新的規律。選擇數據倉庫,才能擁有數據的規范與清晰,有利于數據的便捷使用,也利于數據的長時間存儲。
湖倉一體,即打通數據倉庫和數據湖兩套體系,讓數據和計算在湖和倉之間自由流動,從而構建一個完整的有機的大數據技術生態體系。這就像是在你的面前放了一個擺滿了文檔的書桌(數據湖),也放了一個小書架(數據倉庫)。于是兩者的數據以隨意獲取,在靈活與規范之間取得了平衡。

下面這份PPT材料來自DAMA中國,專題分享活動《湖倉一體,構建企業數字化新基座》,作者毛亮堅,主要介紹了大數據平臺架構演進、詳細闡述湖倉一體架構構建與探索思路、湖倉一體化平臺應用實踐案例、最后提出了湖倉一體化平臺未來發展趨勢,推薦閱讀學習。(文末附PPT下載鏈接)








































