- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-12-22來源:普通不代表懦弱瀏覽數:316次
沉淀下來的數據資產還可以繼續被別的消費者使用,隨著這樣的數據資產越來越多,大家都看到了業務價值,數據治理就會走上正軌。
01 數據資產的生產和消費現狀—— 孤島就在那里!在大數據時代,企業數據資產的生產和消費,實際現狀大概是這樣的。一方面,每個業務部門都產生并存儲了大量的數據。這些數據存儲在不同的系統中。每個業務部門都是數據的生產者。另外一方面,每個業務部門都有使用數據來幫助進行更智能決策,每個業務部門也都是數據的消費者。作為數據的消費者們,希望可以自由地消費全公司的數據資產。因為只有聯合了多個相關部門的數據進行分析,才能夠得到更為有用的結果。但是,部門墻、數據孤島總是客觀存在的,讓數據消費者去方便地消費全公司的數據有很多困難。一方面,數據是由各個業務部門產生的。絕大部分公司,并不存在一個覆蓋全公司各個業務部門的數據資產的地方。所以數據消費者不知道有哪些數據可以消費。
另一方面,數據的使用也帶來了授權和監管的需求。如果數據包含了敏感信息,比如個人信用卡信息,那么法律法規就限制數據只能在有限情況下被特定的人訪問。無論是授權給合適的人,還是監督誰訪問了這些數據,都是數據被使用的必然要求。而這些要求伴隨數據生產者,在公司內部很碎片化。
02 數據資產的消費和監督—— 魚和熊掌可兼得?這個工具應該支持數據生成者迅速地把自家數據形成一個Schema,定義好有哪些字段,字段的具體含義。并且定義好哪些組織,什么人可以訪問,消費者看到以后,就可以直接使用。
03?敏捷的,分散式的數據治理—— 到底怎么搞?
也許有人要問,有沒有一個辦法可以提供一種靠譜的,持續發展的數據治理方式,幫助企業在生產者和消費者之間牽線搭橋,既能方便消費者很好地跨部門使用數據,又能夠讓數據的訪問經過合理的授權,接受監督呢?下面就給您答案!2022亞馬遜云科技re:Invent全球大會上發布了一個新服務Amazon DataZone。Amazon DataZone為數據治理提供了一套可行的思路:敏捷的,分散式的數據治理。具體來說,Amazon DataZone提供了一個平臺和對應的工具,方便數據的生產者和消費者建立連接,讓消費者對生產者的數據進行使用。在實際使用過程中,并不需要全公司全方位進行數據治理。只需要找到一個生產者和一個消費者,這一對生產者和消費者就可以先創建項目和API,讓消費者把數據在監管的情況下先用起來。下圖展示了Amazon DataZone的主要組件。

繼續上面這個例子。如果有更多團隊想使用已有的數據資產,他只需要在Amazon DataZone的門戶搜索并發現這個數據資產。然后就可以訂閱并加入消費者的行列。第三者的使用并不需要生產者再次重復之前創立數據資產和對應API的所有步驟了。下圖展示了潛在數據消費者,如何利用數據門戶進行搜索。
如果說Amazon DataZone提供的功能讓一對生產者和消費者建立連接,是一個企業內部的兩個點被連成了一條線的話,那么第三者通過Amazon DataZone發現數據資產并使用,則可以讓線變成網。用的時間就來,不斷有生產者和消費者加入,不斷有額外的消費者建立額外的鏈接,數據治理也就越來越成規模化發展了。這就是敏捷的,分散式的數據治理。在這里,Amazon DataZone扮演了重要角色。一方面,Amazon DataZone只是一個數據資產發布和管理的平臺,實際對數據資產進行管理的依然是數據的生產者。另外一方面,Amazon DataZone事實上聚集了越來越多的數據資產的信息。同時Amazon DataZone也提供了讓第三方潛在數據消費者去發現這些數據資產,從而能夠使用這些數據資產的能力。這兩方面能力的結合,是Amazon DataZone解決數據治理過程中萬里長征不知道從何開始,也不知道怎么樣完成的核心手段。Amazon DataZone通過這些能力,為企業敏捷的,分散式的數據治理提供了一個平臺。在這個平臺下,企業可以通過敏捷的增量模式,逐漸將公司的所有數據資產在一個統一的平臺下實現數據治理,讓數據治理的萬里長征真正成功。Amazon DataZone這個服務,值得每個需要數據治理的企業去嘗試。對于企業來說,數據可能來源于數據倉庫、數據湖、流數據、關系數據庫、第三方系統等多個地方,亞馬遜云科技提供了一個叫Amazon Glue工具,可以輕松地發現、集成來自多個數據源的數據,并且可以對數據進行提取、轉換、加載(ETL)。用戶可以按照自己的需求,把各個數據源的數據進行編目,形成數據目錄(Data
Catalog)。
有了數據目錄和組織結構做基礎,每個部門就可以根據需要來創建屬于自己的業務術語,元數據,從而建立自己的數據資產。
數據資產一旦發布出去(當然,需要設置好權限),別人就可以查詢了,Amazon DataZone 專門提供了一個門戶(Portal)對數據資產進行查詢,非常方便。

利用這種方式,可以迅速地對接生產者和消費者,把數據資產創建起來,馬上投入使用,從而實現快速響應業務需求,應對市場變化。沉淀下來的數據資產還可以繼續被別的消費者使用,隨著這樣的數據資產越來越多,大家都看到了業務價值,數據治理就會走上正軌。