日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

現代數據架構的核心特征:“1個中心+10個強化”

時間:2022-04-02來源:我太帥了萬人愛瀏覽數:247

每個為決策提供數據的組織都在重新思考其數據架構。與五年前相比,新技術加速改變組織競爭和服務客戶的方式。

現代數據驅動的組織不是事后對事件做出反應,而是預測業務需求和市場變化,并主動工作以優化結果。不創新或改造其數據架構的公司會失去客戶、資金和市場,失去優勢和競爭力。

本文總結了現代數據架構的主要特征,并為正在開發新數據戰略的組織提供參考。

什么是數據架構

與設計房屋或建筑物的傳統架構師一樣,數據架構師創建的數據環境藍圖與組織的短期和長期目標及其獨特的文化和背景要求相一致。

對于大多數人來說,將數據架構理解為組織用來管理數據的一組標準產品和工具。但遠不止于此。數據架構定義了捕獲、轉換和向業務用戶交付可用數據的流程。最重要的是,它確定了將使用該數據的人員及其獨特需求。一個好的數據架構從右到左流動:從數據消費者到數據源——而不是相反。

過去,組織構建了相對靜態的 IT 驅動的數據架構。我們稱它們為數據倉庫。由于底層技術和設計模式,大多數數據倉庫需要大量人員來構建和維護,投資回報率極低。大多數都是表面絢麗的企業數據轉儲,當然有些效果是很好的,為報告和分析提供了豐富的集成維度數據。

現代數據架構仍然可以提供數據倉庫——一個靈活、適應性強和敏捷的數據倉庫。但正如一些人所說,數據倉庫只是現代數據架構或現代分析生態系統的一個組成部分。新的數據環境是一個活生生的有機體,可以檢測和響應變化,不斷學習和適應,并為每個數據消費者提供受管理的、量身定制的訪問能力。

數據架構不是數據平臺。后者指的是完成采集、存儲、轉換和驗證數據的引擎和工具。數據平臺由處理數據的底層數據庫引擎(例如,關系、Hadoop、OLAP)以及使 IT 和業務部門的數據工程師能夠創建數據集以供業務使用的數據組裝框架組成。

“數據組裝”是一個新術語,它取代了以 IT 為中心的內涵的術語“數據集成”。數據組裝強化了現代數據架構是業務和 IT 之間協作的概念。

現代數據架構的特征:1個中心和10個強化

1個中心:以數據消費者為中心

現代數據架構不是專注于提取、攝取、轉換和呈現信息所需的數據或技術,而是從業務用戶及其需求開始并向后流動,以終為始。數據消費者可以是組織內部或外部的,他們的需求因角色、部門和時間而異。良好的數據架構不斷發展,以滿足新的和不斷變化的客戶信息需求。

10個需要強化的方面

1.適應性強

在現代數據架構中,數據像水一樣從源系統流向業務用戶。該架構的目的是通過創建一系列滿足各種業務需求的互連和雙向數據管道來管理該流。管道是使用基礎數據對象構建的——數據快照、數據增量、數據視圖、參考數據、主數據和面向主題的平面表。數據對象作為構建塊,不斷重復使用、重新利用和補充,以確保高質量的相關數據穩定地流向業務。

2.自動化強

為了創建一個數據持續流動的適應性架構,設計人員必須使一切自動化。他們必須在數據被攝取時對其進行分析和標記,并將其映射到現有的數據集和屬性,這也是元數據注入的過程,他是數據發現的一個關鍵功能。同樣,它還必須檢測源模式的變化并識別變化對下游對象和應用程序的影響。在實時環境中,它必須檢測異常并通知適當的人并在操作儀表板中觸發警報。

3.智能化強

理想的數據架構不僅僅是自動化的;它使用機器學習和人工智能來構建保持數據流動的數據對象、表、視圖和模型。它使用智能而不是蠻力來識別數據類型、公共鍵和連接路徑、識別和修復數據質量錯誤、映射表、識別關系、推薦相關數據集和分析等等。現代數據架構使用智能來學習、調整、提醒和推薦,使管理和使用環境的人更加高效和有效。改變“數據找人”而不是“人找數據”的模式。

4.靈活性強

現代數據架構需要足夠靈活以支持多種業務需求。它需要支持多種類型的業務用戶、加載操作和刷新率(例如批處理、小批量、流)、查詢操作(例如創建、讀取、更新、刪除)、部署(例如本地、公共云、私有云、混合)、數據處理引擎(例如,關系、OLAP、MapReduce、SQL、圖形、映射、規范化)和管道(例如,數據倉庫、數據集市、OLAP 多維數據集、可視化發現、實時操作應用程序。)現代數據架構必須是所有人的一切。

5.協作性強

與 IT 部門構建一切的過去不同,現代數據架構將獲取和轉換數據的責任分攤到 IT 和業務之間。IT 部門仍然承擔著從核心操作系統中提取數據和創建通用可重用構建塊的工作。但從那里開始,由業務部門接管。業務部門的數據工程師和分析師使用數據準備和數據目錄工具來創建由公司和本地數據組成的自定義數據集,并使用它們來創建和支持業務部門應用程序。這種協作使 IT 不必了解業務環境,而這從來不是它的強項。

6.治理性強

治理是自助服務的關鍵。現代數據架構為每種類型的用戶定義了訪問點,以滿足他們的信息需求。業務用戶主要包括:數據消費者、數據探索者、數據分析師和數據科學家。例如,數據科學家需要能夠訪問著陸區的原始數據,或者更好的是,構建一個專門沙箱,他們可以將原始數據與他們自己的數據混合在一起。

7.簡單性強

最簡單的架構就是最好的架構。鑒于當今數據架構中需求的多樣性和組件的復雜性,這是一項艱巨的任務。要應用此規則,擁有小數據的組織可能更適合使用具有內置數據管理環境的 BI 工具,而不是大規模并行處理 (MPP) 設備或 Hadoop 系統。為了降低復雜性,組織應努力限制數據移動和數據重復,并倡導統一的數據庫平臺、數據組裝框架和分析平臺。

8.擴展性強

在大數據和可變工作負載的時代,組織需要一個可擴展的彈性架構,以適應不斷變化的數據處理需求。許多公司現在涌向云平臺(公共和私有),以可承受的價格獲得按需可擴展性。彈性架構使管理員不必精確校準容量、在必要時限制使用以及不斷地過度購買硬件。彈性還催生了許多類型的應用程序和用例,例如按需開發和測試環境、分析沙箱和原型設計環境。

9.安全性強

現代數據架構是一座自由堡壘——也就是說,它為授權用戶提供隨時訪問數據的權限,同時阻止黑客和入侵者。它還符合隱私法規,包括數據安全法、個人信息保護法和適用于各地區的數據保護條例。它通過在攝取時加密數據、屏蔽個人身份信息 (PII) 以及跟蹤數據目錄中的所有數據元素(包括它們的沿襲、使用和審計跟蹤)來實現這一點。生命周期管理確保每個數據對象都有一個所有者、一個位置和一個過時計劃。

10.彈性強

任何數據架構都必須具有彈性,具有高可用性、災難恢復和備份/恢復功能。在現代數據架構中尤其如此,該架構通常在云中的大型服務器上運行,而中斷是司空見慣的。因此,需要提供內置冗余和故障轉移以及良好的服務水平協議 (SLA),并允許公司以低成本在地理分布的數據中心中設置鏡像以進行災難恢復。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢