日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

數據質量治理與數據質量評價體系

時間:2022-03-04來源:互聯網瀏覽數:482

數據質量人人有責,這不僅僅只是一句口號,更是數據工作者的生命線。數據質量的好壞直接決定著數據價值高低。
數據質量管理是指在數據創建、加工、使用和遷移等過程中,通過開展數據質量定義、過程控制、監測、問題分析和整改、評估與考核等一系列管理活動,提高數據質量以滿足業務要求。
可按照“誰創建、誰負責;誰加工、誰負責;誰提供、誰負責”的原則界定數據質量管理責任,由數據流轉環節的各責任方對管轄范圍內的數據質量負責。對數據質量規則優先采取系統程序的自動化控制措施,并盡可能前移管控點,從源頭上控制數據質量。

01? 數據治理問題場景
在日常工作中,業務領導經常會通過報表看板等數據產品來了解各項業務的發展趨勢以及KPI的達成情況。倘若某天,他打開某張核心報表,發現當日的數據一直是空白的,詢問報表開發人員,開發經排查分析,發現是依賴的上游有延遲,上游數據預計要下午才能到達,導致業務領導在正常時點無法查看業務數據情況。
又或某天,業務人員點開報表發現當日AUM規模暴增,數據增長當然開心,但仔細推敲,發現這波動有點不合常理,于是通知數據負責人驗證下數據是否存在異常。經過幾個小時的排查分析,數據負責人報告說數據確實算的有些問題,業務業務以后對該報表數據的準確性將會打上問號。
若類似的數據問題經常出現,估計迎接你的不是美好明天,而是你的職業生涯的最后一天。

02? 數據質量的重要性
數據質量為什么至關重要?因為擁有高質量的數據可以讓您更好地了解任何情況,從而更精準地執行任何事情。反之亦然。

伴隨著技術的進步,組織或者企業能夠收集大量的數據,用好這些數據已成為焦點。然而,由于以下原因,很多組織或者企業并沒有實施數據質量計劃:
沒有業務部門負責數據質量問題
數據質量需要跨職能合作
它要求組織認識到數據質量是一個重要問題
它需要數據質量準則
它需要投入財力和人力資源
它被認為是非常人力密集的
投資回報往往難以量化

看起來,挑戰大于好處。

但是,數據質量務必重視,原因有三。

原因一:成本
數據質量差,是IT項目失敗的主要原因,也是客戶流逝背后的驅動因素之一。

原因二:合規
質量差的數據會帶來重大的法律或者聲譽風險。一些例子如下:
數據缺失導致信用風險不準確

信用記錄不完整致使風險評估錯誤

監管違規
原因三:決策
質量好的數據意味著有準確及時的信息來管理從研發到銷售的產品和服務。質量差的數據導致錯誤的洞察力,從而做出錯誤的決策。決策的錯誤,公司會付出沉重的代價。
在企業,數據服務的方式有報表看板、標簽指標和數據接口等,而這些數據服務要想為業務帶來價值的,其首要前提就是要保證數據的準確性,輸出高質量的數據。
低質量的數據會誤導業務做出錯誤的決定,致使行動方向發生偏離。特別是在數據驅動的組織中,是否有準確的、可用的高質量的數據,將直接影響領導層能否做出正確的決策和戰略目標的實現。
因此需要特別重視數據的質量問題,針對數據質量進行專項治理。

03? 數據質量常見問題
在前面的場景案例中,我們可以發現有如下幾個數據質量問題:
數據延遲,導致業務無法在正常時效內獲得數據結果。
數據錯誤,導致數據結果完全不可信,以致無法使用。
數據恢復慢,問題發生后,排查分析耗時長,數據恢復時間慢。
發現滯后,數據開發晚于業務人員發現數據異常,導致影響已傳導到數據應用端。

04? 數據質量問題原因
那應該如何解決這些質量問題,保證數據的高質量交付呢?
首先,我們需要了解這些質量問題產生的根本原因,了解問題才能更好地去解決問題。通過對歷次數據質量問題進行復盤、總結,發現質量問題主要由下面幾類原因引發:
數據平臺問題:平臺不穩定、隊列資源不足等,導致作業運行延遲、報錯。
數據開發問題:數據開發人員的任務腳本性能太差,計算嚴重耗時,導致數據延遲;或是代碼邏輯設計有問題,導致數據計算有誤。
上游系統異常:上游源系統異常,數據文件晚到,導致下游依賴作業延遲。

05? 數據質量治理
出現問題不可怕,可怕的是出現問題后,我們毫無感知,不能做到“早發現、早處理、早恢復”,以致問題直接傳導到業務方,影響業務的開展工作。
在大數據產品矩陣中,我們使用數據質量監控平臺來支持數據質量的監控、治理。
數據質量監控平臺,主要是對Hive數倉中的庫表數據的質量進行監控,包括表級別和字段級別的數據進行監控,以減少或避免由數據質量引起的事故和損失。
借助數據質量監控平臺,我們通過實施下面幾個關鍵步驟來進行數據質量的治理:

(1)配置監控規則
對高價值分的作業,我們要求強制配置基礎監控規則,如:主鍵唯一性校驗、數據非空校驗;

另還可以根據業務場景需要,配置對應的業務規則監控,如:字段總值環比校驗、字段極值校驗等,監控平臺內置了約17種字段級校驗規則、5種表級校驗規則,供直接配置使用;

除內置了豐富的校驗規則,質量監控平臺還支持SQL自定義監控規則,極大地滿足各種數據監控場景。

(2)監控告警
當校驗規則識別異常時,需要通知負責人進行跟進處理,質量監控平臺支持以電話、郵件和短信等方式通知作業屬主。作業屬主收到告警后,需及時地處理和關閉告警,否則告警將一直掛在那,在后面的告警響應度中會被稽核到,上報其領導。

(3)全鏈路數據監控
根據作業的價值分級,針對高價值作業,開發人員可根據數據血緣,對上游作業依次配上監控,實現全鏈路的數據質量監控。
(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢