日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

數據質量問題的影響因素

時間:2020-04-09來源:百度瀏覽數:3548

數據質量反映的是數據的“適用性(fitness for use)”,即數據滿足使用需要的合適程度。數據質量通過完整性、一致性、準確性、及時性、合法性等多類維度對數據進行度量。數據質量管理的目的是為企業提供潔凈、結構清晰的數據,是企業開發業務系統、提供數據服務、發揮數據價值的必要前提,是企業數據資產管理的前提。

數據質量問題按照問題的來源和具體原因,可以分為信息、技術、流程、管理四個問題域。如下圖所示。

信息問題域

信息類問題是由于對數據本身的描述理解及其度量標準的偏差而造成的數據質量問題。產生這部分數據質量問題的原因主要有:元數據描述及理解錯誤、數據度量的各種性質得不到保證和變化頻度不恰當等。

技術問題域


技術類問題是指由于具體數據處理的各技術環節的異常造成的數據質量問題,它產生的直接原因是技術實現上的某種缺陷。數據質量問題的產生環節主要包括數據創建、數據獲取、數據傳遞、數據裝載、數據使用、數據維護等方面的內容:

1、數據創建質量問題主要包括業務系統數據入庫延遲、創建數據默認值使用不當和數據錄入的校驗規則不當,導致指標統計結果不一致、數據無效、記錄重復等。
2、數據獲取質量問題主要包括采集點不正確、取數時點不正確以及接口數據在獲取過程中失真。如,編碼轉換處理錯誤以及精度不夠,導致指標統計結果不一致、數據無效等。
3、數據傳遞質量問題主要包括接口數據及時率低,接口數據漏傳,網絡傳輸過程不可靠,如包丟失,文件傳輸方式錯誤,傳輸技術問題,協議使用不當導致的數據不完整等。
4、數據裝載質量問題主要包括數據清洗算法、數據轉換算法、數據加載算法錯誤。
5、數據使用質量問題主要包括展示工具使用錯誤、展示方式不合理和展示周期不合理。
6、數據維護質量問題主要包括數據備份/恢復錯誤、數據的存儲能力有限、維護過程缺乏驗證機制和人為后臺調整數據。

流程問題域


流程類問題是指由于系統作業流程和人工操作流程設置不當造成的數據質量問題,主要來源于主題分析數據的創建流程、傳遞流程、裝載流程、使用流程、維護流程和稽核流程等各環節:

1、創建流程質量問題主要指操作員數據錄入時缺乏審核流程;
2、傳遞流程質量問題主要指通信流程溝通不暢;
3、裝載流程質量問題主要指清洗流程缺乏/不當、調度流程邏輯錯誤、數據加載流程邏輯錯誤及數據轉換流程邏輯錯誤;
4、使用流程質量問題主要指數據使用流程缺乏流程管理;
5、維護流程質量問題主要指缺乏變更維護流程、缺乏錯誤數據維護流程、缺乏數據測試流程以及對人工后臺調整數據沒有嚴格的流程監控;
6、稽核流程質量問題主要指缺乏數據錯誤反饋流程。

管理問題域


管理類問題是指由于人員素質及管理機制方面的原因造成的數據質量問題,如人員管理、培訓和獎勵等方面的措施不當導致的管理缺失。

人員管理所產生的質量問題主要指:
(1)針對數據質量問題,沒有建立管理數據質量的專門機構,出現數據質量問題后無專人負責;
(2)沒有明確的數據質量目標;
(3)主題分析數據的數據質量問題的優先級不夠;
(4)企業缺少管理數據質量的管理辦法等;

人員培訓所產生的質量問題主要指對數據質量相關人員缺少長期培訓計劃。
上述數據質量問題的影響因素分析,從側面展示了企業數據一次性達標的困難程度;也反映出關注數據質量的重要性、以及數據質量工作的零散和瑣碎的特點。信息、流程和技術三個方面的數據質量問題相對來說,比較容易控制,有可能通過引入數據質量管理體系和數據質量管理系統得到改善;對于管理類的數據質量問題,往往與企業對數據的理解和支持程度緊密相關,需要從數據規劃、數據治理的組織與職責、數據規范的制度和流程方面下功夫。
(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢