數據質量通常表現為一組具體的流程和技術,用于識別和修正數據中的錯誤以支持業務運行及決策支持。在銀行實際中數據質量管理的應用場景主要包括
數據分析挖掘、
數據標準化管理、系統建設以及系統運維(圖1)等。基于上述四個典型的應用場景,本文重點討論數據質量管理的流程方法,從需求管理和日常機制兩個維度討論數據質量處理標準過程,數據需求對應信息系統建設以及能夠轉化為項目形式的
數據應用需求,日常機制對應數據質量問題的常規處理機制。

圖1 數據質量需求來源
數據需求是信息系統建設需求管理的重要部分,無論是業務角度還是技術角度,數據質量需求都是數據需求中的必備要求。數據質量需求主要有兩個來源,分別對應于業務發展和數據管理的原因,前者對應數據應用角度的要求,后者對應企業數據管理目標。業務需求包括常規的系統改造或建設需求,以及數據服務、數據分析、數據挖掘等數據應用性需求。數據需求中應該包括數據質量規則方面的要求,數據需求來源于信息系統常規性需求,以及數據應用相關的需求。
數據質量問題是指數據不滿足業務運行、管理與決策的程度,其衡量標準包括了多方面的含義。清晰的定義必然包括多個基本屬性,或者說元數據單元。數據質量需求涉及范圍和影響程度不一,較小的需求以單系統數據項修改為代表,處理方式簡單直接;較大的需求以跨系統數據不一致為代表,剖析根源甚至包括業務規則的調整。數據質量需求對應的問題及原因在數據生命周期中會包括定義、產生、加工、整合、應用等過程,覆蓋源系統、
數據倉庫、
數據集市。
(部分內容來源網絡,如有侵權請聯系刪除)