日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

首頁 行業百科 數據質量有幾種維度?分別是什么?

數據質量有幾種維度?分別是什么?

|億信華辰大數據知識庫2022-04-28

數據質量有幾種維度?分別是什么?

億信華辰數據質量管理平臺以數據標準為數據檢核依據,以元數據為數據檢核對象,通過向導化、可視化等簡易操作手段,將質量評估、質量檢核、質量整改與質量報告等工作環節進行流程整合,形成完整的數據質量管理閉環。

一、什么是數據質量
數據質量是一個評估規則維度提供一種測量與管理信息和數據的方式。區分規則維度有助于:
1)了解從每一維度的評估中能夠/不能夠得到什么;
2)在時間和資源有限的情況下,更好地定義和管理項目計劃中的行動順序;
3)將維度與業務需求相匹配,并且劃分評估的先后順序。
二、數據質量檢核維度
1、數據唯一性
用來描述數據是否存在重復記錄,沒有實體多余出現一次。
唯一性約束:描述同一客觀實體在不同業務數據集中的信息,經整合后是唯一的,針對目標通常是單一主鍵或聯合主鍵,如證件類型+證件號碼+姓名相同,則其客戶編號應唯一。
2、數據完整性
用來描述信息的完整程度。
非空約束:描述檢核對象是否存在數據值為空的情況。如客戶開戶時,客戶名稱是必填項,不能出現為空的情況。
3、數據一致性
用來描述同一信息主體在不同的數據集中信息屬性是否相同,各實體、屬性是否符合一致性約束關系。
1)存在一致性依賴約束:描述檢核對象之間數據值存在關系的約束規則。一個檢核對象的數據值必須在另一個檢核對象滿足某一條件時存在。
2)等值一致性依賴約束:描述檢核對象之間數據取值的約束規則。一個檢核對象數據取值必須與另一個或多個檢核對象在一定規則下相等。
3)邏輯一致性依賴約束:描述檢核對象之間數據值邏輯關系的約束規則。一個檢核對象上的數據值必須與另一個檢核對象的數據值滿足某種邏輯關系(如大于、小于等)。
4)存在一致性依賴約束:主要是強調業務的關聯性,一個狀態發生了則某個值一定會如何。例如:投保狀態為已投保,則投保日期不應為空;
4、數據有效性
用來描述模型或數據是否滿足用戶定義的條件。通常從命名、數據類型、長度、值域、取值范圍、內容規范等方面進行約束。
1)長度約束:描述檢核對象的長度是否滿足長度約束。如“金融機構編碼”在《人民銀行金融機構編碼規范》中規定長度為14位,如果出現非14位的值,則判定為不滿足長度約束,不是一個有效的“金融機構編碼”;
2)取值范圍約束:描述檢核對象的取值是否在預定義的范圍內。如“授信額度”取值范圍應大于等于 0,如果出現小于 0 的情況,則超出了取值范圍的約束,不是一個有效的“授信額度”;
3)內容規范約束:描述檢核對象的值是否按照一定的要求和規范進行數據的錄入與存儲。如“存款賬號”應僅含數字,如果出現字母或其他非法字符,則不是一個有效的“存款賬號”,不滿足內容規范約束。
5、數據及時性
用來描述從業務發生到對應數據正確存儲并可正常查看的時間間隔程度,也叫數據的延時時長,數據在及時性上應能盡可能貼合業務實際發生時點。例如:系統中貸款五級分類的分類比實際中的延遲幾天變化。
6、數據準確性
數據準確性主要是指取值的準確性,描述該檢核對象是否與其對應的客觀實體的特征相一致。例如:投保人的性別代碼為 0-女性,雖然滿足代碼值域約束,但卻不滿足取值準確性約束,因為該人為男性,其性別代碼應為 1-男性。
7、數據可信性
用來描述數據發生是否符合客觀規律。
數據可信性約束:描述再數據同步中每日/月增量數據是否符合理論的經驗值。例如,保單數據的每日分區數據較前日一般有 10% 增長,突然數據增長變為200%,這種情況有可能時數據同步出現問題。

三、數據質量管理工具
億信數據質量管理平臺以數據標準為數據檢核依據,以元數據為數據檢核對象,通過向導化、可視化等簡易操作手段,將質量評估、質量檢核、質量整改與質量報告等工作環節進行流程整合,形成完整的數據質量管理閉環。
認為本內容有幫助
0
您可能需要的數據產品
億信華辰助力政企數字化轉型
customer

在線咨詢

在線咨詢

點擊進入在線咨詢