數(shù)據(jù)是組織最具價(jià)值的資產(chǎn)之一。企業(yè)的數(shù)據(jù)質(zhì)量與業(yè)務(wù)績(jī)效之間存在著直接聯(lián)系,高質(zhì)量的數(shù)據(jù)可以使公司保持競(jìng)爭(zhēng)力并在經(jīng)濟(jì)動(dòng)蕩時(shí)期立于不敗之地。有了普遍深入的數(shù)據(jù)質(zhì)量,企業(yè)在任何時(shí)候都可以信任滿(mǎn)足所有需求的所有數(shù)據(jù)。
一、什么是數(shù)據(jù)質(zhì)量
數(shù)據(jù)質(zhì)量是一個(gè)評(píng)估規(guī)則維度提供一種測(cè)量與管理信息和數(shù)據(jù)的方式。區(qū)分規(guī)則維度有助于:
1)了解從每一維度的評(píng)估中能夠/不能夠得到什么;
2)在時(shí)間和資源有限的情況下,更好地定義和管理項(xiàng)目計(jì)劃中的行動(dòng)順序;
3)將維度與業(yè)務(wù)需求相匹配,并且劃分評(píng)估的先后順序。
數(shù)據(jù)的質(zhì)量直接影響著數(shù)據(jù)的價(jià)值,并且直接影響著數(shù)據(jù)分析的結(jié)果以及我們以此做出的決策的質(zhì)量。質(zhì)量不高的數(shù)據(jù)不僅僅是數(shù)據(jù)本身的問(wèn)題,還會(huì)影響著企業(yè)經(jīng)營(yíng)管理決策;錯(cuò)誤的數(shù)據(jù)還不如沒(méi)有數(shù)據(jù),因?yàn)闆](méi)有數(shù)據(jù)時(shí),我們還會(huì)基于經(jīng)驗(yàn)和基于常識(shí)的判斷來(lái)做出不見(jiàn)得是錯(cuò)誤的決策,而錯(cuò)誤的數(shù)據(jù)會(huì)引導(dǎo)我們做出錯(cuò)誤的決策。因此數(shù)據(jù)質(zhì)量是企業(yè)經(jīng)營(yíng)管理
數(shù)據(jù)治理的關(guān)鍵所在。
二、數(shù)據(jù)質(zhì)量檢核維度
數(shù)據(jù)的質(zhì)量可以從八個(gè)方面進(jìn)行衡量,每個(gè)維度都從一個(gè)側(cè)面來(lái)反映數(shù)據(jù)的品相。八個(gè)維度分別是:真實(shí)性、準(zhǔn)確性、全面性、完整性、即時(shí)性、及時(shí)性、關(guān)聯(lián)性和精確性。
數(shù)據(jù)的真實(shí)性
即數(shù)據(jù)的正確性。數(shù)據(jù)的正確性取決于數(shù)據(jù)采集過(guò)程的可控程度,可控程度高,可追溯情況好,數(shù)據(jù)的真實(shí)性容易得到保障,而可控程度低或者無(wú)法追溯,數(shù)據(jù)造假后無(wú)法追溯,則真實(shí)性難以保證。
數(shù)據(jù)的準(zhǔn)確性
指數(shù)據(jù)采集值或者觀測(cè)值和真實(shí)值之間的接近程度,也叫做誤差值,誤差越大,準(zhǔn)確度越低。數(shù)據(jù)的準(zhǔn)確性由數(shù)據(jù)的采集方法決定的。
數(shù)據(jù)的全面性
全面性指的是數(shù)據(jù)采集點(diǎn)的遺漏情況。比如說(shuō),我們要采集員工行為數(shù)據(jù),我們只采集了員工上班打卡和下班打卡的數(shù)據(jù),上班時(shí)間的員工行為數(shù)據(jù)并未采集,或者沒(méi)有找到合適的方法來(lái)采集。那么,這個(gè)數(shù)據(jù)集就是不全面的。
數(shù)據(jù)的完整性
數(shù)據(jù)的完整性是從數(shù)據(jù)采集到的程度來(lái)衡量的,是應(yīng)采集和實(shí)際采集到數(shù)據(jù)之間的比例。一條信息采集12個(gè)數(shù)據(jù)點(diǎn),如我們采集員工信息數(shù)據(jù)的時(shí)候,要求填寫(xiě)姓名、出生日期、性別、民族、籍貫、身高、血型、婚姻狀況、最高學(xué)歷、最高學(xué)歷專(zhuān)業(yè)、最高學(xué)歷畢業(yè)院校、最高學(xué)歷畢業(yè)時(shí)間等12項(xiàng)信息,而某一員工僅僅填寫(xiě)了部分信息,如只填寫(xiě)了其中的5項(xiàng),則該員工所填寫(xiě)數(shù)據(jù)的完整性只有一半。
數(shù)據(jù)的即時(shí)性
指數(shù)據(jù)采集時(shí)間節(jié)點(diǎn)和數(shù)據(jù)傳輸?shù)臅r(shí)間節(jié)點(diǎn),一個(gè)數(shù)據(jù)在數(shù)據(jù)源頭采集后立即存儲(chǔ),并立即加工呈現(xiàn),就是即時(shí)數(shù)據(jù),而經(jīng)過(guò)一段時(shí)間之后再傳輸?shù)叫畔⑾到y(tǒng)中,則數(shù)據(jù)即時(shí)性就稍差。
數(shù)據(jù)的及時(shí)性
即數(shù)據(jù)能否在需要的時(shí)候得到保證。數(shù)據(jù)的及時(shí)性是我們數(shù)據(jù)分析和挖掘及時(shí)性的保障。如果公司的財(cái)務(wù)核算復(fù)雜,核算速度緩慢,上個(gè)月的數(shù)據(jù)在月中才能統(tǒng)計(jì)匯總完成,等需要調(diào)整財(cái)務(wù)策略的時(shí)候,已經(jīng)到了月底了,一個(gè)月已經(jīng)快過(guò)完了。特別是大企業(yè),業(yè)務(wù)覆蓋多個(gè)市場(chǎng)、多個(gè)國(guó)家,數(shù)據(jù)不能及時(shí)匯總,會(huì)影響到高層決策的及時(shí)程度。
數(shù)據(jù)的關(guān)聯(lián)性
指各個(gè)數(shù)據(jù)集之間的關(guān)聯(lián)關(guān)系。比如員工工資數(shù)據(jù)和員工績(jī)效考核數(shù)據(jù)是通過(guò)員工這個(gè)資源關(guān)聯(lián)在一起來(lái)的,而且績(jī)效數(shù)據(jù)直接關(guān)系到工資的多少。采購(gòu)訂單數(shù)據(jù)與生產(chǎn)訂單數(shù)據(jù)之間通過(guò)物料的追溯機(jī)制進(jìn)行關(guān)聯(lián),而生產(chǎn)訂單又是由員工完成的,即通過(guò)員工作業(yè)數(shù)據(jù)與員工信息數(shù)據(jù)關(guān)聯(lián)起來(lái)。
數(shù)據(jù)的精確性
指對(duì)同一對(duì)象的觀測(cè)數(shù)據(jù)在重復(fù)測(cè)量時(shí)所得到不同數(shù)據(jù)間的接近程度。精確性,也可以叫精準(zhǔn)性。精確性與我們數(shù)據(jù)采集的精度有關(guān)系。精度高,要求數(shù)據(jù)采集的粒度越細(xì),誤差的容忍程度越低。
三、數(shù)據(jù)質(zhì)量治理工具
億信華辰EsDataClean數(shù)據(jù)質(zhì)量管理平臺(tái),提供了業(yè)界領(lǐng)先的質(zhì)量規(guī)則管理方法、質(zhì)量評(píng)估方法、零編碼質(zhì)檢規(guī)則、跨數(shù)據(jù)源比對(duì)、質(zhì)量分析報(bào)告、數(shù)據(jù)質(zhì)量整改、質(zhì)量績(jī)效評(píng)估等主要功能,以數(shù)據(jù)標(biāo)準(zhǔn)為數(shù)據(jù)檢核依據(jù),以元數(shù)據(jù)為數(shù)據(jù)檢核對(duì)象,通過(guò)向?qū)Щ⒖梢暬群?jiǎn)易操作手段,將質(zhì)量評(píng)估、質(zhì)量檢核、質(zhì)量整改與質(zhì)量報(bào)告等工作環(huán)節(jié)進(jìn)行流程整合,形成完整的數(shù)據(jù)質(zhì)量管理閉環(huán)。
點(diǎn)擊查看更多關(guān)于數(shù)據(jù)治理的文章:
數(shù)據(jù)交換的定義和作用
數(shù)據(jù)安全分類(lèi)分級(jí)方法
如何做好數(shù)據(jù)安全保護(hù)