日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

數據治理與數據質量的關系

時間:2018-11-29來源:知乎瀏覽數:1749

單純從數據層面來看,數據體系包括治理、管理和應用三個部分。治理是負責解決人與人之間的事,管理負責各個職能領域,應用則是價值的實現。不討論基礎層,iaas層,只討論數據視角的事情。


數據管理里面數據質量dq是人與人矛盾分歧最大的職能域,所以也配置全套的數據治理手段。細節不多談,這方面理論和實踐都比較成熟,但效果差強人意。現在討論大數據,應該和場景關聯起來;同樣數據質量和業務需求和技術方案密切相關。數據質量管理開展的驅動因素比較復雜,銀行里面里面的驅動因素第一是監管,第二是內部的數據治/管理(比如標準),第三才是數據應用


舉個典型案例,比如同一業務指標在不同系統間的結果不一致。這個分析起來要看從業務定義開始,到數據采集、加工處理、應用各個環節;影響范圍也會比較廣,比如對監管、對決策;從數據體系職能域看呢,又會和數據治理、數據標準、數據架構有關聯。


從數據生產者、使用者的角度都存在潛在的問題,流程、標準不一致也是導致問題的原因,所以數據質量的討論往往比較復雜瑣碎。有個簡化的思路就是quality = fitness for purpose,是否有問題,關鍵看是誰的什么purpose。大數據背景下補充兩個dq屬性,一個是可鏈接性,內外部數據的關聯整合;另一個是真實性,這是傳統dq未曾參與或者說積極回避的事情。真實性實在是難啊,直接就可以成為i數據挖掘、人工智能的應用案例;相比之下關聯整合現在做的還比較多。現在更愿意采用fitness for purpose也是短期效益迫使的緣故,數據質量的長期效益往往難以實現、也難以證明。


數據質量是綜合表現,原因錯綜復雜。數據治理是王婆娘的裹腳布,也是政治斗爭的絞肉機。治理與管理都存在矛盾,跟別說與應用之間的關系了。傳說國外企業的CDO往往三年就要更換東家,也就很容易理解了。


歸根結底都要落到人的因素上,數據的管理與應用是客戶因素占比大,還是主管因素占比大呢?我想大家心里都有譜,所以試圖依賴技術手段解決管理問題終歸都會失效。


回到開頭的問題,治理、管理都是細膩的事情,需要工匠化反復錘煉,還有長期不受重視的困惑,這些都對從業者是巨大的挑戰。對我個人來言,我更愿意去在大數據實踐中討論治理、管理與應用的融合,換句話說就是價值導向驅動數據體系的運轉。這樣的視角下,可以研究的問題就會很多,并且目標會更精準一下。相比原來試圖從底層解決治理、管理問題的思路要務實一些。另外就是可以持續探索新技術了,人工智能、區塊鏈都是目光所及范圍之內的內容。



(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢