日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

評測一下你的數據質量有問題嗎?

時間:2022-03-04來源:互聯網瀏覽數:332

無論是決策者、領導者、數據科學家還是高管都時常需要快速評估數據,從而判斷某一系列數據的可信度。這些數據可以直接用于分析嗎?是否需要在這些數據的基礎上展望新的方向?雖然管理者們有數不清的問題,但他們都繞不開這么一個基本問題:我的數據質量靠譜嗎?

為了評估數據質量,我想出了一個簡單的辦法,它能幫助每一個人回答上文中的問題。我把這個方法稱為“周五下午測評法”(Friday Afternoon Measurement ,簡稱FAM),它能幫助那些靠數據吃飯的各級員工評測數據。這個方法不僅能幫你輕而易舉地衡量數據質量的等級,深度估測其影響力,還能合成出既定結果。這個方法靈活可變,它對不同的公司、流程和不同系列的數據都同樣適用。

FAM有以下四個步驟:
第一步
收集你的團隊最近使用或創造的100條數據記錄。比如,如果你的團隊收取的是客戶訂單,那就把最近100條訂單收集起來;如果你是做工程制圖的,那就把最近100幅圖繪放在一起。接下來,從這些數據記錄中找出10-15個關鍵數據元素,把它們輸入到一張電子數據表中,或抄在一張大點的紙張上。

第二步
請兩三個懂數據的朋友和你一起花2個小時一起分析下這些記錄。(FAM之所以叫星期五下午測評法就是因為,很多人都把這種碰面安排在周五下午,這個時間段的工作節奏往往會慢下來。)

第三步
仔細篩查每一條記錄,指導你的同事們把每一個顯眼的錯誤都用醒目的顏色(紅色或橙色)標出來。大多數情況下,數據可以被很迅速地檢查一遍,畢竟只會出現兩種情況:1.你的同事們能查出錯誤(如拼錯了客戶的姓名或信息被錯誤分欄等等);2.他們查不出錯誤。而在一些情況下,你們需要進一步仔細討論,從而判斷某些條目是否真的有誤。不過,通常來說,你花在每條記錄上的時間不會超過30秒。

第四步
總結結果。首先,在你的電子表格上畫出“數據是否完美?是□ 否”一欄。如果數據無誤,就畫一個標注為“是”,如果有瑕疵,之前用橙色或紅色標記出來的記錄就標注為“否”。接下來,你需要統計完美數據的總數。

這張“無誤數據統計表”可以作如下解讀:如果在團隊完成的100項記錄中,只有三分之二(即100項數據中有67項是正確的)是對的,那么很顯然,幾乎每個人都會認定,這份數據的表現是很不理想的。

這個結果能證明——你的數據質量有問題。要想知道這會如何影響生意,我們還需再走一步。

不良數據會導致各種各樣的問題——比如這會使人們很難做出好的決策,會使客戶生氣,從而增加成本。不過,所謂的“10倍法則”能助你輕松預估這些成本。這一法則基于這樣一個現象——相較于無誤的數據,如果輸入數據有缺陷,那么人們要想完成一組工作,就要多花10倍成本。舉個簡單的例子,假設你的團隊每天必須要完成100組工作,當數據無誤時,每組工作的成本為1美元。如果所有數據都完美無缺,那么一天的工作成本便是100美元。但是,如果只有67組工作是正確的話:

總成本 = (67 x $1.00) + (33 x $1.00 x 10) = $67 + $330 = $397

正如你所見,總成本要比數據無誤時高了4倍。一想到不良數據質量所導致的巨大差距,絕大多數公司都不能也不該允許這樣的高成本出現?,F在,你已經發現了自己的數據質量問題,也看到了成本與數據質量之間的聯系,想必你現在很希望獲得實際的改進吧!?

電子表格已經指出了數據的錯誤所在,你只需看看這些數據,就能發現哪些問題需要被率先修正。統計一下每一欄中的錯誤,找出兩到三個出錯率最高的“罪魁禍首”,找到它們的根源然后“消滅”掉。在絕大多數情況下,你可以指望當初創造這些數據的人(你的同事或是其他人,取決于你選擇的數據類型)把改進數據當做其日常工作,而無需在此項上額外投資。不過,你能看到錯誤率降低,相關成本也會明顯下降。

每個人都該把提升數據質量視為自己工作的一部分,這項練習能使你輕松改進這一問題。這項評估和改進過程并不是一次性練習,你可以有規律地時常采用FAM來評估自己的數據質量。多在FAM上下功夫,你不僅能甄別出自己的數據質量問題,還能知道該向哪個方向努力,從而更好地修繕問題。
(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢