基于數據決策的前提是數據可靠且相關,數據必須是“真實可信的”,否則“輸出將是誤導和無效的”。但是學校所收集的數據可能不完全,或者更新不及時。不完全的數據,特別是不準確的數據,可能會帶來更危險的決策。但是,所收集的數據來源多樣,種類豐富,也很容易出現同一個數據(比如一所高校的在校生人數) 從不同的部門得到的數值不一樣的情況。IBM 認為,高質量的數據具有以下四個特征:

完整性(Completeness): 要從所有可能的來源中關聯相關的數據。
準確性(Accuracy): 數據必須是正確的、一致的,沒有輸入錯誤。
可用性(Availability): 數據必須在需要時可以獲得。
時效性(Timeliness): 當下的數據必須可以獲得。
為了提高數據的質量,可能需要多管齊下。
首先要制訂
數據治理政策,其次要開發和部署專門的工具來簡化數據收集過程。美國的大多數高校會選擇
數據質量工具通過數據清理、匹配、監控和其他方式, 讓質量保證過程自動化。
2013年圣母大學(University of Notre Dame)建立了
商業智能(business intelligence)項目dataND ,經過摸索,發現制訂數據治理政策非常有必要,即要定義數據是什么,如何使用這些數據,誰應該有權訪問這些數據。其經驗總結如下:
1.如何統一數據定義:雇傭了一個數據治理管家(a campus data steward)在部門之間協調,建立關于數據的共識。
2.如何確定誰能訪問什么數據:正確的問題不是這個業務是否需要這個數據,而是獲取這個數據是否會給大學帶來風險,因為數據治理的目的是為了支持更廣泛地使用數據,為了避免使用數據帶來的風險,要加強對能夠獲得數據的人進行培訓。當數據可能對大學造成重大傷害時,要有嚴格的限制。
2013年圣母大學(University of Notre Dame)建立了商業智能(business intelligence)項目dataND ,經過摸索,發現制訂數據治理政策非常有必要,即要定義數據是什么,如何使用這些數據,誰應該有權訪問這些數據。其經驗總結如下:
1.如何統一數據定義:雇傭了一個數據治理管家(a campus data steward)在部門之間協調,建立關于數據的共識。
2.如何確定誰能訪問什么數據:正確的問題不是這個業務是否需要這個數據,而是獲取這個數據是否會給大學帶來風險,因為數據治理的目的是為了支持更廣泛地使用數據,為了避免使用數據帶來的風險,要加強對能夠獲得數據的人進行培訓。當數據可能對大學造成重大傷害時,要有嚴格的限制。
(部分內容來源網絡,如有侵權請聯系刪除)