數據資產的用戶場景可以概況為兩類,找數據和管數據。找數據主要是
數據分析、產品運營等數據消費者,基于數倉加工好的數據進行分析、應用。找數據時,主要的痛點如下:
1)數據找不到
數據生產者和消費者會存在業務上的天然屏障。對于很多一線的業務同學并不能第一時間數據的輸出。例如,一個新入職的產品要做產品首頁的改版,想先分析下目前頁面各個流量入口的點擊與轉化情況,只能去問其他的PM或者去找數據同學,流量數據是哪個數據表,事件埋點規則又在哪里?
2)數據不敢用
數據處理邏輯不清楚,業務找到了訂單數據在XX表中,但是對訂單狀態的枚舉值含義不清楚,或者不知道營收的數據計算口徑,不敢用,只能咨詢表的負責人。
數據質量問題,搞數據的人都知道數據質量是數據團隊的生命線,但是卻又是無法避免的老大難問題,故障出得多了,用戶拿到數據的第一反應是先和數據人員確認下,今天數據沒問題吧。
管數據,主要是數據開發者,他們的目標是讓自己生產的數據可以更安全地被更多人復用,在實踐過程中,面臨的問題主要是以下幾種。
1)用戶咨詢多
用戶用數據找不到或者找到了數據不敢用,就只能向數據負責人進行咨詢,不同人的相同問題,或者不同問題。每天處理用戶問題可能就要花個幾個小時。
2)數據復用低
數據中臺建設要解決的也是數據復用問題,對于數據工作者經常遇到做好了數據模型使用者寥寥無幾的問題,有酒香但巷子深無人知曉的因素,也有部門墻、數據安全限制因素。
3)價值感知弱
數據開發者做了很多的數據模型,但不知道有多少人在使用,用到了哪里,產生了多少業務價值。數倉開發不生產數據,只是數據的搬運工,“工具人”的感受強烈。
4)問題排查路徑長
用戶反饋數據異常時,需要翻代碼,對數據加工鏈路進行追根溯源,排查路徑長,消耗時間久。
5)工作評估難
作為數據管理者,對于資產最關心的莫過于建設的怎么樣,如何評估數據工作的成果。做了很多的數據模型,績效就應該好嗎?
(部分內容來源網絡,如有侵權請聯系刪除)