本部分的內容將
數據治理面臨的挑戰分為兩類,一類因“技術”而起,一類因“人”而起。由客觀的技術問題對數據治理帶來的挑戰普遍較好解決,比如如何采集數據、如何存儲數據等,都可通過更先進的工具、更新的技術等方式解決。而由人或組織架構帶來的問題相對復雜,它的背后包含的是企業在文化、流程上的問題,可以通過以下實例說明。

1. 多業務系統多數據源的整合挑戰
企業想要做的
數據應用越多,所需的數據就會越多,所要去獲取的數據源也會增多,而相應的數據處理也會越多,這是一個極為顯而易見的問題。我們在數據應用方面相對“單純”,主要針對用戶行為領域,采集用戶行為數據,從客戶端、服務端、數據庫等做對接。但即使是這樣一個限定特殊領域的應用,我們在整合多方面數據源上也會碰到非常多的挑戰,可想而知在面對多業務系統多數據源的情況下將更加困難。
2.
數據采集技術上的挑戰
近年來,許多公司都在嘗試將自己的業務線上化,都需要通過數據對用戶進行分析與運營,如何精準采集可用的用戶數據以及其他相關數據,都將是數據采集在技術層面上面臨的挑戰。
3. 用戶隱私與安全挑戰
用戶隱私與安全不僅是對技術挑戰,更多的是一種意識上的挑戰。企業需要準確把控數據采集的紅線,比如針對歐盟范圍內的國際業務,就需要參考 GDPR 的相關規范。
在國內,很多銀行券商等企業也同樣擁有一套完善的數據合規要求,甚至已經細化到“某個特定字段對于某一個特定人可看但不可下載”的程度,這些都是需要在進行數據治理時考慮的因素。另外,如果需要在公網傳輸交換數據,也同樣需要思考數據如何防止竊取和偽造的問題。
4. 組織架構與部門隔閡帶來的配合
部分組織在數據治理的過程中速度過慢,成效不好,其中一個很重要的原因是權責、部門配合等方面存在問題。很多情況下,生產數據、使用數據、分析數據的工作人員分布在不同的職能線與部門,角色不同,立場也不同,這些客觀存在的影響因素都會影響整個數據治理的最終結果。
5.業務持續迭代中帶來的挑戰
在互聯網行業中,尤其是業務迭代較為迅速的團隊里,通常存在“1.0 版本的
數據質量最優,1.1 版本不行,2.0 版本完全不可用”的說法,說明第一次做數據治理時,極重視數據質量,會有完善的流程來保證埋點的準確性,本身也沒有太多的包袱;而在后續的產品迭代中,如果流程和標準的迭代相對滯后,整個數據治理的結果也會隨著受影響,最終導致整個數據質量低劣,直至所謂的“完全不可用”。
(部分內容來源網絡,如有侵權請聯系刪除)