我國正處于工業社會向信息社會的加速轉型期,信息科技的發展為政府數據治理提供了較為成熟的環境。像政府部門和機構會涉及到各業務系統的管理以及滿足公眾服務的人口、法人的數據整合,在數據抽取、清洗、存儲和提供服務等各個環節會遇到很多難點,構建一個體系化的數據治理平臺勢在必行。更重要的是政府掌握全社會重要核心的、高價值的數據,如何通過有效管理,進行共享開放與協同,釋放背后價值,賦能管理、服務決策,推動治理能力的提升對于我們國家至關重要。
政府部門該如何進行數據治理
一、 需求調研
由于管理與技術差異化較強,不同政府部門建安全建設不一。需要進行需求調研,主要從管理、業務、技術,三個方面進行,管理與技術主要從現有體系下,如何體現數據安全內容,在數據生命周期下如何進行決策管理及技術支撐。
二、制定數據治理策略
針對需求調研和個性化要求,形成整體的規劃設計,該設計需要從管理、技術、運維、標準等方面入手,既要有全面性、深入性,又要有一定靈活性以便后期擴展。在數據治理主席和專家的指導下,基于對業務數據的理解之上,由治理委員會維護,來把控其所有權和控制權,確定角色分工和管理范圍并形成從上而下統一的數據治理認知。最后,達成政府和企業機構的業務目標,從而支撐數據管理,促進數據的應用和服務。
三、建立數據模型
數據建模是數據治理的重要工作,也是數據倉庫項目能取得成功的關鍵。但政府大數據主要是將政務管理和服務過程中的數據進行匯聚,傳統意義上的數據建模在這個領域的作用并不是特別明顯。在這種情況下,對信息的分類更加重要,可以借鑒標簽化手段,將表、字段、文件等打標簽,通過標簽讓數據使用者可以便捷地檢索數據。
四、數據治理實施
依據規劃設計進行治理實施。數據安全治理實施可分為5個階段。
1、數據清洗融合。數據清洗是政府大數據相關標準中經常提到的一個概念,但在實踐當中,能經常用到的清洗也就是去重、去空等,更加偏業務化的清洗規則難以應用。因此,在實踐當中,更加可行的是應用“一數一源”原則,將個別問題數據利用主數據的思想進行補正,服務上層的數據分析和應用。比如,基于人的身份證號,實現戶籍、婚姻、社保等的打通,為政務服務提供數據支撐。在這個原則下,數據清洗融合的能力,就是從政務數據中提煉出來的數據標準的豐富程度,能在多大程度上界定出“一數一源”。
2、數據挖掘。通過機器學習算法,實現數據治理過程的智能化,也是數據治理成果的一個亮點,包括自動標簽、自動清洗融合等,在這個過程中,可以沉淀出不少的算法、規則等。
3、數據可視化。主要為加強數據流動可視,實現數據訪問、敏感數據訪問等數據流向可視,其主要目的為項目快速呈現價值,便于后期項目容易推進。
4、數據可管控。通過流向可視化后,需要加強數據管控能力,通過數據可視化發現問題后,需要通過及時、直接的管控手段實現快速介入,所以第二階段重點為數據管控能力的提升。
5、數據安全體系化。該階段需要根據前期實施過程中所遇見的問題,不斷完善標準體系,實現技術、運維、標準的融合,達到安全治理體系化效果,實現“表里如一”。
政府想要構建符合自身業務情況的數據治理體系,那么一個成熟的數據治理平臺是必不可少的。睿治智能數據治理平臺由億信華辰自主研發,是一款融合數據治理十大產品模塊,覆蓋數據全生命周期管理的應用平臺,也是目前國內功能齊全的數據治理工具,助力數據標準落地,提升數據質量,實現數據資產融合,快速滿足政府各類不同的數據治理場景。