- 產品
- 產品解決方案
- 行業(yè)解決方案
- 案例
- 數(shù)據(jù)資產入表
- 賦能中心
- 伙伴
- 關于
-
數(shù)據(jù)治理
-
醫(yī)療衛(wèi)生
制造
-
億信動態(tài)
時間:2019-02-21來源:知乎瀏覽數(shù):967次
伴隨外部監(jiān)管要求逐步提高以及市場競爭環(huán)境的日益激勵,銀行對于數(shù)據(jù)價值的重視提升到了前所未有的高度,數(shù)據(jù)對于銀行來說已經成為一項重要的資產。銀行業(yè)務重點變化、金融業(yè)務聯(lián)動甚至企業(yè)合作都對數(shù)據(jù)管理提出了更高的要求,尤其是整合多種數(shù)據(jù)源、創(chuàng)建一致的數(shù)據(jù)副本,以及提供靈活的數(shù)據(jù)查詢需求。在這些要求中,數(shù)據(jù)質量因素對于企業(yè)數(shù)據(jù)應用有著至關重要的影響,無論是橫向的數(shù)據(jù)相關運營活動,還是縱向深入的數(shù)據(jù)分析挖掘實現(xiàn)。數(shù)據(jù)質量管理是企業(yè)數(shù)據(jù)管理中的一項關鍵內容,與數(shù)據(jù)治理、數(shù)據(jù)標準、元數(shù)據(jù)、主數(shù)據(jù)等管理職能相互交叉,并且是數(shù)據(jù)服務、數(shù)據(jù)分析、數(shù)據(jù)挖掘等活動的必備支持條件。
除支持基礎業(yè)務運營及日常經營決策之外,近年來大數(shù)據(jù)實踐應用對于企業(yè)的重要性逐步提高。大數(shù)據(jù)價值實現(xiàn)流程中會重點面臨兩個不確定性問題,首先是如何量化數(shù)據(jù),數(shù)據(jù)化即一切皆可“量化”,如溝通變成數(shù)據(jù),文字變成數(shù)據(jù),方位變成數(shù)據(jù)等;其次,伴隨的數(shù)據(jù)標準、數(shù)據(jù)架構問題,以及更長的數(shù)據(jù)生命周期對應著更多的人為決策因素。不確定的人為因素反映在數(shù)據(jù)的選擇、加工、處理,模型及參數(shù)的設計和選擇,分析挖掘結果的解讀和應用,這些也是數(shù)據(jù)質量管理需要考慮的問題。

數(shù)據(jù)需求是信息系統(tǒng)建設需求管理的重要部分,無論是業(yè)務角度還是技術角度,數(shù)據(jù)質量需求都是數(shù)據(jù)需求中的必備要求。數(shù)據(jù)質量需求主要有兩個來源,分別對應于業(yè)務發(fā)展和數(shù)據(jù)管理的原因,前者對應數(shù)據(jù)應用角度的要求,后者對應企業(yè)數(shù)據(jù)管理目標。業(yè)務需求包括常規(guī)的系統(tǒng)改造或建設需求,以及數(shù)據(jù)服務、數(shù)據(jù)分析、數(shù)據(jù)挖掘等數(shù)據(jù)應用性需求。數(shù)據(jù)需求中應該包括數(shù)據(jù)質量規(guī)則方面的要求,數(shù)據(jù)需求來源于信息系統(tǒng)常規(guī)性需求,以及數(shù)據(jù)應用相關的需求。
數(shù)據(jù)質量問題是指數(shù)據(jù)不滿足業(yè)務運行、管理與決策的程度,其衡量標準包括了多方面的含義。清晰的定義必然包括多個基本屬性,或者說元數(shù)據(jù)單元。數(shù)據(jù)質量需求涉及范圍和影響程度不一,較小的需求以單系統(tǒng)數(shù)據(jù)項修改為代表,處理方式簡單直接;較大的需求以跨系統(tǒng)數(shù)據(jù)不一致為代表,剖析根源甚至包括業(yè)務規(guī)則的調整。數(shù)據(jù)質量需求對應的問題及原因在數(shù)據(jù)生命周期中會包括定義、產生、加工、整合、應用等過程,覆蓋源系統(tǒng)、數(shù)據(jù)倉庫、數(shù)據(jù)集市。
分解管理框架中的各項活動,首先是根據(jù)企業(yè)數(shù)據(jù)標準制定數(shù)據(jù)質量校驗的業(yè)務和技術規(guī)則,以及對應的數(shù)據(jù)質量問題發(fā)現(xiàn)及管理;然后按照數(shù)據(jù)質量維度對抽樣或全局數(shù)據(jù)進行剖析,并結合評估驗證進行數(shù)據(jù)清理;最后通過數(shù)據(jù)質量持續(xù)監(jiān)控,以數(shù)據(jù)質量報告的形式匯報并反映數(shù)據(jù)質量的狀況及問題。數(shù)據(jù)全過程質量管理框架以改進數(shù)據(jù)質量為目標,確保數(shù)據(jù)的準確、完整、一致和及時性。通過制定數(shù)據(jù)質量關鍵性能指標或積分卡,評估數(shù)據(jù)質量的改善情況,并形成常態(tài)化數(shù)據(jù)質量管理閉環(huán)機制,以凸顯數(shù)據(jù)質量管理的長效機制。
4.數(shù)據(jù)質量剖析方法
企業(yè)數(shù)據(jù)質量的剖析方法主要包括三種,具體為字段剖析、記錄剖析和表間剖析,通常能夠覆蓋所有的數(shù)據(jù)資產。實際管理中數(shù)據(jù)質量剖析用于判斷質量情況,為后續(xù)的數(shù)據(jù)質量驗證及數(shù)據(jù)質量清理提供依據(jù),并且數(shù)據(jù)質量監(jiān)控規(guī)則的制定提供技術口徑。
數(shù)據(jù)質量管理活動保障數(shù)據(jù)價值變現(xiàn),覆蓋整個數(shù)據(jù)生命周期,其綜合性和復雜性決定了對管理人員和方法的高標準要求。數(shù)據(jù)質量管理人員需要了解業(yè)務知識,還要懂得技術架構,是典型的綜合型人才。與之伴隨對管理人員的溝通協(xié)調能力要求也很高,數(shù)據(jù)質量管理覆蓋整個數(shù)據(jù)生命周期的價值實現(xiàn),相關人員及工作任務的影響廣度和溝通深度都是數(shù)據(jù)管理各職能活動中的典型。
五、信息質量管理趨勢
關注數(shù)據(jù)質量的同時,還要進一步關注覆蓋范圍更加廣泛、涉及層面更加深入的信息質量,這也是數(shù)據(jù)管理需要思考的問題。蘇聯(lián)數(shù)學家Kolmogorov對信息的定義是:“信息是在給內數(shù)據(jù)集內的對客觀事物的語義描述”。進一步信息又可分為物理信息和語義信息兩類,其中物理層面的信息反映基礎的數(shù)據(jù)結構;語義信息屬于進階有含義的語義數(shù)據(jù)結構,反映人類的視角。
目前數(shù)據(jù)質量管理方法中對于語義信息的關注較少,更多的是關注常規(guī)物理信息,以及可以轉化為物理信息的語義信息,其原因在于信息質量更為復雜。錯誤的數(shù)據(jù)能導致錯誤的信息,物理信息容易度量,語義信息相對較難用簡單的規(guī)則度量。在一個數(shù)據(jù)挖掘應用中,錯誤的語義信息會來源于知識發(fā)現(xiàn)過程中的數(shù)據(jù)集選擇、模型選擇、參數(shù)選擇、驗證方式選擇,基本上所有的過程都需要加入人為的理解因素。從傳統(tǒng)軟件開發(fā)質量保障角度,也需要對語義相關的信息質量進行考慮,確保數(shù)據(jù)價值的不被曲解或者損失。在移動計算、物聯(lián)網、大數(shù)據(jù)等新理念趨勢下,信息質量面臨的問題更加值得關注。
從整體數(shù)據(jù)管理角度來看,語義信息的質量保障依賴于整體數(shù)據(jù)管理水平,數(shù)據(jù)治理、元數(shù)據(jù)、數(shù)據(jù)標準等活動都會發(fā)揮作用。數(shù)據(jù)治理定義數(shù)據(jù)質量相關角色、職責,元數(shù)據(jù)、數(shù)據(jù)標準為一致性的語義理解提供參考作用。近年來軟件即服務(SaaS)和云計算應用(Cloud-Based)趨勢日益明顯,信息技術新趨勢的影響也促使數(shù)據(jù)質量管理從獨立的閉環(huán)機制拓展到完整的宏觀數(shù)據(jù)質量管理體系。銀監(jiān)會于2011年發(fā)布銀行監(jiān)管統(tǒng)計數(shù)據(jù)質量管理良好標準,該標準以數(shù)據(jù)質量為目標涵蓋組織、制度、系統(tǒng)和流程建設,是銀行開展全面數(shù)據(jù)質量管理的有益參考。
在線咨詢
點擊進入在線咨詢