日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

數據治理研究述評

時間:2019-08-27來源:南京大學信息管理學院瀏覽數:678

數據治理是數據科學時代關注的研究課題,對數據治理的概念、體系、內容和應用的相關研究進行述評,以期將數據治理研究引向深入。[方法/過程]采用文獻調研法,對國內外文獻進行系統脈絡梳理和整體內容述評。[結果/結論]目前研究主要集中在“框架模型的設計冶“價值的探討冶和“不同領域的應用冶等,現有研究存在“實證研究較少冶“數據治理框架模型的設計欠缺優化冶等問題,“框架體系冶“政策標準冶“成熟度模型冶“數據質量冶等仍是未來研究應關注的重點領域,海量異質數據的治理是未來最值得關注的新興研究領域。

數據科學促進了科學研究的新范式,使得數據處理事務、管理的視角、過程和方法都發生了顯著的變化。隨著組織業務的增長,產生了高價值多結構的海量數據集,對傳統的數據管理手段和方法均提出了新的挑戰,增加了組織對數據進行治理的重要性和緊迫 性。

數據治理不僅受到業界的重視,其相關研究也引 起了學界的關注,國外學者 Alhassan、Sammon 和 Da鄄 ly[1]對來自6個學術數據庫(the AISelectronic library、CiteSeerX、 EBSCO、 Emerald、 ScienceDirect and the ACM Digitallibrary)的31篇文章進行內容分析,發現了110個數據治理活動;此外,Soma、Termeer和Op鄄dam[2]在Scopus檢索平臺上分別以“數據治理冶“信息對組織帶來的改變冶為主題選取了39篇文章,對該兩個主題進行雙向的文獻計量比較,總結了未來數據治理研究的核心發展趨勢。相較而言,國內學界雖已有了一些與數據活動有關的述評類文章[3-4],但未見數據治理整體內容的述評。因此,本文擬定對數據治理研究進行系統脈絡梳理和整體內容述評,希望盡可能厘清國內外數據治理的研究內容和存在不足,以期 對開展數據治理的相關研究提供一定的啟示。?

1、數據治理的概念研究?
1.1 數據治理的基礎定義
數據治理是組織中涉及數據使用的一整套管理行為。相關研究機構發布了各種有關數據治理的定義,由于切入視角的不同,一些國外學者從法案遵循的角度提出數據治理是一系列的政策和規則的定義[5],而一些學者強調數據治理是有關組織數據資產的決策制定和職責劃分[6-8],也有諸多學者綜合考慮了數據管理控制活動中的過程、技術和責任等[9-12],認為數據治理是集中人、過程和信息技術的數據管護過程或方法,能夠確保組織數據資產得到合理的使用。因此,Begg和Caira[13]將早期的數據治理定義總結為政策、流程、技術和職責的統一,而后期的定義中更強調角色支持和商業結構。

國內對于數據管理的有關研究活動始于2010年左右,類似的名詞出現有數據監護[14]、數據管理[15]、數據策展[16-17]、數據管護[18-19]等,一直以來,國內在概念界定上都較為模糊,雖然都涉及數據的控制、保護和利用,但與數據治理的核心要義還是有一定的區別,除少數以外[20-21],多數學者在應用時對數據治理的概念均 不加以解釋和說明,認為數據治理與數據管理類似,都是有關數據生命周期的諸如采集、加工、控制、傳輸、保 存等活動。

由此發現國外的概念雖然在表述上有一定的差別,但核心內容上均具有一些共同點,而國內的概念使用卻較為混亂,相關學者還未達到共識,并且多數研究都未觸及數據治理的本質。數據治理不僅是通過數據的管理提升數據質量,更強調流程設定和權責劃分,我們認為數據治理是圍繞數據資產展開的系列工作,以 服務組織各層決策為目標,涉及有關數據管理的技術、 過程、標準和政策的集合。?

1.2 數據治理的內涵界定
數據治理根植于IT治理,但兩者之間又有明顯的區別,Khatri[6]明確指出了IT治理的對象是IT系統、設備和相關基礎設施,而數據治理的對象是可記錄的數據,文中還區分了數據治理和數據管理,認為數據治理是為了確保有效管理而做的決策,強調決策制定的責任路徑,數據管理僅僅涉及決策的執行;同時,Koope等[22]分析了IT治理的局限性,認為IT治理過程中過于強調IT投資和系統實施,忽視了商業價值增長中的數據創建、處理、消耗和 交換方式。此外,由于研究調查中表明超過70%的人將數據視為戰略資產[23],因此大量學者[11-12,24-26]持有觀點認為數據治理與數據資產密不可分,認為只有將數據治理視為公司或機構管理的重要數據資產內容, 將數據置于組織的戰略資產的位置,才有可能迎接當 下的競爭挑戰。

國內學者包冬梅等[21]于2015年專門厘清了數據治理和數據管理的區別,認為治理和管理是完全不同的活動,治理是有關管理活動的指導、監督和評估,而 管理則是根據治理制定的決策來執行具體的計劃、建 設和運營。

由前述可知,數據治理具有豐富的內涵,不僅是對IT技術的簡單關注,還需解決相關的政策流程和人員分配問題,其核心是通過數據治理計劃,確保組織高層 有效安全地利用數據生成決策。??

1.3 數據治理的價值要義
2012年的調查顯示[25],接近2/3的受訪者認可數據的分析和使用能夠為組織帶來競爭優勢。在此背景下,Tallon[28]認為數據是一種特殊的資產,盡管在資產負債表中沒有顯示數據的價值計量,但數據的管理成本和價值創造卻是明顯的;類似地,Bhansali[29]在書中也闡述了數據治理的價值,認為數據治理的規范能夠幫助組織更有效地管理數據,降低信息使用成本,提高法案遵循和控制的效力,促進高質量數據的生成。此外,Trope等[30-31]均認為數據治理應和各個商業部門相結合,而非僅僅是 IT 部門的事情,良好的數據治理能夠幫助公司避免內 部控制錯誤的發生。

國內學者在數據治理的應用研究中,均從不同視角強調了其重要價值,如在圖書館領域,顧立平[32]從數據獲取、數據共享、數據重用三方面證實了數據治理是圖書館事業的重要發展機遇;蘇玉娟[33]通過對高新技術企業的實證研究,幫助企業實現數據治理,提升企業決策水平;此外,單勇、許曉東等[20,34]從社會治安防 控體系建設、高等教育的視角等,強調了數據治理的必 要性和價值性。?

可見國內外許多學者在數據治理的領域都討論了與價值創造或提升相關的話題,從全球范圍來看,數據治理是保證數據質量的必需手段,數據治理的價值貢 獻在于確保數據的準確性、可獲取性、安全性、適度分 享和合規使用。

2、數據治理的體系研究
2.1 數據治理的整體框架
為了清晰表達一些復雜和抽象的概念,構建科學的框架是開展數據治理實施工作的首要任務。多數國外學者在研究時均提出了數據治理的框架,如 Wende[35]提出的框架模型草案中,定義了各個決策領域和相應的角色劃分,該框架模型最大的貢獻是能夠幫助組織構建數據質量職責,所提出的決和角色能夠作為數據治理的結構配置,尚還缺少不同組織情景下的使用驗證;類似地,Oester鄄le[36]建立了包含三個要素(數據質量角色、決策域和責任)的數據治理模型,并形成一個責任分配矩陣。此后,成果各有側重,其中影響力較大的是Khatri和Brown[6]提出的數據治理的決策域模型,該框中包含了數據準則、數據質量、元數據、數據訪問和數據生命周期五個決策域,并闡述了決策域的類型和范圍,該模型提出了在同一組織決策域的不水平的集中、分散和共享決策權,同時提供了一個共同術 語的通用框架,使其在后面的研究中被廣泛采納;在此 基礎上,Begg 等[13]使用了Khatri 和Brown的框架,對10個中小企業進行調查,探索實施數據治理的潛在價值和實施障礙的研究。此外,Martijn等[37]提出了數據治理的概念和驅動型分為技術架構、過程架構和商業架構的三層體系,同時通過設計數據治理的因果模型確定了諸多影響因素,進而發現了中小企業數據治理需求和實施障礙,并引發了單一數據治理框架能否通用化的思考;而Seiner[38]則提出了包含執行層、戰略層、戰術層、操作層和支持層的五層框架模型,同時闡述 了五個層次上各自的角色、過程、交流、指標和工具。

數據治理決策域模型

圖1 數據治理決策域模型

國內包冬梅等[21]總結了數據治理框架中的職能及關系、工作區間、任務、組織結構、責任分工、成效的評估標準等,同時提出了高校圖書館的數據治理框架 CALib;許曉東等[34]中也設計了高等教育數據治理的 分析框架,此外,關于框架的設計,其他國內文獻鮮有 涉及。?

由此發現,國外數據治理的框架通常包括了政策制度、技術工具、數據標準、流程規范、監督及考核等方面,各個理論框架各具特色和優勢,但尚形成標準化的模型體系。國內少數研究借鑒了國外的設計思路,并在圖書館、高等教育等領域進行了探討,但都不夠深入,其分析框架從數據治理的格定義上看,還不足以 覆蓋數據治理的整個內容。??

2.2數據治理的成熟度模型
成熟度模型的建立是為了評估組織當前數據管理和控制的現狀,是實施 數據治理非常關鍵的環節。 研究表明[39]當前數據成 熟度模型在商業部門、洲政府、聯邦政府、國際化組織 和本地政府均有應用[30,40-42]。 如 Gartner 設計的6 階 段的成熟度模型中[43],給出了每個階段的行動方案, 并強調管理信息作為數據資產應得到高層重視;此外,

MDM[44]強調用面向架構的服務 SOA(Service-Orien ted Architecture)作為計劃、設計、實施包括數據服務在內的所有企業服務的基本方法,提出的成熟度模型也 是按照演化路徑劃分。國內學者包冬梅等[21]在其設計的 CALib 模型的 實施與評估中,討論了數據治理成熟度評估的意義,但 并未建立具體的成熟度模型。

可以發現,國外研究較為豐富,各種模型的共同點 都是一個從混亂、規范再到優化的有序等級演繹過程, 成熟度的不斷升級就是數據治理水平逐步積累的過 程,借助模型,可找到組織數據治理的薄弱環節,針對 性地形成改進策略,促使治理水平漸進提升。 國內專 門提出數據治理成熟度模型設計的文獻較少,表明還 未意識到該項研究的重要性和必要性。?

3、數據治理的內容研究
3.1 數據治理的政策和標準
數據治理的目標之一是向組織的內部或外部提供合約遵循的可見度。國外數據治理的興起很大程度上是由于對法案法規的遵循,旨在防止企業運的不正當行為和數據欺詐。 在 美國,涉及信息技術或數據的法規如 Sarbanes-Oxley、 Basel 域、COBIT (Control Objectives for Informationand related Technology)、美國愛國者法案、美國健康保 險流通與 HIPAA(Health Insurance Portability and Ac countability)等[45],均要求提供準確可信的財務報告和治理規則。由此,從確保數據利益相關者評估的需要出發,Malik[12]在談及大數據治理關鍵領域時就闡 明了戰略和政策因素;此外,文獻[29,37,45-46]中均強調了 政策和標準的支持作用。?

當前,我國有關數據的各項標準和政策研究已在各個領域有所觸及,如科研數據管理服務中,部分研究是針對數據監管政策、存儲規范和傳播交流機制的,認為標準建設是解決科學數據完整性、科學數據規范化問題的有效方式[3,19];除此之外,也有研究涉及數據質量的標準,如關聯數據的質量標準、元數據標準 等[47-48]。?

綜上所述,國外數據治理領域內的數據應用標準建設都比較完善。國內也開展了對數據治理相關標準的研究,尤其是在科學數據研究聚焦的圖書情學領域,部分學者借鑒國外相關領域數據標準,嘗試探索了 諸如數據質量標準和元數據標準等的研究,具有一定 的基礎。?

3.2 數據質量
數據質量的高低代表了該數據滿 足消費者期望的程度[49]。 在技術層面的探討中,國外 的數據質量相關研究開展已久[50],主要是從繼承產品 質量框架下的管理視角開展[51]。 在數據治理的框架 模型中,可以發現數據質量仍然是重要的組成要素, Friedman 和 Eppler 認為其對業務過程和數據報告的 呈現 具 有 重 要 影 響,是 數 據 治 理 的 先 決 條 件 因 素[52-53],在此基礎上,Haider[11]提出數據治理不僅是 提高短期組織的數據質量,更是一個長期持續完善和 優化的過程;除了關注數據的價值質量和服務質量, Ryu 和 Park[54]中還引入了數據的結構質量,并解釋了 該結構質量的三個領域(價值域、服務域、結構域);此 外,文獻[6,29-30,46]中均說明了數據質量的改善涉及到的 元數據管理數據分析數據清洗、數據監控和預警、數 據質量評估等過程。

國內包冬梅等[21]在高校圖書館數據治理過程中提及了數據質量,認為應該通過跨界合作提高數據質量,建設科研要素基礎知識庫。從具體實現角度,目前研究主要涉及兩個方面,即數據質量的評估和技術提高[3],數據質量評估的關鍵在于如何具體地評估各個指標維度,數據質量的提高技術主要是關于實例和模 式,而其中數據清洗的相關研究又最為豐富[53]。?
?
綜上所述,國內外的數據質量研究都較為成熟,取得了一定的成果,國外在此基礎上開始研究數據治理情景下的數據質量問題。國內研究主要關注數據質量評估和質量提高,部分已經深入到技術細節層面。但目前還有許多問題需要國內外進一步探索的,如大數據環境下,大量異質、非結構化數據的出現,數據孤島 問題更加突出,使得數據質量管理受到全新的挑戰,值 得從大數據的認知角度和語義層面對數據質量進行深 入研究。?

3.3 數據隱私和安全
數據的隱私和安全是關于 電子媒介上數據存儲、使用和傳輸的保護問題。 Bhan sali[29]指出數據治理是對數據持續監控和評價的過程,以便更好地管控數據風險;此外,Begg等[13]探尋了研究中受訪企業對數據安全因素的認知態度及影響因素;在具體對策建議方面,Trope 和 Power[55]建議組 織應提高其安全策略的標準,類似地,其他學者們也均 認為數據隱私和數據安全事關信息質量,組織應該建 立相應的政策加強數據安全管理。?

在國內現有的數據治理領域,劉子龍和黃京華從隱私策略、隱私倫理,特別是對電子商務領域的隱私態度和隱私行為進行了研究[58];同時,陳火全[56]認為數據治理的網絡安全策略不僅需要提高網絡安全性的信譽機制,還需要建立社會信譽機制來加強隱私的保護。類似地,多位學者呼吁將數據保護納入國家戰略資源 的保護和規劃范疇,并加快完善數據隱私保護的相關 立法[57-58]。

可見,國外多數學者已將數據隱私和安全列入治理框架的重要內容,國內數據隱私問題也已得到廣泛關注。大數據時代,數據隱私保護和數據安全訴求更加多變和多元,傳統的數據隱私和安全保護問題面臨巨大挑戰,如被動響應、溯源困難等,國內外在數據治理的過程中,都應該考慮如何在保護安全和隱私的 前提下推動數據科學環境下的數據聯接、流動和應用, 做好數據監管的工作。?

總之,在數據治理的內容研究中,數據政策是首要的促進方式,數據質量是必要的實現目標,數據隱私和安全是重要的保障前提。此外,數據生命周期、數據的 開放存取和元數據管理等同樣是數據治理領域需要涉 及的內容。

4、數據治理的應用實踐研究
現代組織日常經營活動中積累產生了大量的數據,這些數據除了能支持傳統的業務運營,也廣泛被用于各個行業的決策支持、信息分析、風險控制、績效考 核等,表1集中梳理了國內外具有代表性的現有各領 域研究的開展情況。?

綜上所述,國外數據治理的研究在金融、教育、環境、農業、醫療等領域有所應用,而國內的研究應用多數是借鑒了國外的思想,且研究應用領域較為局限,成 熟的研究主要集中在科學數據聚集的圖書情報領域。

5、結 論
縱觀國外數據治理的整個研究歷程,國外已經涌 現出一些涉及數據治理的研究成果,從研究內容來看, 這些成果主要集中以下幾個方面:淤數據治理的理論 框架模型的設計;于來自跨領域的數據治理價值的探 討;盂基于不同框架模型的驅動實踐探索。 國內的數 據治理研究起步較晚,大量研究主要借鑒了國外數據 治理的思想,目前集中在理論層面的價值討論階段,對 數據治理框架構成內容的各個方面研究均不深入。

作為新領域的研究,國內外多數采用探索性研究的方法,結合敘述性的論述和經驗總結,實證性研究較少,少數半結構化訪談的實證研究也存在樣本不充足的局限,對數據治理框架模型的設計還有繼續完善和優化的空間,數據治理理論框架的普適性應用仍然需要驗證。有關數據治理的框架體系、策標準、成熟度模型、數據質量、非結構化數據的質量評價、元數據管理等仍然是未來研究的重心,產業界驅動的模型框架的制定需要與理論界融合創新。

特別需要指出的是,在數據科學時代,面對模態繁多的數據類型和海量數據,對傳統的數據質量管理、數據隱私和安全等都提出了巨大挑戰。數據治理正是大數據環境下對數據生命周期進行科學管理的一套治理方法,是對數據資產進行管理和控制的系列活動的集合,今后開展數據治理的研究務要注重模型和數據的雙驅動,即在遵循傳統模型框架的基礎上,也要特別注意非結構化數據的聚集特征和質量評價。此外,在實施的過程中,注意引入外源視角,比如在圖書館領域 的數據治理中,數據質量評價能否引入科學數據評價 環節中的同行評議等。

總而言之,大數據技術不僅能重塑數據治理的思 維,提升數據治理的能力,而且有可能變革數據治理的 模式,是數據科學時代科研創新的一條重要發展路徑。?

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢