一、
數(shù)據(jù)治理架構(gòu)
分為三個(gè)層次,分別為戰(zhàn)略與治理保障、大數(shù)據(jù)管理和大
數(shù)據(jù)應(yīng)用與服務(wù),其中戰(zhàn)略與治理保障包括,數(shù)據(jù)戰(zhàn)略規(guī)劃與評估,數(shù)據(jù)治理組織與職責(zé)、數(shù)據(jù)制度與管理流程;大數(shù)據(jù)管理包括
數(shù)據(jù)標(biāo)準(zhǔn)管理、架構(gòu)與模型管理、質(zhì)量管理、生存周期管理以及安全管理;大數(shù)據(jù)應(yīng)用與服務(wù)包括,
數(shù)據(jù)分析、開放共享以及數(shù)據(jù)服務(wù)。該架構(gòu)依照國標(biāo)數(shù)據(jù)管理能力成熟度模型設(shè)計(jì)。
二、數(shù)據(jù)質(zhì)量問題的發(fā)現(xiàn)與整治過程
過程共分為三個(gè)階段:源業(yè)務(wù)系統(tǒng)數(shù)據(jù)分析、制定質(zhì)檢規(guī)則并分析源系統(tǒng)數(shù)據(jù),分析質(zhì)量問題影響并制定整改措施。
源業(yè)務(wù)系統(tǒng)數(shù)據(jù)分析階段的分析素材:源系統(tǒng)操作手冊、需求分析說明、數(shù)據(jù)庫設(shè)計(jì)、源系統(tǒng)數(shù)據(jù);

分析過程:分析業(yè)務(wù)流程、邏輯和關(guān)系,確定數(shù)據(jù)庫表間和字段間關(guān)系,同時(shí)分析與該源業(yè)務(wù)系 統(tǒng)存在關(guān)聯(lián)關(guān)系的其它系統(tǒng)間的業(yè)務(wù)關(guān)聯(lián)關(guān)系和數(shù)據(jù)關(guān)聯(lián)關(guān)系;
輸出成果:數(shù)據(jù)庫結(jié)構(gòu)(主外鍵、約束、表間關(guān)系、字段長度與類型等)、業(yè)務(wù)描述(表及字段的業(yè)務(wù)含義、業(yè)務(wù)規(guī)則)。
數(shù)據(jù)質(zhì)量檢查階段的輸入:分析階段的輸出成果以及業(yè)務(wù)報(bào)表;
過程:編制質(zhì)檢規(guī)則,并以其為核心,設(shè)計(jì)質(zhì)檢程序或腳本,執(zhí)行自動(dòng)化、批量化檢查。過程中對重點(diǎn)業(yè)務(wù)報(bào)表引用的數(shù)據(jù)表進(jìn)行重點(diǎn)分析;
輸出:質(zhì)量問題清單及問題定位。
數(shù)據(jù)質(zhì)量分析階段的輸入:分析階段和檢查階段的輸出成果;
過程:分析質(zhì)量問題對報(bào)表的影響,即影響分析;成因分析;制定解決方案;
輸出:分析報(bào)告及整改方案。
數(shù)據(jù)質(zhì)量分析報(bào)告將是后續(xù)大
數(shù)據(jù)治理平臺的重要建設(shè)依據(jù)。
三、數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)過程
建設(shè)基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)和指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)框架;確定標(biāo)準(zhǔn)化范圍,對重要指標(biāo)(屬性)進(jìn)行標(biāo)準(zhǔn)化。
建設(shè)過程:該過程需要業(yè)務(wù)人員和技術(shù)人員共同參與梳理和編制,補(bǔ)充完善標(biāo)準(zhǔn)化方案。
基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)框架的內(nèi)容: 可參考人民銀行數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,進(jìn)行劃分,包括業(yè)務(wù)屬性、技術(shù)屬性和管理屬性三大類,業(yè)務(wù)屬性包括標(biāo)準(zhǔn)主題、標(biāo)準(zhǔn)大類、標(biāo)準(zhǔn)子類、標(biāo)準(zhǔn)小類、標(biāo)準(zhǔn)中文名、標(biāo)準(zhǔn)英文名、業(yè)務(wù)定義、業(yè)務(wù)規(guī)則、融合規(guī)則、叔都是服我、與相關(guān)標(biāo)準(zhǔn)關(guān)系、標(biāo)準(zhǔn)來源及依據(jù);技術(shù)屬性包括數(shù)據(jù)類型、數(shù)據(jù)格式、代碼編碼規(guī)則、取值范圍;管理屬性包括標(biāo)準(zhǔn)定義者、標(biāo)準(zhǔn)管理者、標(biāo)準(zhǔn)使用者、反饋結(jié)果描述、標(biāo)準(zhǔn)應(yīng)用領(lǐng)域和使用系統(tǒng);
指標(biāo)標(biāo)準(zhǔn)建設(shè):篩選重要業(yè)務(wù)指標(biāo)()=>制定指標(biāo)標(biāo)準(zhǔn)框架(確定指標(biāo)分類體系、屬性形成標(biāo)準(zhǔn)化定義模板)=>制定指標(biāo)標(biāo)準(zhǔn)(指標(biāo)定義、口徑、規(guī)則、數(shù)據(jù)來源,技術(shù)部門定義標(biāo)準(zhǔn)化屬性,業(yè)務(wù)部門修訂和確認(rèn)指標(biāo)標(biāo)準(zhǔn))
指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)框架:業(yè)務(wù)屬性、技術(shù)屬性和管理屬性。
四、建設(shè)數(shù)據(jù)平臺
層次關(guān)系:屬性(字段)=>實(shí)體(對象,表)=>專題(實(shí)體集合,業(yè)務(wù)專題)=>主題? ?(專題集合、業(yè)務(wù)域)? ?
模型演進(jìn)過程:基礎(chǔ)模型=>邏輯模型=>物理模型。基礎(chǔ)模型的形成,需要依據(jù)國家或行業(yè)標(biāo)準(zhǔn),結(jié)合具體實(shí)施單位的業(yè)務(wù)情況進(jìn)行裁剪,通過保留、增加和合并的業(yè)務(wù)匹配過程,形成基礎(chǔ)模型,劃分業(yè)務(wù)主題模型框架;在進(jìn)行邏輯模型設(shè)計(jì)過程中,需要復(fù)制(系統(tǒng)間業(yè)務(wù)含義和字段名稱均不相同的字段)、整合(含義相同名稱不同的字段)和拆分(含義不同名稱相同的字段);之后進(jìn)行屬性匹配,保留、增加、合并、拆分和映射源系統(tǒng)到基礎(chǔ)模型中主題、實(shí)體和屬性。
完成模型設(shè)計(jì)之后,進(jìn)行數(shù)據(jù)映射和ETL操作,將源表數(shù)據(jù),參照映射文件、開發(fā)規(guī)范和加載策略,進(jìn)行ETL開發(fā)和操作,將數(shù)據(jù)填充至目標(biāo)表中;通過以上操作,完成整合層建設(shè),整合層的對數(shù)據(jù)應(yīng)用的意義:統(tǒng)一的業(yè)務(wù)視圖、明細(xì)的數(shù)據(jù)、全面的數(shù)據(jù)、穩(wěn)定的數(shù)據(jù)模型、完整的歷史數(shù)據(jù)。
匯總層,即滿足共性的數(shù)據(jù)訪問需求,抽取公共指標(biāo),形成由維度和指標(biāo)組成的維度模型,對符合要求的數(shù)據(jù)進(jìn)行預(yù)匯總和加工。
原文地址:https://blog.csdn.net/junweishiwo/article/details/82757205
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)