日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

數據治理領域最容易混淆的16組術語概念辨析

時間:2022-11-13來源:靠近一點點瀏覽數:1010

前言

近期拜訪了不少客戶,發現不同的客戶對數據治理的相關概念理解都不一樣,甚至完全是錯誤的,有些廠商為了追求時髦和新穎,一味追求新的概念,甚至有些概念的完全是張冠李戴,給市場制造了居多混亂和困擾,給客戶帶來誤導。這也是我寫這篇文章緣由,希望該篇文章能正本清源,能給廣大讀者起到一定指導作用。

術語是對概念的特定描述,在不同的專業領域,人們對同一概念的理解各有側重;在不同發展時期,人們對數據治理領域的同一概念的理解也會發生變化。術語的作用就是統一術語概念的語境,保證人們在給定語境能夠使用專門的語言進行精確的交流。術語概念只使用一個最貼切的業務術語表述,避免使用多個近義詞引起歧義。

3T差異((信息化(IT) 、工業運營技術(OT)、數字化轉型(DT)

1、信息化(IT)Information Technology

包括了信息的數字化、數據化海量存儲的條件、網絡化可傳遞與共享等。企業通過ERP/CRM/MES等系統,將業務線上化,使得海量信息可以通過數字化手段進行互聯互通快速處理。是以業務管理的規范化和優化為主要目標,主要側重于以信息技術為支撐優 化提升其業務流程和企業管理。

2、工業運營技術(OT)Operation Technology

是為工廠自動化控制系統提供技術支持,確保生產正常進行的專業技術。

3、數字化轉型(DT)Digital Transformation

指通過先進的云計算、人工智能、大數據、物聯網、移動互聯網手段,對信息系統的海量信息進行處理和挖掘,產生新的業務價值,并改變原 本的商業模式。以企業轉型升級和創新發展為主要目標,主要側重于以數字技術為引領打造數字新能力,推動傳統業務創新變革,構建數字時代新商業模式,開辟數字經濟新價值和發展新空間。

4、工業互聯網

是新一代信息通信技術與工業經濟深度融合的新型基礎設施、應用模式和工業生態,通過對人、機、物、系統等的全面連接,構建起覆蓋全產業鏈、全價值鏈的全新制造和服務體系,為工業乃至產業數字化、網絡化、智能化發展提供了實現途徑,是第四次工業革命的重要基石。

2個I差異(商業智能(BI)、生產運營智能(OI))與工業互聯網

1、商業智能(BI)Business Intelligence

是一套完整的解決方案,可以將來自企業的不同業務系統(如ERP、OA、BPM等,包括自己開發的業務系統軟件)的數據,提取出有用的數據進行整合清洗,在保證數據正確性的同時,進行數據分析和處理,并利用合適的查詢和分析工具快速、準確地為企業提供報表展現與分析,提供決策支持。

2、生產運營智能(OI)Operation Intelligence

通過實時數據采集、工業互聯網、智能計算與處理等多種技術,賦能研發、工程、工廠運營、營銷與服務等企業關鍵經營活動。工廠及成員單位生產運營層面BI系統

多個數據平臺差異(數據倉庫、大數據平、數據湖、數據中臺、數據底座、湖倉一體化大數據平臺 )

1、數據倉庫(Data Warehouse)

數據倉庫是一個面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,用于支持管理決策。數據倉庫是數據庫的一種概念上的升級,可以說是為滿足新需求而設計的一種新數據庫,需要容納更加龐大的數據集。

2、數據湖(Data Lake)

數據湖是將來自不同數據源、不同數據類型(結構化、半結構化、非結構化)的數據,以原始格式存儲進行存儲的系統,并按原樣存儲數據,而無需事先對數據進行結構化處理。是各種原始數據的集合(不產生數據),原則上不對數據進行清洗、整合(不能對業務數據進行修改),入湖數據需要進行注冊(經過治理并且滿足要求)。

3、大數據平臺1.0

個性化、多樣化數據,以處理海量數據存儲、計算及流數據實時計算等場景為主的一套基礎設施,以 Hadoop、Spark、Hive 等作為大數據基礎能力層,在大數據組件上搭建包括數據分析,機器學習程序等 ETL 流水線,以及包括數據治理系統、數據倉庫系統、數據可視化系統等核心功能。

4、數據中臺

數據中臺是企業級數據能力共享平臺,提供企業級數據服務,實現數據共享。數據通過分層與水平解耦,經過匯聚、存儲、整合、分析、加工,沉淀公共的數據能力,再經過服務封裝,形成通用的調用接口,為前端應用提供數據服務調用,支撐前端應用敏捷迭代和快速構建。數據直接用于業務鏈路和交易場景, 服務更多業務。數據中臺不是一個標準化的產 品,是一整套策略和解決方案 的集合。

5、數據底座

數據底座是企業統一的數據平臺,是數據的邏輯集合,由數據湖和數據主題聯接兩層構成,集成公司內部各個業務系統數據及外部數據,為業務可視、分析、決策等數據消費提供數據服務。數據底座由數據湖和數據主題聯接構成。

6、湖倉一體化大數據平臺Data Lakehouse

是新出現的一種數據架構,它同時吸收了數據倉庫和數據湖的優勢,數據分析師和數據科學家可以在同一個數據存儲中對數據進行操作,同時它也能為公司進行數據治理帶來更多的便利性。就是把面向企業的數據倉庫技術與數據湖存儲技術相結合,為企業提供一個統一的、可共享的數據底座。大數據平臺1.0+數據中臺的功能+數據運營的功能=大數據平臺2.0=湖倉一體化大數據平臺(簡稱大數據平臺)。

數據、數據資源、數據資產和數據要素

1、數據對客觀事物(如事實、事件、事物、過程或思想)的數字化記錄或描述,是無序的、未經加工處理的原始素材”。

根據《數據安全法》定義,“數據,是指任何以電子或者其他方式對信息的記錄。”該定義在法律層面明確了數據的記錄方式,并將“數據”和“信息”進行區分。按照這一界定,紙質的檔案信息以及其他書面形式對信息所作的記錄,也屬于數據。

標準 ISO/IEC 11179-1:2015將“數據”定義為“以適合于交流、解釋或處理的形式化方式對信息進行可重新解釋的表 示”,該定義強調了“數據”的電子性質,其認為“數據”是對它代表的對象(信息)的解釋;且該解釋方式必須是權威、標準、通用的,只有這樣才可以達到通信、解釋和處理的目的。

國際數據管理協會認為,“數據是以文本、數字、圖形、圖像、聲音和視頻等格式對事實進行的表現”,對“數據”存在的不同形態進行了列舉,指出“數據”是對事實的表現。

統計學將“數據”定義為“用于表示和解釋而收集、分析和總結后的客觀事實和數字符號”,并將“數據”分為定性數據和定量數據。

根據我國權威科學技術名詞審定機構全國科學技術名詞審定委員會審定,在計算機科學技術中,“數據”是客觀事物的符號表示,指所有可輸入到計算機中并可被計算機程序處理的符號的總稱;在管理科學技術中,“數據”是描述事件或事物的屬性、過程及其關系的符號序列,比如自然語言符號、科學符號、數字以及圖形圖像等。

“數據”的定義雖未實現完全的統一,但結合上述定義分析,我們認為“數據”的定義包含了兩個核心內涵:

一是描述客觀事實。數據是對感知到的客觀事實進行描述或記錄的結果,是對現實世界中的時間、地點、事件、其他對象或概念的描述。

二是須符號化表達。數據須被符號化表達,方能被有效識別。如數字、文字、字母、聲音、圖片、視頻等。

綜上,我們認為數據是對感知到的客觀事實進行描述或記錄的符號或符號集合,如數字、文字、字母、聲音、圖片和視頻等,是未經處理的原始素材。

2、數據資源:廣義上是指對一個企業而言所有可能產生價值的數據,包括自動化數據與非自動化數據。企業生產及管理過程中涉及到的一切文件、資料、圖表等數據的總稱。它是對數據進行加工處理,使數據間建立聯系 ,并具有了某些意義,貫穿于企業管理的全過程。

3、數據資產:是指由組織(政府機構、企事業單位等)合法擁有或控制的數據資源,以電子或其他方式記錄,例如文本、圖像、語音、視頻、網頁、數據庫、傳感信號等結構化或非 結構化數據,可進行計量或交易,能直接或間接帶來經濟效益和社會效益。在組織中,并非所有的數據都構成數據資產,數據資產是能夠為組織產生價值的數據資源, 數據資產的形成需要對數據資源進行主動管理并形成有效控制。

數據資產”三全”管理包含:全生命周期(時間)、全流程(空間)、全景式(場景)。

全生命周期(時間)是基于元數據的數據資產全過程管理,從注冊、應用、運營,最終歸檔消亡的全過程記錄與監控。權衡效率和需求之間的關系,合理分級存儲和保留、銷毀數據。

全流程(空間)是基于數據資產溯源管理(血緣與影響分析),數據來源、存儲位置、處理方式、流轉過程、安全稽查規則,能追本溯源的發現所有資產的“前世今生”。

全景式(場景)是基于數據資產全場景視圖,從應用場景的維度,既有全局規劃的管理者,也有關注細節定義的使用者,還有加工、運維的開發者,提供多層次的圖形化展示,滿足應用場景的圖形查詢和輔助分析。

數據要素:指生產和服務過程中作為生產性資源投入,創造經濟價值的數據、數字化信息和知識的集合。數據要素包括對原始的數據、衍生數據、數據模型、數據產品和服務等。

數據要素和數據資產,是數據資源在不同的價值釋放階段的業務性定義,數據要素包括數據資產,數據資產是能夠使用會計準則,能夠被會計確認計量的數據要素。

企業架構(業務架構、應用架構、數據架構、技術架構)

企業架構包含了四部分,BA(Business Architecture,業務架構)、DA(Data Architecture,數據架構)、AA(Applications Architecture,應用架構)、TA(Technology Architecture,技術架構)。

1、業務架構:是企業治理結構、商業能力與價值流的正式藍圖。業務架構明確定義企業的治理結構、業務能力、業務流程、業務數據。其中,業務能力定義了企業做什么,業務流程定義企業怎么做。是企業架構的基礎,描述企業戰略、治理、組織、關鍵業務流程間結構和交互關系。

業務功能是由業務流程實現的。

業務流程由業務步驟、業務角色、業務數據、業務事件、業務規則組成。

業務架構 = 業務功能 + 組織結構 + 業務流程 +業務數據。

2、應用架構:是企業架構的縮影,描述應用開發藍圖、應用間結構和交互關系,及應用與核心業務流程間的關系。

3、數據架構:數據架構是用于定義數據需求、指導對數據資產的整合和控制、使數據投資與業務戰略相匹配的一套整體構建和規范。是一套規則、政策、標準和模型,用于管理和定義收集的數據類型以及如何在組織及其數據庫系統中使用、存儲、管理和集成數據。它提供了創建和管理數據流以及如何處理整個組織IT系統和應用程序的方法。數據架構是實現數據規劃的載體,是揭示業務本質、描述公司數據關系的全景視圖,是統一數據語言、理順數據關系、消除信息孤島、建立數據互聯的基礎。

4、技術架構:是數據和應用的支撐,描述用于部署業務、數據、應用服務的軟件和硬件能力。包含:基礎設施、 技術平臺、信息化標準和信息安全體系。簡單說技術架構是規范共享的公共軟硬件平臺,由計算機和通信等硬件設備和系統軟件(中間件)所實現的基礎服務(如流程處理、數據存儲、通信等)。

數據管理、數據資源管理、數據資產管理和數據要素管理

1、數據管理:是為了交付、控制、保護并提升數據和信息資產的價值,在其整個生命周期中制定計劃、制度、規程和實踐活動、并執行和監督的過程。數據管理指利用計算機硬件和軟件技術對數據進行有效的收集、存儲、處理和應用的過程。其目的在于充分有效地發揮數據的作用。包含:數據架構、主數據、元數據、時序數據、數據質量、數據安全、數據資源目錄等內容。

2、數據資源管理:致力于發展處理企業數據生命周期的適當的建構、策略、實踐和程序。關注目的就是去尋找手段,以有效的控制數據資源,并提升數據資源的利用率

3、數據資產管理:是指對數據資產進行規劃、控制和提供的一組活動職能,包括開發、執行和監督有關數據的計劃、政策、方案、項目、流程、方法和程序, 從而控制、保護、交付和提高數據資產的價值。數據資產管理須充分融合政策、管理、業務、技術和服務,確保數據資產保值增值。其核心思路是把數據對象作為一種全新的資產形態,并且以資產管理的標準和要求來加強相關體制和手段。從經濟角度,滿足對資產運營的各類管理要求。

4、數據要素管理:是生產和服務過程中作為生產性資源投入,創造經濟價值的數據、數字化信息和知識的集合。內涵:是一種生產性資源,能夠產生收益或價值。外延:包括數據、數據模型、數據產品、數據服務等。

數據治理、數據運營、數據流通

1、數據治理

ISO38505-2:2018對數據治理的定義是:數據治理是關于數據采集、存儲、利用、分發、銷毀過程的活動的集合。

GBT4960.5-2018對數據治理的定義是:數據治理就是數據資源及其在應用過程中相關管控活動、績效和風險管理的集合。

國際數據管理協會(DAMA)對數據治理的定義是:數據治理是指對數據資產管理行使權力和控制的活動集合(規劃、監督和執行)。

國際數據治理研究所(DGI)對數據治理的定義是:數據治理是一個通過一系列信息相關的過程來實現決策權和職責分工的系統,這些過程按照達成共識的模型來執行,該模型描述了誰(Who)能根據什么信息,在什么時間(When)和情況(Where)下,用什么方法(How),采取什么行動(What)。

1)狹義的數據治理

是對數據資產管理行使權力和控制的活動集合(規劃、監控和執行),指導其他數據管理職能如何執行,在高層次上執行數據管理制度。

指數據管理的目標、原則、組織、制度、流程、績效和標準等軟性要求,取其“狹義”。

狹義的數據治理的驅動力最早源自兩個方面:

內部風險管理的需要,包括:財務做假、敏感數據涉密、數據質量差影響關鍵決策等。

為了滿足外部監管和合規的需要,比如薩班斯-奧克斯利法案、巴塞爾I/巴塞爾協議、健康保險流通與責任法案(HIPAA)等。

但隨著全球越來越多的企業了解到信息資產的重要性和價值,在過去幾年中,數據治理的目標也在發生些轉變。除滿足監管和風險管理外,如何通過數據治理來創建業務價值備受關注。

2)廣義的數據治理

是圍繞將數據作為企業資產而展開的一系列的具體化工作。組織為實現數據資產價值最大化所開展的一系列持續工作過程,明確數據相關方的責權、協調數據相關方達成數據利益一致、促進數據相關方采取聯合數據行動。

包含數據戰略、數據架構、主數據管理元數據管理、指標數據管理、時序數據管理、數據質量管理、數據安全管理、數據交換與服務、數據交換與共享等一系列數據管理活動的集合。

2、數據運營

是數據治理從專項工作轉變為企業日常經營管理體系的推進過程和實施策略,指數據的所有者通過對于數據的分析挖掘,把隱藏在海量數據中的信息作為商品,以合規化的形式發布出去,供數據的消費者使用。包含:數據需求、數據運維、數據共享、數據服務、數據分類分級、成熟度評估等

3、數據流通

即是實現數據社會化利用和實現數據資源價值的必然路徑,正是有社會化數據流通和利用。數據流通的目的在于實現數據的分析價值(使用價值),但是數據流通環節體現的是數據的交換價值。數據交換價值的基礎是數據關聯性、準確性和可用性(數據質量)。數據流通實際上是通過共享平臺、開放平臺和交易平臺進行流動。共享平臺解決部門之間的數據流通,開放平臺解決政府數據流向社會的疏導,交易平臺解決整個全社會數據之間的流通和互通。整個數據流通的過程中,數據的治理是基礎。數據流通的三個核心本質是治理、平臺支撐、應用驅動。

標準、標準化、標準體系、數據標準、數據標準化

1、標準:被定義為對重復性事物和概念所做的統一規定。通過標準化活動,按照規定的程序經協商一致制定,為各種活動或其結果提供規則、指南或特性,供共同使用和重復使用的文件。

2、標準化:為了在既定范圍內獲得最佳秩序,促進共同效益,對現實問題或潛在問題確立共同使用和重復使用的條款以及編制、發布和應用文件的活動。

是一項活動,是制定、發布和實施標準的系統過程,標準制定是標準化活動過程的核心要素。標準化的目的是使標準在社會一定范圍內得以推廣,使不夠標準的狀態轉變成標準狀態。標準化對象不是孤立的一件事、一個事物,而是共同使用或可重復使用的事物。標準化是一個動態的的概念,是隨著科技的進步和社會的發展而不斷變化發展的。

3、標準體系:一定范圍內的標準按其內在聯系形成的科學的有機整體。標準體系表是一種標準體系模型,通常包括標準體系結構圖、標準明細表,還可以包含標準統計表和編制說明。

4、數據標準(Data Standards)是業務流程中產生的數據的統一定義。就是對數據的命名、定義、結構和取值規范方面的規則和基準,此定義是業務對數據項在企業營運環境中的統一業務定義及技術要求,是保障數據內外部使用和交換的一致性和準確性的規范性約束,以達成對數據的業務理解、技術實現的一致。

5、數據標準化:企業或組織對數據的定義、組織、監督和保護、借助技術工具來促成數據標準得以在IT系統和業務領域實施的整體過程。通過數據標準化,企業的各種重要信息,包括產品、客戶、機構、賬戶、單據、統計指標等在全企業內外的使用和交換都是一致的、準確的。數據標準化是一項帶有系統性、復雜性、困難性、長期性特征的動態管理工作,是對標準的某種程度上的落地。

數據目錄與數據資源目錄、數據資產目錄、數據服務目錄、數據共享開放目錄

1、數據目錄:可以分為數據資源目錄、數據共享和開放目錄、數據資產目錄和數據服務目錄。是數字化轉型、構建數字孿生的基礎;是數據共享、服務的基礎;是數據資產化、數據資產運營的基礎;

2、數據資源目錄:是依據規范的元數據描述數據資源,站在全局視角對所擁有的全部數據資源進行編目,以便對數據資源進行管理、識別、定位、發現、共享的一種分類組織方法,從而達到對數據的瀏覽、查詢、獲取等目的。

3、數據資產目錄:是指對數據中有價值、可用于分析和應用的數據進行提煉形成的目錄體系。數據資產目錄構建的角度應該是管理的角度,根據不同數據資產管理范圍的劃分,由不同的角色進行管理。編制數據資產目錄可以給出業務場景和數據資源的關聯關系,降低理解系統數據的門檻。中國政府為推動跨部門數據共享開放而重點布置各級政府和代替政府履行一定公共服務職能的企業開展的重要數據管理工作,國務院和發改委先后多次發文,并已出臺數據資產目錄管理的系列國標;是整個數據資產體系中的首要工作,是構建企業數據架構體系的基礎工作。是實現企業內部數據資產目錄統一檢索、快速定位和統計分析,實現數據資產地圖展示、逐步形成知識圖譜。

4、數據服務目錄:是對數據服務依據規范的元數據描述,按照特定的業務場景進行排序和編碼的一組信息,用以描述各個數據服務的特征,以便于對數據服務的使用和管理。數據服務目錄的建設是基于組織內已梳理的數據資產目錄,以業務場景、應用場景為切入,以業務需求、應用需求為導向進行編制。主要分為兩類,一類是數據應用服務,包括指標報表、分析報告等可以直接使用的數據應用;另一類是數據接口服務,提供鑒權、加密、計量、標簽化等。

5、數據共享開放目錄:可以明確數據資源進行共享、開放的范圍與條件,方便數據跨部門、跨單位、跨組織產生價值。

數據源、元數據與數據元

1、數據源:是指數據的來源,也是數據產生和生成的源頭。數據源包括內部數據源和外部數據源兩大部分。其中內部數據源根據產生來源的不同又可以分成兩類,一類是業務操作中采集的原始數據,也稱基礎數據(是指企業運營活動中產生的原始數據,或者進行過簡單的清洗處理,但不通過計算得到的數據。);另一類是基于業務規則對原始數據數據加工后生成的結果數據,也稱衍生數據。外部數據源指由于企業業務發展的需要,從企業外部政府部門、企事業單位、商業機構等獲得數據的來源,如氣象數據、經濟數據等。

2、元數據:為描述數據的數據,主要是描述數據屬性的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。包括業務元數據、技術元數據和管理元數據。元數據管理是關于元數據的創建、存儲、整合與控制等一整套流程的集合。元數據貫穿數據資產管理的全流程,是支撐數據資源化和數據資產化的核心。首先,元數據從業務視角和管理視角出發,通過定義業務元數據和管理元數據,增強了業務人員和管理人員對于數據的理解與認識。其次,技術元數據通過自動從數據倉庫、大數據平臺、ETL 中解析存儲和流轉過程,追蹤和記錄數據血緣關系,及時發現數據模型變更的影響,有效識別變更的潛在風險。最后,元數據可作為自動化維護數據資產目錄、數據服務目錄的有效工具。

3、數據元:也稱為數據元素,組成實體數據的最小單元,或稱原子數據,用一組屬性描述定義、標識、表示和允許值的數據單元,數據元由三部分組成:對象、特性、表示。[GB/T 18391.1-2002,定義3.14在一定語境下,通常用于構建一個語義正確、獨立且無歧義的特定概念語義的信息單元。?數據元可以理解為數據的基本單元,將若干具有相關性的數據元按一定的次序組成一個整體結構即為數據模型。

數據元一般由對象類、特性、表示三部分組成:1)對象類:現實世界中的想法、抽象概念或事物的集合,有清楚的邊界和含義,并且特性和其行為遵循同樣的規則而能夠加以標識;2)特性:對象類的所有個體所共有的某種性質;3)表示:值域、數據類型的組合,必要時也包括度量單位或字符集。

參考數據、主數據、交易數據、指標數據

1、主數據:指滿足跨部門業務協同需要的核心業務實體數據。長期存在且應用于多個系統,描述整體業務數據的對象;例如:客戶、商品、供應商主數據相對交易數據而言,屬性相對穩定,準確度要求更高,唯一識別。主數據管理是一系列規則、應用和技術,用以協調和管理與企業的核心業務實體相關的系統記錄數據。通過對主數據值進行控制,使得企業可以跨系統的使用一致的和共享的主數據,提供來自權威數據源的協調一致的高質量主數據,降低成本和復雜度,從而支撐跨部門、跨系統數據融合應用。

2、參考數據:是用于將其他數據進行分類或目錄整編的數據,參考數據管理是對定義的數據域值進行控制,包括對標準化術語、代碼值和其他唯一標識符,每個取值的業務定義,數據域值列表內部和跨不同列表之間的業務關系的控制,并對相關參考數據的一致、共享使用。

3、交易數據:也稱為操作類數據指在日常業務開展過程中實時產生或交互的業務行為和結果型數據。操作類數據對實時性要求較高,主要作用是支撐業務的辦理流程。相對于主數據,交易數據具有短期或瞬間的特點;例如:采購訂單,銷售訂單。

4、指標數據:組織在戰略發展、業務運營和管理支持各領域業務分析過程中衡量某一個目標或事物的數據。一般是由指標名稱、時間、指標數值等組成。指標數據管理指組織對內部經營分析所需要的指標數據進行統一規范化定義、采集和應用,用于提升統計分析的數據質量。

企業一般將參考數據和主數據通稱為主數據。其中,參考數據又叫配置型主數據,是描述業務或核心主數據屬性分類的參考信息,會在整個組織內共享使用。一般依據國際標準、國家標準、行業標準或企業標準和相關規范等,在系統中一次性配置使用的基礎數據,例如國家、民族、性別等規范性表述。配置型主數據相對穩定,不易變化。相對于參考數據的主數據又稱為核心主數據,指用來描述企業核心業務實體的主數據,是企業核心業務對象、交易業務的執行主體,如產品、物資、設備、組織機構、員工、供應商、客戶、會計科目等。核心主數據是企業信息系統的神經中樞,是業務運行和決策分析的基礎。核心主數據是相對“固定”的,變化緩慢。

數據指標和數據標簽

1、數據指標:是衡量目標的方法,預期中打算達到的指數、規格、標準,一般用數據表示。例如:銷售收入、活期存款金額、委托貸款余額等。數據指標管理是指通過對企業若干個核心和關鍵業務環節相互聯系的統計數據指標的全面化、結構化和層次化的系統化構建,滿足企業對找指標、理指標、管指標、用指標的需要。

2、數據標簽是一種用來描述業務實體特征的數據形式。通過標簽對業務實體進行刻畫,從多角度反映業務實體的特征。比如對用戶進行刻畫時,包括性別、年齡、地區、興趣愛好、產品偏好等角度。在日常工作中,經常碰到的業務實體包括用戶、商品、商戶等,相應的標簽分別稱之為用戶標簽、商品標簽和商戶標簽。

數據架構與主題域、數據模型、數據分布、數據流向、實體、數據類型、數據項

1、數據架構:數據架構包括數據資產目錄、數據標準、企業級數據模型和數據分布四個組件。

2、主題域:提供模型的高階視圖,是類的邏輯分組。根據業務要求將類組織成一些獨立完整的領域,每個主題域對應某一領域所涉及的類對象,并在較高層次上對該領域內數據進行完整一致的描述。主題域擴展可以根據客觀對象、業務關注點定義新的數據對象范圍。

定義主題域原則包括以下三點:

同一主題下由相關性強的概念或內容聚合而成;

同一層級的主題域具有互斥性,其業務含義不可重疊, 上級和下一級是父子關系;

業務域之間需要建立關聯關系。

3、數據模型:是使用結構化的語言將收集到的組織業務經營、管理和決策中使用的數據需求進行綜合分析,按照模型設計規范將需求重新組織在一起。從模型覆蓋的內容粒度看,數據模型一般分為主題域模型、概念模型、邏輯模型和物理模型。主題域模型是最高層級、以主題概念及其間關系為基本構成單元的模型,主題是對數據表達事物本質概念的高度抽象;概念模型是以數據實體(類)及其間關系為基本構成單元的模型,實體名稱一般采用標準的業務術語命名;邏輯數據模型是在概念模型的基礎上細化,以數據屬性(元素)為基本構成單元。

4、數據分布:是針對組織級數據模型中數據的定義,明確數據在系統、組織和流程等方面的分布關系,定義數據類型,明確權威數據源,為數據相關工作的提供參考和規范。通過數據分布關系的梳理,可以定義數據相關工作的優先級,方便指定數據的認責管理人,并進一步優化數據的集成關系。

5、數據流向:是建立組織內各應用系統、各部門之間的集成機制,通過公司內部數據集成相關制度、標準、技術等方面的管理,促進公司內部數據互聯互通。體現系統各環節輸入和輸出的信息項,數據通過系統交互以及存儲的路徑,從數據傳遞和加工的角度,體現控制流和數據流的方向。

6、實體是指現實世界中客觀存在的并可以相互區分的對象或事物。就數據庫而言,實體往往指某類事物的集合。可以是具體的人事物,也可以是抽象的概念、聯系。數據實體對象往往包含:指標數據、交易數據、主數據及參考數據等。

7、數據類型:數據類型是一種分類,它指定變量具有哪種類型的值以及哪種類型的數學、關系或邏輯運算數據類型是一種分類,它規定了變量或對象在計算機編程中可以包含什么。數據類型具體細分為原始類型及構造類型。原始類型包括整型、浮點型、布爾型、字符串型等。構造類型包括枚舉、結構體、集合等。數據類型定義參照CIM標準執行。

8、數據項:數據項是數據的不可分割的最小單位。?數據項的名稱有編號、別名、簡述、數據項的長度、類型、數據項的取值范圍。?數據項是數據記錄中最基本的、不可分的有名數據單位,是具有獨立含義的最小標識單位。

9、數據字典:是指對數據的數據項、數據結構、數據流、數據存儲、處理邏輯等進行定義和描述,其目的是對數據流程圖中的各個元素做出詳細的說明。數據字典是描述數據的信息集合,是對系統中使用的所有數據元素的定義的集合。

數據應用與數據分析、數據開發共享、數據服務

1、數據應用:是對數據的使用,使其發揮價值。其涉及到三個領域:數據分析、數據開放共享和數據服務。

2、數據分析:是對公司各項經營管理活動提供數據決策支持而進行的公司內外部 數據分析或挖掘建模,以及對應成果的交付運營、評價推廣等活動。數據分析能力會影響到公司制定決策、創造價值、向用戶提供價值的方式。

3、數據開放共享:是指按照統一的管理策略對組織內部的數據進行有選擇的對外開放,同 時按照相關 的管理策略引入外部數據供組織內部應用。數據開放共享是實現數據跨組織、跨行業流轉的重要前提,也是數據價值最大化的基礎。

4、數據服務:是指通過對企業內外部數據的統一加工和分析,結合不同需求方的需要,以數據分析結果的形式對外提供跨領域、跨行業的數據服務。數據服務的提供可能有多種形式,包括數據分析結果、數據服務調用接口、 數據產品或數據服務平臺等,具體服務的形式取決于企業數據的戰略和發展方向。

數據生命周期與數據需求、數據設計和開發、數據運維、數據退役

1、數據生存周期:數據獲取、存儲、整合、分析、應用、呈現、歸檔和銷毀等各種生存形態演變的過程。

2、數據需求:是公司對業務運營、經營分析和戰略決策過程中產生和使用的數據的分類、含義、分布和流轉的描述。數據需求管理過程識別所需的數據,確定數據需求優 先級并以文檔的方式對數據需求進行記錄和管理。

3、數據設計和開發:是設計、實施數據解決方案,提供數據應用,持續滿足公司的數據 需求的過程。數據解決方案包括數據庫結構、數據采集、數據整合、數據交換、數據訪問及數據產品等方案。

4、數據運維:是數據平臺及相關數據服務建設完成上線投入運營后,對數據采集、數據 處理、數據存儲等過程的日常運行及其維護過程,保證數據平臺及數據服務的正常 運行,為數據應用提供持續可用的數據內容。

5、數據退役:是對歷史數據的管理,根據法律法規、業務、技術等各方面需求設計歷史數據的保留和清除策略,執行歷史數據的歸檔、遷移和清除工作,確保公司對歷史數據的管理符合外部監管機構和內部業務用戶的需求,而非僅滿足信息技術需求。

業務術語、業務規則、命名規范、技術規范

1、業務術語:是組織中業務概念的描述,是組織內部理解數據、應用數據的基礎,是業務部門和數據部門溝通的橋梁。良好定義的業務術語標準和業務術語字典可以實現業務術語、元數據的追蹤,方便數據治理人員查詢使用。業務術語管理指在組織內制定統一的管理制度和流程,并對業務術語的創建、維護和發布進行統一的管理,進而推動業務術語的共享和組織內部的應用。通過對業務術語的管理能保證組織內部對具體技術名詞理解的一致性。

2、業務規則:是描述業務應該如何在內部運行,以便成功地與外部世界保持一致。通常在軟件中實現,或者使用文檔模板輸入數據,如主數據,通常規定了主數據格式和允許的取值范圍。

3、命名規范:是能夠完整準確表述業務含義。名稱符合、行業內的通用命名習慣。

4、技術規范:是對標準化的對象提出技術要求,也就是用于規定標準化對象的能力。當這些技術規范在法律上被確認后,就成為技術法規。技術規范是標準文件的一種形式,是規定產品,過程或服務應滿足技術要求的文件。它可以是一項標準(即技術標準)、一項標準的一部分或一項標準的獨立部分。其強制性弱于標準。

結束語

數據治理相關術語很多,數據治理術語管理包括術語的識別、創建、審定、發布、變更、應用、宣貫、考核等活動,應定義組織統一的管理流程,并以組織級管理文件正式發布。在一個組織里,術語定義應由業務部門、數據管理部門共同參與制定,并以業務術語標準作為業務術語的載體,通過對業務術語標準的定期復審和修訂,保持業務術語的準確性、即時性。


(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢