日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

數據中臺元數據標準

時間:2022-10-02來源:為你披衣瀏覽數:244

2015年誕生,2019年爆火,在最火的時候被很多人當成了“無所不能”的“萬能藥”,只要是IT的問題,就一個藥方——上“中臺”!于是乎,很多企業都爭先恐后,紛紛走上了上中臺的路。

但似乎“好景”不長,2019年末“中臺”的大潮還未退卻,就已經傳出了對中臺的質疑聲——“中臺,我信了你的邪!”。

到了2020年對中臺的質疑、唱衰、乃至討伐的聲音更是此起彼伏,中臺似乎徹底跌下了“神壇”。

而作為眾多“中臺”核心成員之一的“數據中臺”,似乎成了“中臺”家族的最頑強的那個,在經歷過“追捧”和“質疑”等種種考驗后,數據中臺正在用事實驗證其價值!

01 關于數據中臺

數據中臺可以看作是數據的“公共服務平臺”,即通過數據技術,對海量數據進行采集、計算、存儲、加工,同時統一標準和口徑,形成標準數據,再進行存儲,形成大數據資產層,進而為客戶提供高效服務。

在筆者看來,數據中臺最重要的不是中臺而是數據,但“純粹”的源數據嚴格來說還也不是數據中臺的一部分,需要將其加工、處理、標準化形成數據服務和數據產品,而這一過程中,離不開元數據的支撐。元數據——是數據中臺的靈魂。

02 關于元數據

元數據(Metadata),元數據是關于數據的組織、數據域及其關系的信息,簡言之,元數據就是描述數據的數據。元數據與數據的不同之處在于元數據描述的不是特定的實例或記錄,IT和業務都需要高質量的元數據來理解現有數據。元數據是一種數據類型,以數字方式描述企業的數據,流程,應用程序,資產,業務概念和或其他感興趣的事物的人員,時間,地點,原因以及方式,元數據為企業數字資產的內容提供了上下文。更簡單的說,元數據是對數據的結構化描述,使得數據更容易理解、查找、管理和使用。我們也可以用5W1H模型來理解元數據:

表1:元數據定義

知識類型

定義

技術示例

業務示例

Who

誰負責數據的接口的開發?

誰是財務業務域的負責人?

What

干什么或是什么

CRM和DW之間的數據血緣關系是什么?

企業市場管理業務域的指標體系都包含哪些指標?

When

什么時候

提取,轉換和加載(ETL)作業什么時候運行?

我正在分析的數據上次刷新是什么時候?

Where

在哪里

在我們的IT環境中,服務器的運行容量不足40%?

我們在哪里可以找到按營銷活動顯示我們的社交媒體分析的報告?

How

怎么樣,怎么做

如何設置數據質量的管理規則

如何獲得產品的競爭優勢?

Why

為什么

數據質量問題的根本原因是什么?

為什么老客戶會不斷的流失?

03 元數據分類

根據數據的性質特點,業內一般將元數據劃分為三類:業務元數據、技術元數據和操作元數據。

業務元數據是描述數據的業務含義、業務規則等。通過明確業務元數據讓人們更容易理解和使用業務元數據,元數據消除了數據二義性,讓人們對數據有一致的認證,避免“各說自話”,進而為數據分析和應用提供支撐。常見的業務元數據包括:業務定義、業務術語、業務規則、業務指標等。


技術元數據是對數據的結構化,方便計算機或數據庫之間對數據進行識別、存儲、傳輸和交換。技術元數據可以服務于開發人員,讓開發人員對數據的存儲、結構更明確,從而為應用的開發和系統的集成奠定基礎。技術元數據也可服務于業務人員,通過元數據理清數據關系,讓業務人員能夠更快速的找到想要的數據,進而對數據的來源去向進行分析,支持數據血緣追溯和影響分析。常見的技術元數據包括:存儲位置、數據模型、數據庫表、字段長度、字段類型、ETL腳本、SQL腳本、接口程序、數據關系等。


操作元數據描述了數據的操作屬性,包括管理部門、管理責任人等,通過明確管理屬性,有利于數據管理責任到部門和個人,是數據安全管理的基礎。常見的操作元數據包括:數據所有者、數據質量定責、數據安全等級、數據訪問權限,數據處理作業的結果等。


表2:元數據分類實例

元數據類型

元數據

元數據描述

元數據實例

業務元數據

業務定義

數據的含義

客戶的完整名稱,并具有法律效力

業務規則

數據錄入規則

企業的營業執照、組織機構代碼證書,統一社會信用代碼證書等具有法律效力的證明文件中的中文名稱全稱

識別規則

識別規則

企業的組織機構代碼或者統一社會信用代碼或者統一納稅號必須完全匹配,則認為是同一客戶。

質量規則

質量規則

客戶名稱為非空,并且與營業執照的中文名稱一致

技術元數據

存儲位置

數據的存儲什么地方

ERP系統

技術元數據

數據庫表

存儲數據的庫表名稱和路徑

ERP/Customers

技術元數據

字段類型

數據的技術類型

字符型

技術元數據

字段長度

數據存儲的最大長度

[200]

操作元數據

更新頻率

數據的更新頻率

每年更新一次

操作元數據

管理部門

數據責任部門

客戶管理部

操作元數據

管理責任人

數據責任部門

客戶管理部業務員

04?數據中臺元數據標準

以上我們回顧了數據中臺和元數據的相關概念,接下來我們重點介紹下這份標準。

《數據中臺 元數據規范》是由浙江省標準化研究院支撐、杭州玳數科技有限公司牽頭起草的全國首個 《數據中臺 元數據規范》團體標準正式批準發布,該標準作為我國數據中臺領域第一個團體標準,填補了國內數據中臺元數據的標準空白。

該標準通過了來自浙江大學、浙江省數字化與設計制造創新中心、阿里云等行業內專家評審,為推動數字行業標準化提供了樣板,填補了我國數據中臺元數據標準空白,也為困擾行業多年的“數據孤島”問題找到了解決之道。該標準規定了數據中臺元數據的元模型、描述方法、擴展要求、校驗等,適用于數據中臺的數據集編目、建庫以及數據交換、數據集成等。本標準的發布和實施,將為有關企業、部門建設數據中臺提供支撐,實現數據互聯互通、資源協調,打破“數據孤島”,充分發揮各類數據價值,助力浙江數字經濟高質量發展。



(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢