- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-10-02來源:為你披衣瀏覽數:244次
2015年誕生,2019年爆火,在最火的時候被很多人當成了“無所不能”的“萬能藥”,只要是IT的問題,就一個藥方——上“中臺”!于是乎,很多企業都爭先恐后,紛紛走上了上中臺的路。
但似乎“好景”不長,2019年末“中臺”的大潮還未退卻,就已經傳出了對中臺的質疑聲——“中臺,我信了你的邪!”。
到了2020年對中臺的質疑、唱衰、乃至討伐的聲音更是此起彼伏,中臺似乎徹底跌下了“神壇”。
而作為眾多“中臺”核心成員之一的“數據中臺”,似乎成了“中臺”家族的最頑強的那個,在經歷過“追捧”和“質疑”等種種考驗后,數據中臺正在用事實驗證其價值!
數據中臺可以看作是數據的“公共服務平臺”,即通過數據技術,對海量數據進行采集、計算、存儲、加工,同時統一標準和口徑,形成標準數據,再進行存儲,形成大數據資產層,進而為客戶提供高效服務。
在筆者看來,數據中臺最重要的不是中臺而是數據,但“純粹”的源數據嚴格來說還也不是數據中臺的一部分,需要將其加工、處理、標準化形成數據服務和數據產品,而這一過程中,離不開元數據的支撐。元數據——是數據中臺的靈魂。
元數據(Metadata),元數據是關于數據的組織、數據域及其關系的信息,簡言之,元數據就是描述數據的數據。元數據與數據的不同之處在于元數據描述的不是特定的實例或記錄,IT和業務都需要高質量的元數據來理解現有數據。元數據是一種數據類型,以數字方式描述企業的數據,流程,應用程序,資產,業務概念和或其他感興趣的事物的人員,時間,地點,原因以及方式,元數據為企業數字資產的內容提供了上下文。更簡單的說,元數據是對數據的結構化描述,使得數據更容易理解、查找、管理和使用。我們也可以用5W1H模型來理解元數據:
表1:元數據定義
根據數據的性質特點,業內一般將元數據劃分為三類:業務元數據、技術元數據和操作元數據。
業務元數據是描述數據的業務含義、業務規則等。通過明確業務元數據讓人們更容易理解和使用業務元數據,元數據消除了數據二義性,讓人們對數據有一致的認證,避免“各說自話”,進而為數據分析和應用提供支撐。常見的業務元數據包括:業務定義、業務術語、業務規則、業務指標等。
技術元數據是對數據的結構化,方便計算機或數據庫之間對數據進行識別、存儲、傳輸和交換。技術元數據可以服務于開發人員,讓開發人員對數據的存儲、結構更明確,從而為應用的開發和系統的集成奠定基礎。技術元數據也可服務于業務人員,通過元數據理清數據關系,讓業務人員能夠更快速的找到想要的數據,進而對數據的來源去向進行分析,支持數據血緣追溯和影響分析。常見的技術元數據包括:存儲位置、數據模型、數據庫表、字段長度、字段類型、ETL腳本、SQL腳本、接口程序、數據關系等。
操作元數據描述了數據的操作屬性,包括管理部門、管理責任人等,通過明確管理屬性,有利于數據管理責任到部門和個人,是數據安全管理的基礎。常見的操作元數據包括:數據所有者、數據質量定責、數據安全等級、數據訪問權限,數據處理作業的結果等。
表2:元數據分類實例
以上我們回顧了數據中臺和元數據的相關概念,接下來我們重點介紹下這份標準。
《數據中臺 元數據規范》是由浙江省標準化研究院支撐、杭州玳數科技有限公司牽頭起草的全國首個 《數據中臺 元數據規范》團體標準正式批準發布,該標準作為我國數據中臺領域第一個團體標準,填補了國內數據中臺元數據的標準空白。
該標準通過了來自浙江大學、浙江省數字化與設計制造創新中心、阿里云等行業內專家評審,為推動數字行業標準化提供了樣板,填補了我國數據中臺元數據標準空白,也為困擾行業多年的“數據孤島”問題找到了解決之道。該標準規定了數據中臺元數據的元模型、描述方法、擴展要求、校驗等,適用于數據中臺的數據集編目、建庫以及數據交換、數據集成等。本標準的發布和實施,將為有關企業、部門建設數據中臺提供支撐,實現數據互聯互通、資源協調,打破“數據孤島”,充分發揮各類數據價值,助力浙江數字經濟高質量發展。

