日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

數據中臺的OneID是個什么鬼,主數據它不香嗎?

時間:2023-06-27來源:蘇葉瀏覽數:754

數據中臺是在有了數據之后,在中臺進行數據治理,形成數據資產并提供數據服務。而主數據更強調在數據產生之前定義數據標準,建立數據管理流程,并在數據產生的過程中對數據質量進行校驗,從源頭進行數據治理。

這個問題一直困擾了我很久,在阿里的數據中臺中,有三個主要的組成部分OneID、OneData和OneService。我之前寫的一篇文章曾對阿里的數據中臺做過解讀,見《什么是One Data體系?阿里數據中臺解讀》。

在這篇文章中,筆者曾提到OneID的本質就是主數據,只是用的不是傳統的主數據管理技術。

這篇文章發布后,很多讀者朋友給我留言,告訴我OneID和主數據不是一回事,但沒有一個人給我講清楚這兩個概念為什么不是一回事。

今天我們好好捋一下這個問題!

一、OneID和主數據到底是不是一回事?

在阿里巴巴 OneData 體系中,OneID 指統一數據萃取,是一套解決數據孤島問題的思想和方法。

如果單看這個定義,你一定也會和我一樣懵逼,啥是數據萃???解決數據孤島問題,主數據不也是干這個事情的嗎?

別急,我們慢慢分解,先來看OneID到底是干啥的。

OneID也叫 ID-Mapping,就是將設備ID(例如手機MAC、IMEI、IMSI等),手機號、身份證號、郵箱地址、PC端的Cookie,用戶名等信息,結合標簽體系、知識圖譜、機器學習等技術和算法,將各種 ID 都映射到統一的ID上。也就是說不論用戶用什么ID登陸,不論登陸的是PC端還是手機APP,都能識別到他的一個唯一身份。

OneID干的這個事情是不是和主數據有點類似?主數據也是給數據對象賦予一個唯一的編碼(身份)。

但是,不得不承認,OneID和主數據還是有很大區別的,如下:

第一,解決問題的環境不同。OneID主要是解決ToC業務,不同渠道、不同數據來源的用戶身份的統一映射和識別問題,例如:PC端、移動APP,微信小程序、相關應用系統等。而主數據是對相同數據對象進行標準化定義并賦予唯一編碼,更多的是用ToB業務中,解決企業內部異構系統之間數據不一致問題。

第二,解決問題的“地點”不同。OneID是把各類UID信息匯聚在一起,在一個地方進行加工和處理,最后形成統一的Mapping關系,阿里管這個地方叫做“數據中臺”。而主數據強調的是從源頭統一標準,定義唯一編碼,各異構系統都依據統一的標準執行,映射關系是建立在各異構系統中的。

第三,解決問題的技術不同。OneID是典型的OLAP技術,是在產生數據之后通過大數據分析、人工智能算法等技術將各種 UID 都映射到統一的ID上。而主數據是典型的OLTP技術,其本身是對數據的增刪改查操作,例如客戶主數據的定義和編碼。

二、數據中臺為什么需要OneID?

說起這個問題可能要追溯到“遙遠”的互聯網PC時代了。

在PC時代,各大網站都是通過Cookie記錄用戶信息的,網站為每一個訪問者賦予一個唯一的ID,并將這個ID以文本的形式寫入用戶本地,這個文本就是Cookie。

筆者最早接觸這項技術已經是18年前了,當時筆者所在公司的主要業務是網站運營和企業建站。筆者有幸參與了一個澳洲購物的電商網站開發,那時候,公司小、團隊分工也不明確,一個人要干N個人的活,但真的很鍛煉人,網頁設計、裁圖、前臺頁面、后臺程序都摸了一個遍。因此,也摸清了互聯網公司記錄用戶信息的技術和手段。

實際上,從用戶第一次訪問網站開始,無論瀏覽的是哪個頁面都會調用網頁的一個腳本程序,這個程序給訪問者定義一個唯一ID并寫入到Cookie中,之后用戶的一些關鍵操作都可以記錄Cookie中,例如:加入購物車、下單等?;ヂ摼W網站就是通過Cookie來進行用戶的身份鑒別和跟蹤會話。

這項技術一直沿用至今,它為互聯網公司收集和積累用戶信息,建立標簽體系、實現用戶畫像起到了重要的作用。

后來,隨著智能手機的興起,移動互聯網的時代來了,人們訪問網站的渠道更加豐富和多樣。在移動互聯時代,對用戶ID的識別,不再是單一的Cookie,而是不同類型設備的ID,例如:Android設備的唯一編號(IMEI,MEID,ESN,IMSI),IOS系統的設備的唯一編號(UDID、UUID)等。同時,不同APP的用戶登陸ID也不同,例如:手機號、電子郵箱、用戶名等。

互聯網公司為了數據的最大化利用,就需要將這些不同渠道、不同來源的“ID”進行統一拉齊和打通,將PC時代累計下的數據資產進行跨渠道共享,從而實現用戶的精準畫像、多渠道觸達和智能推薦。數據中臺的OneID體系干的就是這個事情,為數據資源的最大化利用奠定了基礎。例如:阿里數據中臺就是基于OneID技術,實現了消費端、廣告端、支付端、娛樂端等業務板塊用戶ID的打通,并通過這個統一 ID,關聯起各個孤島的數據,實現數據通融,進一步實現完整的用戶畫像和準確的數據應用。這就有了你在百度上搜索了“養生”,到淘寶網站上就會給你推薦“枸杞”。

三、OneID和主數據的實現原理

OneID是對不同渠道、不同來源的的“ID”進行統一拉齊和打通,其實現原理如下:

為了方便理解,這里給出的例子是比較簡單的,但在實際實施過程中,其應用要復雜很多,例如:相同ID的值不一致怎么辦,重復的ID如何合并,ID信息發生變化如何更新,Mapping表的更新頻率如何設置等等,這些問題就需要結合具體場景解決了。

我們再來看看主數據管理(MDM)的工作原理:

主數據管理強調在源頭治理,即:在數據源系統定義實現主數據的標準化,生成唯一主數據編碼,并通過主數據系統分發標準數據到相關消費系統進行使用,消費系統只有查詢和使用權不能對主數據進行“增刪改”。另外,不同主數據的來源系統不同,如在這個例子中的客戶主數據來源為CRM,物料主數據的來源為MDM,ERP系統和數據倉庫是主數據的消費系統。

四、有了數據中臺,還需要主數據嗎?

在很多數據中臺的解決方案中,主數據是數據中臺的一個組成部分。例如在數字平臺解決方案中,數據中臺是由數據集成、數據存儲、數據倉庫、開發建模、數據資產管理、數據管控、人工智能與行業模版等多個部分組成。其中,數據管控模塊中就包含了主數據治理,如下圖:

圖:數字平臺解決方案

很多人都有個疑問,數據中臺中既包含了數據采集/數據移動的能力,也包含數據服務共享的能力,同時還具備元數據、數據質量、數據安全等數據治理能力,有了數據中臺,為什么還需要主數據管理?

數據中臺通過數據采集、清洗、治理,再以標準接口服務的形式提供出去,供其他系統調用,這確實是數據中臺的核心能力。從功能的角度,主數據管理也的確有類似的功能,例如:主數據采集、主數據清洗、主數據服務等。

但是,我們之前也說過,主數據與數據中臺解決的問題并不相同。

數據中臺是在有了數據之后,在中臺進行數據治理,形成數據資產并提供數據服務。而主數據更強調在數據產生之前定義數據標準,建立數據管理流程,并在數據產生的過程中對數據質量進行校驗,從源頭進行數據治理。

因此,相對于數據中臺來講,主數據管理是一個后臺系統,它可以作為數據中臺的一個數據源為數據中臺供應高質量的數據。

設想一下:如果沒有主數據管理,從各個異構系統中采集到數據中臺的主數據(如:客戶、產品、供應商等)將有不同的定義和編碼,這就需要在數據中臺對這些不一致的數據進行統一治理,這將是一件非常痛苦的事情,而且不能從源頭上解決問題。因此在筆者看來,站在整體解決方案的角度,將主數據治理提前,對于傳統企業來講可能是不錯的解決方案。

寫在最后的話

廣義理解OneID,是指一個數據對象有且僅有一個ID。在本質上,OneID解決的問題和主數據編碼其實是一樣的,都是定義數據對象在一定數據環境下的唯一身份。它們是在不同的應用場景下(ToC或ToB),采用的兩個不同技術架構(OLAP或OLDP)的解決方案!

舉個不太恰當的例子,就如同我們餓了去吃飯一樣,不論是吃中餐還是吃西餐,不論用刀叉還是用筷子,最終目的都是解決饑餓問題。但是,吃中餐的時候我們一般用筷子,而吃西餐的時候一般用刀叉。當然,你用刀叉去吃中國火鍋也沒問題,只要你不嫌麻煩。同樣,你用OneID去解決主數據問題或者你用主數據解決OneID問題,都會一樣麻煩!

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢