對這個問題有幾種解讀,第一種解讀是說企業是否要構建自己的數據中臺,這個問題有沒有標準?以這個問題來講的話,我們認為所有的企業它都需要數據中臺,因為他需要從數據里面獲得洞察,從數據里面獲得它業務經營的指導。

那么這個問題的第二個解讀就是如何去度量和判斷數據中臺做得好不好?數據中臺做得好不好,有沒有給企業帶來價值?我們有一個非常簡單粗暴的度量方法,就是數據服務被業務系統和業務人員使用的滿意度如何?構建好的數據API繼續回答那個問題,第一我們認為數據中臺本身應該具備快速的將數據變成API的能力,而不需要讓技術人員一個一個去開發API。
數據中臺里面的六個能力里,數據中臺很重要的一個能力,就是數據服務的構建和治理。數據中臺要具備一鍵式的數據API的生成和一鍵式的發布,包括數據API的治理,比如說數據API的搜索,數據API的編排,數據API的發現監控,都要有。數據中臺之外,還有哪些方法進行優化?如何能更好的以業務驅動數據?除數據中臺之外,還有哪些方法來進行優化?我們認為數據中臺是一個體系,除了技術的因素之外,有一個非常重要的因素,那就是數據思維。
所以在構建數據中臺的同時,企業一定要加強培訓,讓業務人員具備數據思維。數據思維是數字化的系統里面的這種語言和交流方法,所以我們在構建數據中臺的同時,一定要有配套的培訓,配套的技能培訓、理念培訓。配套的這種案例分享,讓業務人員知道行業里面其他的這種公司,其他的行業再用數據做什么,只有這樣的話,數據中臺能得到更廣泛地使用,才能得到業務部門的認可,否則的話會像原來的傳統數據湖那樣不被業務所接受。在這一點上我們又會發現,現在數據中臺所受到的歡迎,不僅僅是受業務人員的歡迎,它也很受技術人員的歡迎。那些原來做
數據倉庫,做數據湖的技術人員,離業務太遠,他們做的東西開發出來了,然后給到業務,業務說不行,這東西不是我要的,但實際上他們很苦逼的是在最早的時候,這就是業務部門提供給他的需求,等于是前面提的需求后面又發生了變化,他們就很痛苦。
所以根本的原因是什么?根本原因是他們太依賴于數據本身,業務人員不懂數據,技術人員不懂業務,這是原來數據平臺的這種團隊和業務團隊脫節的地方。那么數據中臺,我們認為它從結構上,從理念解決了這些問題。
第二點是業務驅動數據
但是業務要懂數據,數據要懂業務,它倆之間是要拉通的,否則的話業務提供出來的需求很多時候是不具可行性的,或者說它是用原來的技術和方法思維再提需求,它在提需求的本身已經提出了對這個問題的設計。所以它倆之間一定要是拉通的,所以業務價值出發。
第三點是小步迭代,不斷的去優化和演進的,而不是做大而全的這種數據系統。
第四點是要持續的改進,持續的去運營。
數據的系統有一個特別典型的特點,那就是不確定性。每個企業都希望自己的河水跑得更快,如何在這樣河水里面去做系統?怎么去操作?怎么樣去產生業務價值?很重要的一點就是不斷的持續優化,隨著你河流水的速度,水的溫度,水的配方,就是它的里面的元素不一樣,你要產生不同的應對的方法。
數據中臺的產品化和定制化比例,是個很好的問題。剛才我們回到這個圖,還是回到這個圖,這個圖就很清楚。這里面灰色的部分我們認為是存儲、采集,除了集成工作之外這些東西,這些部分相對是比較標準的,結構化,有結構化的存法,非結構化有非結構化的存法,然后你的IOT的數據有IOT的產品去存儲,所以這一部分基本上可以產品化,可以用開源的套裝或者是產品化去解決。然后在這個數據資產的共享和協作這一塊,基本上百分之百都是要定制的,因為不同企業的數據模型,企業里的數據安全的管理方式都是不一樣的,所以這一部分數據資產從規劃到治理到共享到協作這一塊,可能里面有的小部分的組件可以產品化,但是對于數據資產的管理來講,一定是要控制在企業自己的手里,也就是說它的知識產權和它的技術核心是要掌握在企業自己手里面的,因為數據資產未來是一個最重要的資產,它的數據安全性是企業里面重要的命脈,然后至于業務價值的探索和分析,這個相對來講可以有一部分的產品化,比如說像現在行業里面的data庫這樣的數據科學平臺,比如說像有的行業里的這種機器學習平臺,它部分跟你的業務關聯,但是業務關聯不是那么的大,它是比較偏技術的,這部分是可以用。然后你的數據服務的構建和發布,還有治理這一塊,我們覺得有技術能力的企業盡可能的還是自己研發,你可以用開源的產品,因為你從數據到數據產品的構建過程,實際上也是非常核心的企業的競爭力。
最后數據服務的度量和運營,這個一定是客戶化的,因為凡是涉及到數據資產的,當然這里面我們再提另外一個概念,數據資產在很多時候被認為是原數據,那些繞Z是數據資產,但是我們現在認為數據資產不僅僅是包括地產,還包括那些二次加工的數據產品,還包括我們的數據報表,包括我們的數據服務,所有能夠產生價值的數據的資源都叫數據資產,所以與數據資產相關的我們認為盡可能的定制,因為它是企業的核心資產,它要變成企業的核心能力。所以這樣來看,我們總結一下,基本上產品化和定制化的比例,我們認為可能在三七,也就是30%的純產品,70%的定制。
投資行業如何解決數據中臺產品的跨行業問題。
這是一個比較有意思的行業,因為我知道投資行業,它跨的維度非常的廣,雖然每個投資公司和非VCPE不一樣,他們的選擇的行業,選擇的投資航道不一樣,但是即使是同一個行業,他的里面的細分還是很多的。
所以這個問題坦率來講有一定的專業度,但是我們舉個例子,在17年的時候,我們做過一個數據資產創新平臺,實際上它就是現在數據中臺的前身,基本上是一樣的,只不過那時候數據中臺的名字還沒有產生。那個案例的客戶就是一個有五個業態,60多家企業的一個超大型的集團。
這個業態,它有航空業,有物流業,有倉儲業,有跨境電商,有通關貿易,還有供應鏈金融,這么多的這種行業,我們做數據中臺怎么做?很重要的一點就是抓最重要的數據先集成。比如說在那個項目里面,我們最先集成整合的核心數據是哪些?是用戶數據,訂單數據和支付數據。
這是第一,這樣的話,我們能快速地產生業務價值。
第二,構建數據資產平臺。我們把不同的業態,對它進行整個的data治理,我們把它叫精益
數據治理。精益數據探索是把這些不同業態的企業,它的信息化程度,它的核心梳理出來,我們如何確定它是不是數據資產呢?很重要的一個標準,就是他會不會被別人所調用,會不會產生價值?所以第一件事情,制定最核心的數,把最核心的數據變成價值。第二,建立全量的數據資產平臺,也就是數據資產目錄,現在這行業里面叫Data Catalog
這樣的話,不管他有多少行業,能我們都能夠抓住他最有價值的,最快速產生利潤的產生收益的這部分數據,同時又可以整個企業集團,在跨行業的高度上,把企業的數據資產梳理出來。所以這兩件事情是非常重要的。如何解決跨行業的問題呢?我覺得這個問題作為投資行業來講,如果你投的公司是不同的行業,你的數據中才有必要,跨行業可能有時候是不可能,有時候沒有必要,但是如果你希望說你投資的這些公司,跨行業之間產生價值拉通,把不同的行業變成一個貫穿的價值流,這個就很有意思,這個就跟我們17年講的案例是一樣的。它把原來五個業態的業務通過用戶訂單和支付穿在一起,在數據資產創新平臺上,利用現有的數據,融合了用戶訂單和支付產生了新的產品,構成了一個新的價值流,甚至創造了把過去五大業態的這些不同的API不同的服務,全部整合在一個平臺上的一個入口,然后營銷cos IS,這就是非常典型的一個跨行業的數據中臺案例。
(部分內容來源網絡,如有侵權請聯系刪除)