小張大學(xué)畢業(yè)之后去了一家大公司,這家大公司有很多的業(yè)務(wù)數(shù)據(jù),整個業(yè)務(wù)已經(jīng)運(yùn)行了十幾二十年,在全國有幾十家的分支機(jī)構(gòu)、代理商,公司內(nèi)的大大小小的業(yè)務(wù)系統(tǒng)有十幾個,小張進(jìn)去之后他直接的領(lǐng)導(dǎo)給他分配了很多的內(nèi)容,其中有一項是很簡單的工作是做日報。怎么做呢?首先需要從各個系統(tǒng)里面把數(shù)據(jù)打出來、經(jīng)銷商的業(yè)務(wù)系統(tǒng)、自己的CRM、銷售管理系統(tǒng)、財務(wù)系統(tǒng)拿到各種各樣的業(yè)務(wù)數(shù)據(jù),把這些數(shù)據(jù)匯集起來進(jìn)行簡單的整理、梳理,梳理完之后把它形成各種各樣的圖表,并且把這個圖表放到Excel或者PPT里面拿去給領(lǐng)導(dǎo)做匯報。
所以他的日常工作就是:早上到公司就開始處理數(shù)據(jù),處理完數(shù)據(jù)之后形成各種各樣的圖表放到PPT里面,晚上9點下班之前把所有的數(shù)據(jù)報告全發(fā)出去。

過了一段時間之后他開始困惑,“我是來做數(shù)據(jù)相關(guān)的工作的,確實現(xiàn)在每天進(jìn)行的工作也都是數(shù)據(jù)相關(guān)的工作:做很多數(shù)據(jù)的處理、做很多數(shù)據(jù)的收集、清洗、整理、形成對應(yīng)的圖表,但是分析的工作在哪里?”小張發(fā)現(xiàn)他沒有分析的工作,所有的都是領(lǐng)導(dǎo)說“你幫我看某一個業(yè)務(wù)指標(biāo)、怎么計算一個業(yè)務(wù)指標(biāo)”,這些都是固定的流程。我們把它稱為“表哥表妹”的一天。
“表哥”“表妹”的一天
小張的工作其實和很多人的工作內(nèi)容完全一致,這也是當(dāng)前企業(yè)內(nèi)的實際情況。有以下幾個典型特點:
1、數(shù)據(jù)采集難;企業(yè)有自己的業(yè)務(wù)數(shù)據(jù)匯總系統(tǒng),由于每個業(yè)務(wù)系統(tǒng)的成熟度不同,所以里面的數(shù)據(jù)因為版本的變化會有很多數(shù)據(jù)的格式。有些字段沒有、有些字段有,數(shù)據(jù)情況復(fù)雜。甚至有些企業(yè)統(tǒng)計的數(shù)據(jù)還都是人工填報的,所以要把這些數(shù)據(jù)搜集起來異常困難。
2、數(shù)據(jù)處理難;因為數(shù)據(jù)的質(zhì)量有問題,所以需要去做大量的數(shù)據(jù)清洗工作,等到把這些數(shù)據(jù)補(bǔ)充完整之后,才能再拿它去進(jìn)行數(shù)據(jù)分析。
3、重復(fù)勞動非常多;為什么要重復(fù)勞動呢?剛才講了小張每一天都要做日報、每周做周報、每月做月報、每季做季報,但是這些報告只是數(shù)據(jù)表,時間變了其他的東西都沒有變,但是他依然要做大量的重復(fù)勞動。
4、分析結(jié)果分享難;小張可能需要通過郵件的方式跟領(lǐng)導(dǎo)做匯報跟其他的同事做分享,大家討論的內(nèi)容也沒有辦法留存,所以分享的過程也會變麻煩。
企業(yè)數(shù)據(jù)處理現(xiàn)狀
公司業(yè)務(wù)系統(tǒng)有很多,每個業(yè)務(wù)系統(tǒng)可能還有不同的版本。比如我們之前遇到的客戶全國有7-8個生產(chǎn)基地,每個基地都有自己的生產(chǎn)管理系統(tǒng),每個基地的生產(chǎn)管理系統(tǒng)版本基本上都不一樣,所以這是企業(yè)內(nèi)的特點。
對于IT人員,因為所有的系統(tǒng)每個地方都不一樣,要把這些數(shù)據(jù)全部匯聚起來就會變的非常困難,所以“我也很無奈”。
對于公司的“表哥表妹”們,要拿到這些數(shù)據(jù)也很困難,最后生生把“表哥表妹”逼成了程序員。
針對業(yè)務(wù)需求變化,可能每天都會有新的市場想法,會有各種各樣的營銷活動,營銷活動的數(shù)據(jù)拿到之后,我希望立刻看到業(yè)務(wù)對應(yīng)的報表或者數(shù)據(jù)報表,這些只能問后端的數(shù)據(jù)人員要。
對于數(shù)據(jù)人員,他要應(yīng)付很多重復(fù)的工作,同時還要應(yīng)付業(yè)務(wù)部門時刻變化的分析需求,因為人手少根本來不及,所以你先等一等,是IT人員應(yīng)對前端業(yè)務(wù)需求的常態(tài)。
即使最后我的每一個業(yè)務(wù)都讓后面的數(shù)據(jù)部門幫我做了分析,但是仍然很難把幾個月以來的數(shù)據(jù)分析全部串起來,做一個匯總之后做接下來幾個月的預(yù)測,這個對于原來企業(yè)來講是非常滯后的。
國外可視化產(chǎn)品發(fā)展現(xiàn)狀
了解了國內(nèi)的現(xiàn)狀,我們看一下國外現(xiàn)在是怎么做的。
國外其實目前針對企業(yè)數(shù)據(jù)可視化的領(lǐng)域大致來講大概是兩大類的產(chǎn)品:
1、實時的業(yè)務(wù)看板;主要解決的是我剛才講的“表哥表妹”最痛苦的事情,他們把每一天重復(fù)性的數(shù)據(jù)統(tǒng)計的工作把它變成實時的業(yè)務(wù)看板,當(dāng)業(yè)務(wù)部門有了一個新的業(yè)務(wù)需求之后,把它做成這樣實時dashboard,所有的數(shù)據(jù)全部是實時更新的,也就意味著動一份的數(shù)據(jù)報表只要做一次,以后所有的內(nèi)容全都是更新的,領(lǐng)導(dǎo)要看實時的看,不用再問我要對應(yīng)的東西。
2、探索式的商業(yè)智能;這里引入一個新的概念叫做探索式分析,國外數(shù)據(jù)的基礎(chǔ)比國內(nèi)要好,他們現(xiàn)在走的要比國內(nèi)快很多,快在什么地方呢?就是在探索式的商業(yè)智能,接下來我們對這個概念作個詳細(xì)拓展。
探索式分析詳解
目前企業(yè)內(nèi)的數(shù)據(jù)需求以驗證式分析為主,比如我想要知道本月利潤與本月成本的對比關(guān)系,會把這個需求交給數(shù)據(jù)分析員,然后他針對我們的需求輸出眾多數(shù)據(jù)報表。這個過程是我必須首先有個想法,有了想法之后再通過數(shù)據(jù)做驗證。驗證式的分析對數(shù)據(jù)的質(zhì)量有很高的要求,因為我們需要看到最終的結(jié)果,如果說數(shù)據(jù)質(zhì)量有問題,通過標(biāo)準(zhǔn)的模型可能得到一個錯誤的結(jié)果,所以分析師來講要做很多前期基礎(chǔ)工作。
那么探索式的分析呢?探索式的分析在企業(yè)中是很模糊的,我并不清楚從這些數(shù)據(jù)里面找到什么樣的規(guī)律、找到什么樣的模型、它們之間是什么關(guān)系,它可以通過數(shù)據(jù)本身呈現(xiàn)出來的內(nèi)容通過可視化的方法察看這些數(shù)據(jù),我們才能夠知道這背后的邏輯和數(shù)據(jù)之間的關(guān)聯(lián),這是我們稱之為探索式分析。
探索式分析通常能夠讓分析人員走到業(yè)務(wù)部門之前,可能在業(yè)務(wù)部門發(fā)現(xiàn)這個問題之前就告訴他們“你這個地方出問題了”探索式的分析和驗證式的分析我們一般把它稱之為企業(yè)數(shù)據(jù)分析的一陰一陽,只有陰陽協(xié)調(diào)了企業(yè)內(nèi)的數(shù)據(jù)分析才能走上正軌。
探索式分析應(yīng)該在企業(yè)內(nèi)處于什么位置?大家看到圖中灰色的部分,這部分叫做傳統(tǒng)的企業(yè)數(shù)據(jù)流程,業(yè)務(wù)場景中采集數(shù)據(jù),進(jìn)行數(shù)據(jù)的ETL,處理完之后有標(biāo)準(zhǔn)的算法模型產(chǎn)生對應(yīng)的數(shù)據(jù)可視化結(jié)果或者對應(yīng)的數(shù)據(jù)層,這是現(xiàn)有很多企業(yè)做的標(biāo)準(zhǔn)數(shù)據(jù)流程。
在這個流程之上其實缺少一個環(huán)節(jié)是什么?我有一個問題,算法模型和機(jī)器學(xué)習(xí)這些東西是從哪兒來的?很多分析師可能會講,這是我們針對公司內(nèi)的業(yè)務(wù)去做的一些經(jīng)驗的總結(jié),但是這個東西是后法,實際上是先有想法然后再去做總結(jié)。在這個過程中我們遺失掉了數(shù)據(jù)本身蘊(yùn)含的信息,所以國外現(xiàn)在提出的探索式分析的概念是在這個位置。
也就是說我們從數(shù)據(jù)最初的地方把數(shù)據(jù)拿進(jìn)來,讓數(shù)據(jù)告訴我們它里面含有什么樣的信息,我們有了這些信息之后去改進(jìn)算法、改進(jìn)模型、改進(jìn)分析的觀測角度和指標(biāo),然后再反過來發(fā)展業(yè)務(wù)。
在這個地方還要提一下,在很多可視化的效果里面,經(jīng)常會用一些3D的效果。我舉個最簡單的例子,當(dāng)我們把一個標(biāo)準(zhǔn)的餅圖變成一個3D立體的效果,誰能夠告訴我這個餅圖還能不能判斷的更準(zhǔn)確一些?當(dāng)我們把一個垂直的餅圖放平之后或者放45度角的時候是完全沒有辦法判斷角度和面積的,所以不要迷信3D圖形。
如果從實用角度看很多時候2D才能真正解決問題,但是3D圖形有3D圖形的用處。當(dāng)圖形的繪制者知道他自己的圖形將要拿出去做宣傳的時候,他一定會首先選用3D圖形,因為更好看、更炫、更酷,那個東西才更吸引眼球,為什么會吸引眼球呢?他需要花大量的時間,比2D圖形更多的時間去做判斷,這是我告訴大家為什么人喜歡炫酷的原因,不是因為它真的好看,而是你要花更多時間理解它的意思。
我們回到企業(yè)內(nèi)部這個東西要讓老板做決策,千萬不要給老板看各種各樣詭異3D圖形,老板肯定看很久還不知道你要表達(dá)什么意思,2D圖形在企業(yè)內(nèi)足夠解決問題。
剛才講了數(shù)據(jù)的類型、數(shù)據(jù)的關(guān)系、視覺處理的依據(jù)。有了視覺處理的依據(jù)之后我們需要進(jìn)行圖表的選擇,很多分析師做圖表選擇的時候都會犯一些錯誤,因為不同的圖表所表達(dá)的含義是不一樣的,有些可以用于進(jìn)行數(shù)據(jù)的比較和對比,有些可以用于察看數(shù)據(jù)的組成,有些可以用于察看數(shù)據(jù)得分析情況。當(dāng)然我列的并不全,有了這些之后我們才能夠?qū)?shù)據(jù)做我們所說的探索式分析。
國內(nèi)企業(yè)怎么做數(shù)據(jù)分析與數(shù)據(jù)可視化?
說了這么多之后,我們回過頭來看,當(dāng)前中國的企業(yè)需要一款什么樣的產(chǎn)品去幫助企業(yè)完成企業(yè)內(nèi)的數(shù)據(jù)分析,數(shù)據(jù)可視化的工作呢?
這里可以推薦億信華辰的各類工具,如果你想專門研究數(shù)據(jù)可視化這里可以推薦---酷屏。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)