- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2023-04-17來源:念念不忘瀏覽數:166次
BI 工具,雖說叫 BI,但對 BI“智能”的實現其實作用甚微,名相如實不相如,就像現在的 AI 一樣,都說自己智能,但其實并沒有,大家都是在路上,離終點還很遠,上了 BI,也還離 I 很遠想要讓 BI 更 I 更智能,首先要明確目標,不要走偏;其次要注重 BI 工具數據處理的能力,比如能否做好關聯分析,讓 BI 可以勝任更多的分析場景;然后還需要有其他分析工具來補充,比如報表工具,實際上,用戶每天看的用的也主要是報表
可視化喧賓奪主
BI 分析孱弱無力
而這些簡單的單表分析也就占到整體分析需求的 10%,做到這些離智能分析還差的很遠很遠
再往下看這些有多表關聯的,這一部分大約占 20%-30% 左右,大部分 BI 工具就做不好了 查詢北京號碼打給上海號碼的通話記錄,需要通話記錄表和賬戶記錄表重復多次關聯 查詢中國經理的美國員工,需要員工表和部門表相互關聯 一些表中有父 ID 和子 ID 查詢時需要自己和自己關聯 按日期統計合同額、回款額和庫存金額,如果沒有事先準備好寬表,又會涉及多個表的關聯 等等......關聯關系太復雜,看不懂,業務人員就基本都不會拖拽了,只能求助技術人員來幫忙整理數據了,做成寬表或者類似寬表的 CUBE,然后給業務人員來用
再遇到下面這些占更大比例,60%-70% 的,帶有復雜計算(多步、過程式計算)的,就更是都啞火了,不是做不好,而是做不了了 列出銷售額累計占到一半的前 n 個大客戶 查看一下語文、英語和數學成績都在前 10 名的學生都有誰 查查哪些半年不出單的客戶在更換了銷售人員后半年就出單了 找出 3 年內的銷售冠軍以及他們賣的最好的產品 計算某支股票最長連續漲了多少交易日而這些有關聯的,有復雜計算的分析需求,恰恰才是更有業務意義、能給企業帶來價值的、企業真正需要的分析,BI 工具做不了這些,那就只能成為擺設,自然也就智能不起來了
然而這些并不影響 BI 的火爆,因為這個沉痛的結論在前期的調研和試用中是發現不了的,廠商演示的數據和操作都是提前準備好的,用戶試用時也基本都是先找最簡單的來測試,演示和測試的重點也基本都放在了功能的驗證上,什么切片旋轉下鉆,是否流暢美觀等,并沒有考慮處理數據的能力,直到采購上了 BI,真正使用了,由淺入深,由簡入繁后才慢慢發現,真正需要做的分析任務其實做不了多少(以后測試 BI,可以用上面提到的那些 BI 都做不好的例子去驗證)到最后,上 BI 的結果經常成了面子工程,最后得到的,僅僅是一些可視化效果,最需要的 BI 交互分析功能反而成了擺設,沒多大用了幾十萬的 BI 工具都最終成了擺設,難道商業智能,業務人員做交互分析的需求就實現不了了嗎?BI 系統應該如何建設才能讓商業真正智能呢,讓 B 更 I 呢?
怎樣更 I 更智能?

能解決關聯分析的難題,才能做更多有意義的分析,才能給企業提供更多科學的決策依據,才能更接近智能,所以一定要重點考察關聯分析的能力,可以用前面提到的幾個關聯分析例子去驗證各個產品前面的例子中我們可以看到,一些涉及復雜多步,過程式計算的分析,BI 就做不了了,這是因為 BI 的定位是讓業務人員拖拽分析,而拖拽不可能實現復雜的計算步驟,捋清楚復雜的計算邏輯也根本和業務人員的角色定位不符業務人員做不了,那就只能通過技術人員來做了,這類復雜的分析占比通常又比較大,技術人員手工做也不現實,效率太低,成本太高,一般都會用報表工具來做要做的復雜分析多,而且分析還隨需而動,報表也就得跟著隨需而動,總會做新的或者改舊的,這就需要報表工具的效率高一些才行,否則不僅會大量的浪費技術人員的工作量,還會影響智能分析的效率和效果報表效率體現在兩方面,一個是制表效率,一個是數據準備效率,而且后者更重要就好比上面的這些 BI 做不了的復雜計算的分析,它做不了,并不是因為格式復雜,而是因為計算復雜,就算是報表來做,同樣復雜,得寫大段的 SQL 才能算出來,沒有幾年經驗的同學寫不了另外大數據時代的數據,不僅數量大,而且很雜,有 RDB,有 NOSQL,有文件、json,有 MPP、 Hadoop,企業要做的分析,常常會涉及多源混算,有時候不得不用 JAVA 來寫,數據準備就會更難,今天要做分析了,結果報表工程師搞不定數據,得找高級工程師先幫忙來準備數據才行,這就把分析和決策耽誤了,也談不上什么智能了,所以要有良好的數據準備能力才行但不幸的是,并沒有多少報表工具在數據準備上下過功夫,大部分還得是高級技術人員去硬寫 + 硬算,目前只有潤乾報表有專門的數據準備工具
在潤乾報表中,多了一個SPL 集算器的數據計算層(SPL 本身是一個流行的開源計算工具),這個計算層就是專門用來做數據準備的,它支持多樣性數據源的混算,可以高效的代替 JAVA、存儲過程來做數據準備,而且初級工程師學幾天就可以上手,能進一步保障分析的及時性和準確性另外這個 SPL 準備好的數據,不僅能給報表用,也能給 BI 多維分析用,或者導出 EXCEL 做桌面分析用,也能讓業務人員進行更多需要復雜計算的分析了想了解 SPL 是怎么簡單的做多步計算的同學,可以看這個帖子,帖子里有很多高效計算的例子:SQL 為什么動不動就 N 百行以 K 計有了報表輔助后,BI 做不了的分析就可用報表來做了,BI 的短板補上以后,BI 的建設也就離智能更近一些了現在市面上大部分的 BI 產品都是通用 BI 廠商提供的,通用 BI,目標就是通用,各行業都可以用,什么業務角色都可以用,誰都可以用,電信行業的用起來合適,金融行業用起來也服帖,但這不用思考都知道不可能,想讓誰都能用好,造成的結果肯定是誰都不好用如果由有行業經驗的專家參與,進行專業化設計,那結果就會有巨大不同有了行業經驗才知道這個行業需要分析什么,業務用戶關心什么、常用的是哪些,需要哪些數據,就可以把常用分析需要的數據源提前準備好,避免臨時修改或者重新做 CUBE(如果用潤乾報表 DQL,做這一步會更方便)有了行業經驗才知道哪些參數指標需要做活或做死,界面才會方便,比如現在有很多標簽屬性(是否值,客戶是不是大學生,有沒有信用卡),數量可能達到幾百上千,通用 BI 會把這些都當成維度統一處理,讓用戶對著成百上千個維度去拖拽,不僅界面難用,能不能找到想要的標簽都是個問題,有行業經驗的開發商則會把標簽按業務合理分類后再呈現出來供用戶拖拽,,就會好用很多。還有些標簽、維度是聯動的,選了某個,其它維度的可選范圍會跟著變,有經驗的行業開發商就會把它提前做好聯動,選起來就會更快捷方便,而通用 BI 產品是不會知道這些的(或者就需要很復雜的表達式甚至腳本來定義)有了行業經驗才會更了解用戶的使用習慣,更懂用戶,有些維度或條件可能還會有行業甚至用戶特有的輸入方式,比如股票區間可能希望看著 K 線圖去找,這些都有強烈的行業特色,對行業了解足夠深才能把握用戶這些習慣,并根據習慣來優化功能,還可以把一些行業內常見的多步計算事先封裝好,業務用戶可以直接引用。各行業還有自己的內部文化、知識、語境等,深耕行業常和用戶泡在一起的軟件企業才會感知到這些細節,更懂用戶才能做出業務人員更容易理解、更方便使用的界面,而通用 BI 則不可能做到這一點,它的普適定位和行業專精本來就是沖突的,只會提供通用抽象的技術術語和統一的界面,這就會造成不管是哪個行業用起來都不是很貼近的感覺有了行業經驗還能防范技術風險,數據開放給用戶后,很有可能會做出不規范、不合理的拖拽,這就會帶來性能問題,造成卡頓,或者直接把后臺數據倉庫給拖死了,行業經驗支持下的交互界面,對應的后臺計算是設計過的,計算量可控,定制界面還可以對計算量巨大的動作做出限制,這樣后臺數據倉庫也能撐住了,避免了性能問題隱患所以 BI 要想真正智能, 必須得走行業化,專業化才可以,這個要求通用 BI 廠商就明顯滿足不了了,它們的普適定位和行業專精本來就是沖突的,得由行業軟件開發商來做行業化甚至是針對用戶特制的 BI 才可以然而行業軟件開發商,雖然有行業知識和經驗,有潛力把 BI 做的更貼近用戶,讓分析更加智能,但其實他們做起來也很難自己從頭去做一個 BI,工作量和難度都太大,不太現實。CUBE 雖然簡單,但其數據處理和界面仍然有不少的內容,BI 廠商也耕耘了不少年頭,完整復制并沒那么容易。如果能基于現成的通用 BI 產品再來改造定制,那就輕松多了,可惜,商用的 BI 工具大都是不開源,對外接口也很簡單,無法支撐深度改造定制的可能性。幸好開源 BI 還挺多,國外的有不少,國內的也有潤乾的開源 BI,中文頁面更好改,而且潤乾專注于 BI 報表行業 20 年,也更懂國人的 BI在行業經驗的加持下改造過的 BI 解決方案就會比通用的 BI 產品更好用,業務用戶能做的交互分析也就更多更輕松了,BI 也就更智能一些了
總結