“數據可視化”
是一種使用技術手段表達數據分析師想法的藝術方式
大部分初學者理解的數據可視化≈畫圖表,這是十分“奶義務”的想法:數據可視化是一個需要理解數據、數據結構、數據交互原理、數據表達邏輯的復雜工作。在數據可視化之前,我們需要對原始數據進行大量的整理及精細化處理工作,這一步的技術平臺首選數據庫SQL。除了一般圖表,數據可視化有兩個方向很值得去嘗試:商業智能BI與復雜交互式圖表。
所以在這兒我推薦一個數據可視化的技能路線:

接下去將以“雙十一美妝數據價值挖掘”為案例,分點來介紹大數據分析庫—PetaBase、商業智能億信BI、Echart。
-
為什么很多數據類崗位都要求求職者具備SQL技能?
互聯網公司每天都需要處理大量數據,這些數據不可能都存儲在某個人的PC上。在這種情況下,方便協同工作的數據庫SQL成為通用的數據管理平臺。
比如我們來看一個例子 :
“雙十一美妝數據價值挖掘”
在數據可視化之前,我們需要對數據進行大量的處理工作,以“雙十一淘寶訂單數據”為例。
其數據量為27000+,包括7個原始字段:

下圖演示的是使用最強大的大數據分析庫—PetaBase處理數據的流程(演示是在Sublime中書寫SQL語句,在psql中執行代碼):
創建數據庫并導入csv數據
查看并刪除相關缺失值
列明修改及計算雙十一商品打折折扣力度

對于SQL,處理幾萬條乃至更大體量的數據,效率都是非常高,并且代碼不長,易于理解。
回到可視化,SQL作為數據可視化工作的第一步,完成了數據管理及清洗工作。
接下來我們來看看另外兩條路:用商業智能BI做數據商業價值挖掘?or?用交互式圖表表達數據內容。
億信BI —— 最好用的商業智能工具平臺!
如果你是一名市場數據分析師:需要分析產品銷量、地區排名、供需關系
或者是一名用戶研究分析師:需要了解客戶畫像、用戶組成、用戶習慣
亦或是一名產品運營分析師:關注在線人數、用戶日活、活動反饋
你都經常需要做一件事——向你的同事、老板、甲方表達你的研究成果。
這個時候商業智能BI是你最好的選擇。
商業智能BI是目前各大公司常用的數據工作和數據可視化平臺。它可以將數據進行快速準確的整合,并提供出結果圖表及決策依據,輔助決策。
而對于BI,目前最主流的工具平臺就是億信BI,適合中國人的大數據分析軟件。作為國內自主知識產權的商務智能工具,大數據分析軟件億信BI專為中國式復雜報表量身打造。類Excel在線設計器,支持多級表頭、表元合并,多級浮動、分組、斜線表元、多表體等復雜的報表樣式。純Web應用,通過瀏覽器上簡單的拖拽和拾取,即可隨心定義任意”格式復雜,信息量大”的中國式復雜報表工具。

接著上面的“淘寶雙十一數據案例”,該數據在清洗后,一共有19個品牌3196個商品,那么如果想了解不同品牌在雙十一的營銷手段(如“最大打折力度”、“銷售相關KPI指數”),可以通過億信BI來創建以下儀表盤:
核心指標及KPI框架設計
相關圖表制作


儀表盤設計及結果呈現
BI可以解決大部分可視化業務的需求,但它始終是既定好的圖表,只能優化組合,無法自由創作。數據可視化作為一種表達藝術,自然有更自由的工具和更有趣的表達方式
用一張圖來講故事
復雜交互圖表是一種蘊含更大體量數據及更復雜數據結構的可視化,可以使讀者和可視化圖表之間有更好的互動。其形式包括地理空間可視化、層次關系網絡可視化、基于時間的多圖表可視化等等。

使用Echarts的工作流可以簡單概括為:使用SQL將數據處理成合適的格式(這個格式稱為JSON),再讀懂echarts圖表中的JavaScript參數,修改對應參數并加載JSON數據,實現可視化效果。
