- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2018-09-26來源:數據派THU瀏覽數:2166次
數據可視化,是指將相對晦澀的的數據通過可視的、交互的方式進行展示,從而形象、直觀地表達數據蘊含的信息和規律。
早期的數據可視化作為咨詢機構、金融企業的專業工具,其應用領域較為單一,應用形態較為保守。步入大數據時代,各行各業對數據的重視程度與日俱增,隨之而來的是對數據進行一站式整合、挖掘、分析、可視化的需求日益迫切,數據可視化呈現出愈加旺盛的生命力,表現之一就是視覺元素越來越多樣,從樸素的柱狀圖/餅狀圖/折線圖,擴展到地圖、氣泡圖、樹圖、儀表盤等各式圖形。表現之二是可用的開發工具越來越豐富,從專業的數據庫/財務軟件,擴展到基于各類編程語言的可視化庫,相應的應用門檻也越來越低。
數據可視化,不僅僅是統計圖表。本質上,任何能夠借助于圖形的方式展示事物原理、規律、邏輯的方法都叫數據可視化。
數據可視化不僅是一門包含各種算法的技術, 還是一個具有方法論的學科。一般而言,完整的可視化流程包括以下內容:

實際上,從“數據可視化”的命名,便很容易看出數據可視化從業者如何開始可視化設計,那便是:處理數據,設計視覺,完成從數據空間到可視空間的映射, 必要時重復數據處理和圖形繪制的循環組合。
1. 分析數據
首先,我們需要對數據做一個全面而細致的解讀,數據的特點決定著可視化的設計原則。每項數據都有特定的屬性(或稱特征、維度)和對應的值,一組屬性構成特征列表。按照屬性的類型,數據可以分為數值型、有序型、類別型,數值型又可以進一步分為固定零點和非固定零點。其中,固定零點數據囊括了我們大多數的數據對象,它們都可以對應到數軸上的某個點;非固定零點主要包括以數值表示的特定含義,如表示地理信息的經緯度、表示日期的年月日等,在分析非固定零點數據時,我們更在意的是它們的區間。
在對數據做過預處理和分析之后,我們就能夠觀察出待處理數據的分布和維度,再結合業務邏輯和可視化目標,有可能還要對數據做某些變換,這些變換包括:
2. 可視化設計
在開始設計之前,我們需要對人類視覺以及注意力作簡要分析,這決定著我們如何在第一時間抓住受眾的注意力。
人類視覺感知到心理認知的過程要經過信息的獲取、分析、歸納、解碼、儲存、概念、提取、使用等一系列加工階段,每個階段需要不同的人體組織和器官參與。簡單來講,人類視覺的特點是:
這里引入一個概念——可視編碼,它數據信息映射為可視化元素的技術,其通常具有表達直觀、易于理解和記憶的特性。數據包含屬性和值,相應可視編碼也由兩部分組成:標記和視覺通道,標記代表數據屬性的分類,視覺通道表示人眼所能看到的各種元素的屬性,包括大小、形狀、顏色等,往往用來展示屬性的定量信息。例如,對于柱狀圖而言,標記就是矩形,視覺通道就是矩形的顏色、高度或寬度等。
數據可視化的設計目標和制作原則在于信、達、雅,即一要精準展現數據的差異、趨勢、規律,二要準確傳遞核心思想,三要簡潔美觀,不攜帶冗余信息。結合人的視覺特點,很容易總結出好的數據可視化作品的基本特征:
3. 可視編碼的選擇
如同只學過視聽語言并不能設計出可用的電影分鏡一樣,數據可視化這一藝術設計色彩濃厚的工作絕非做過幾個餅圖、柱狀圖就能勝任。在開始涉足實踐講解之前,我們需要解決以下疑問:
可視化設計中優先選擇哪些視覺通道?有多少種視覺通道可供使用?某個視覺通道能編碼什么信息,能包含多少信息量?視覺通道表達信息能力的區別?哪些視覺通道互不相關而哪些又相互影響?
看看下圖,或許能從一定程度上給出答案:

上圖列舉了數據可視化作品中常用的視覺編碼通道,針對同種數據類型,采用不同的視覺通道帶來的主觀認知差異很大。數值型適合用能夠量化的視覺通道表示,如坐標、長度等,使用顏色表示的效果就大打折扣,且容易引起歧義;類似地,序列型適合用區分度明顯的視覺通道表示,類別型適合用易于分組的視覺通道。
需要指出的是,上圖蘊含的理念可以應對絕大多數應用場景下可視化圖形的設計“套路”,但數據可視化作為視覺設計的本質決定了“山無常勢,水無常形”,任何可視化效果都拒絕生搬硬套,更不要說數據可視化的應用還要受到業務、場景和受眾的影響。
4. 配色
相信每一個碼農出身的數據分析師在做可視化設計時,都會對色彩如何搭配產生過困惑。色彩理論看起來簡單卻又乏味,用起來卻不是那么得心應手。那么,如何讓數據可視化作品簡約、靈動、美觀?下面介紹一些通用技巧。
1)色調與明度的跨度都要大
要確保配色非常容易辨識與區分,它們的明度差異一定要夠大。明度差異需要全局考慮。但是,有一組明度跨度大的配色還不夠。配色越多樣,用戶越容易將數據與圖像聯系起來。如果能善加利用色調的變化,就能使用戶接受起來更加輕松。對于明度與色調,跨度越大,就能承載越多的數據。下圖展示了相同色系下不同明度的色階對比:

2)仿照自然的配色
各行各業的設計師都知道這個小秘密,對于數據可視化工程師而言,這招更是屢試不爽。一個簡單有效的方法是:找出心儀的圖片,比如唯美的風景照片,使用photoshop中“濾鏡—馬賽克—調整多邊形形狀和大小”即可看到該圖片中包含的各種顏色,然后利用吸管工具選出幾種顏色即可:

3)使用漸變
無論你需要2種顏色還是10種,漸變中都能提取出這些顏色,讓可視化圖表感覺自然,同時保有足夠的色調與明度差異。一個使用漸變的好方法就是:在Photoshop中拉輔助線到斷點位置,與數據的數量對應上,然后持續對漸變進行測試與調整。

可以看到,配色表緊挨著頂部的灰度漸變,調整漸變疊加(之后就能得到精確的漸變色值),然后從那些斷點處選取顏色,測試配色在實際運用中的效果。
4)使用配色工具
網上各種免費資源比比皆是,對于想設計出靚麗效果又無計可施的人而言,多參考以下這些工具是一個好辦法:
此外,關于配色還有一些小技巧可供參考:遵循公司既定的品牌風格;根據數據描述的對象來定,如數據描述的是咖啡,則可以考慮使用咖色系;使用季節或者節日相關主題的色彩;如果你實在對顏色搭配感到頭疼,那就多使用萬能的“灰色”和陰影。
統計圖表
統計圖表是使用最早的可視化圖形,在數百年的進化過程中,逐漸形成了基本“套路”,符合人類感知和認知,進而被廣泛接受。
常見于各種分析報告的有柱狀圖、折線圖、餅圖、散點圖、氣泡圖、雷達圖,對于這些最常用的圖表類型,下表可以為你指明大致方向:

我們在制作可視化圖表時,首先要從業務出發,優先挑選合理的、符合慣例的圖表,尤其是如果你的用戶層次比較多樣的情況下,請兼顧各個年齡段或者不同認知能力的用戶的需求;其次是根據數據的各種屬性和統計圖表的特點來選擇,例如餅圖并不適合用作展示絕對數值,只適用于反映各部分的比例。對于常用圖表,帶著目的出發,遵循各種約束,相信你能找到合適的圖表:

除了常用的圖表之外,可供我們選擇的還有:
數據可視化的工具
新型的數據可視化產品層出不窮,基本上各種語言都有自己的可視化庫,傳統數據分析及BI軟件也都擴展出一定的可視化功能,再加上專門的用于可視化的成品軟件,我們的可選范圍實在是太多了。那么,我們要選擇的可視化工具,必須滿足互聯網爆發的大數據需求,必須快速的收集、篩選、分析、歸納、展現決策者所需要的信息,并根據新增的數據進行實時更新。
數據可視化主要通過編程和非編程兩類工具實現。主流編程工具包括以下三種類型:從藝術的角度創作的數據可視化,比較典型的工具是 Processing,它是為藝術家提供的編程語言;從統計和數據處理的角度,既可以做數據分析,又可以做圖形處理,如R,SAS;介于兩者之間的工具,既要兼顧數據處理,又要兼顧展現效果,D3.js、Echarts都是很不錯的選擇,二者這種基于Java的數據可視化工具更適合在互聯網上互動的展示數據。