大數(shù)據(jù)時代,數(shù)據(jù)驅(qū)動決策。處理不好龐大、復(fù)雜的數(shù)據(jù),其價值將大打折扣。可以想象一本沒有圖片的教科書。沒有圖表、圖形或是帶有箭頭和標(biāo)簽的插圖或流程圖,那么這門學(xué)科將變得更加難以理解。人類天生就是視覺動物,而視覺效果對于分析數(shù)據(jù)、傳達(dá)實(shí)驗(yàn)結(jié)果甚至做出驚人的發(fā)現(xiàn)至關(guān)重要。
工作中我們可能會接觸到很多業(yè)務(wù)數(shù)據(jù),需要在總結(jié)匯報(bào)中展示呈現(xiàn),俗話說“字不如表,表不如圖”,想學(xué)好
數(shù)據(jù)可視化分析就必須多做項(xiàng)目,多實(shí)戰(zhàn),只有這樣才能把平時學(xué)的統(tǒng)計(jì)學(xué),概率論知識、
數(shù)據(jù)分析模型等真正用起來。
那么從哪找數(shù)據(jù)可視化的練習(xí)數(shù)據(jù)呢?小億今天和大家聊聊這些。
一、數(shù)據(jù)可視化的數(shù)據(jù)類型
數(shù)據(jù)的作用不一,當(dāng)我們有不同的需求時就需要不同的數(shù)據(jù)。如需要宏觀經(jīng)濟(jì)相關(guān)的指標(biāo)或者某個市場整體的數(shù)據(jù),這些數(shù)據(jù)是有所不同的。
內(nèi)部數(shù)據(jù)是在企業(yè)或者行業(yè)的業(yè)務(wù)運(yùn)轉(zhuǎn)中產(chǎn)生,比如常見的用戶數(shù)據(jù)、產(chǎn)品數(shù)據(jù)、銷售數(shù)據(jù)、內(nèi)容數(shù)據(jù)等等。獲取內(nèi)部數(shù)據(jù)我們可以安裝在線軟件或者或者進(jìn)行調(diào)查以收集數(shù)據(jù)。內(nèi)部的數(shù)據(jù)相對來說更加完善、規(guī)整,作用也更加細(xì)膩。搭建起內(nèi)部數(shù)據(jù)模型對于企業(yè)來說是有必要也是具有重大意義的,就像
億信ABI能夠?yàn)槠髽I(yè)搭建起一個從數(shù)據(jù)接入到數(shù)據(jù)分析的一體化數(shù)據(jù)工具,從而打通企業(yè)內(nèi)部數(shù)據(jù)壁壘,整合好企業(yè)內(nèi)部數(shù)據(jù)。
但也有很多時候我們需要利用的是外部數(shù)據(jù)。當(dāng)進(jìn)行市場調(diào)研,競品分析,或者輸出報(bào)告的時候,外部數(shù)據(jù)的分析是必不可少的。外部數(shù)據(jù)就多種多樣了,有GDP、行業(yè)總值、行業(yè)發(fā)展?fàn)顩r等等,這些外部數(shù)據(jù)幫助我們了解一個行業(yè),并對此進(jìn)行分析。
一般來說,可視化數(shù)據(jù)分析中的數(shù)據(jù)包括以下幾類:
1、交易數(shù)據(jù)(TRANSACTION DATA)、
大數(shù)據(jù)平臺能夠獲取時間跨度更大、更海量的結(jié)構(gòu)化交易數(shù)據(jù),這樣就可以對更廣泛的交易數(shù)據(jù)類型進(jìn)行分析,不僅僅包括POS或電子商務(wù)購物數(shù)據(jù),還包括行為交易數(shù)據(jù),例如Web服務(wù)器記錄的互聯(lián)網(wǎng)點(diǎn)擊流數(shù)據(jù)日志。
2、人為數(shù)據(jù)(HUMAN-GENERATED DATA)
非結(jié)構(gòu)數(shù)據(jù)廣泛存在于電子郵件、文檔、圖片、音頻、視頻,以及通過博客、維基,尤其是社交媒體產(chǎn)生的數(shù)據(jù)流。這些數(shù)據(jù)為使用文本分析功能進(jìn)行分析提供了豐富的數(shù)據(jù)源泉。
3、移動數(shù)據(jù)(MOBILE DATA)
能夠上網(wǎng)的智能手機(jī)和平板越來越普遍。這些移動設(shè)備上的App都能夠追蹤和溝通無數(shù)事件,從App內(nèi)的交易數(shù)據(jù)(如搜索產(chǎn)品的記錄事件)到個人信息資料或狀態(tài)報(bào)告事件(如地點(diǎn)變更即報(bào)告一個新的地理編碼)。
4、機(jī)器和傳感器數(shù)據(jù)(MACHINE AND SENSOR DATA)
這包括功能設(shè)備創(chuàng)建或生成的數(shù)據(jù),例如智能電表、智能溫度控制器、工廠機(jī)器和連接互聯(lián)網(wǎng)的家用電器。這些設(shè)備可以配置為與互聯(lián)網(wǎng)絡(luò)中的其他節(jié)點(diǎn)通信,還可以自動向中央服務(wù)器傳輸數(shù)據(jù),這樣就可以對數(shù)據(jù)進(jìn)行分析。機(jī)器和傳感器數(shù)據(jù)是來自新興的物聯(lián)網(wǎng)(IoT)所產(chǎn)生的主要例子。來自物聯(lián)網(wǎng)的數(shù)據(jù)可以用于構(gòu)建分析模型,連續(xù)監(jiān)測預(yù)測性行為(如當(dāng)傳感器值表示有問題時進(jìn)行識別),提供規(guī)定的指令(如警示技術(shù)人員在真正出問題之前檢查設(shè)備)。
二、數(shù)據(jù)可視化的數(shù)據(jù)來源
要做實(shí)戰(zhàn)學(xué)習(xí)數(shù)據(jù)可視化,就要掌握數(shù)據(jù)來源的網(wǎng)站,小億根據(jù)不同的數(shù)據(jù)類型給大家推薦一些網(wǎng)站。
1、金融財(cái)經(jīng)數(shù)據(jù)源網(wǎng)站
(1)、世界銀行
世界銀行的公開數(shù)據(jù)庫,免費(fèi)并公開獲取世界各國的發(fā)展數(shù)據(jù)。

(2)、國際貨幣基金組織(IMF):

(3)、CEIC:
CEIC擁有最完整的,超過128個國家的經(jīng)濟(jì)數(shù)據(jù),能夠精確查找GDP, CPI, 進(jìn)口,出口,外資直接投資,零售,銷售,以及國際利率等深度數(shù)據(jù)。

(4)、Wind(萬得):?
萬得被譽(yù)為中國的Bloomberg,在金融業(yè)有著全面的數(shù)據(jù)覆蓋,金融數(shù)據(jù)的類目更新極快,很受國內(nèi)的商業(yè)分析者和投資人的親睞,但是部分?jǐn)?shù)據(jù)是收費(fèi)的。

(5)、同花順數(shù)據(jù)中心:
提供股票債券等金融數(shù)據(jù)

(6)、金融數(shù)據(jù)網(wǎng):
提供每日的黃金、匯率、農(nóng)產(chǎn)品、汽油價格的相關(guān)數(shù)據(jù),友情鏈接中國人民銀行、中國證監(jiān)會、金牛理財(cái)網(wǎng),中國藍(lán)網(wǎng)等網(wǎng)站。

2、互聯(lián)網(wǎng)趨勢分析數(shù)據(jù)源網(wǎng)站
(7)、TalkingData移動觀象臺:
覆蓋到七大模塊的內(nèi)容——應(yīng)用排行、公眾號排行、App Store排行、終端指數(shù)、數(shù)據(jù)報(bào)告、市場洞察、人跡地圖。包含各種數(shù)據(jù)報(bào)告。

(8)、199IT:
容納眾多互聯(lián)網(wǎng)數(shù)據(jù)報(bào)告,其導(dǎo)航網(wǎng)站收集了眾多數(shù)據(jù)相關(guān)的網(wǎng)站鏈接,例如IBM商業(yè)研究院的2021年CIO調(diào)研報(bào)告;巨量算數(shù)的2021國民財(cái)富生活白皮書(附下載);中國信通院:2021年中國智慧農(nóng)業(yè)發(fā)展研究報(bào)告(附下載);艾瑞咨詢:2021年中國場景音樂用戶洞察白皮書(附下載)等等。

(9)、艾瑞網(wǎng):
艾瑞網(wǎng)能夠查看較新的數(shù)據(jù)報(bào)告,主攻網(wǎng)絡(luò)媒體、電子商務(wù)、網(wǎng)絡(luò)游戲等新經(jīng)濟(jì)領(lǐng)域
3、汽車行業(yè)數(shù)據(jù)源網(wǎng)站
(10)、中國汽車工業(yè)協(xié)會:
主要是新車數(shù)據(jù),包括產(chǎn)銷和進(jìn)出口情況,沒有二手車數(shù)據(jù)。

(11)、中國汽車流通協(xié)會:
相比中國汽車工業(yè)協(xié)會網(wǎng)站包含了二手車數(shù)據(jù)。
(12)、易車指數(shù):
主要面向購車者、汽車從業(yè)者,針對國內(nèi)汽車銷售市場,為購車者或汽車從業(yè)者提供參考的數(shù)據(jù)指數(shù)。
4、房產(chǎn)行業(yè)數(shù)據(jù)源網(wǎng)站
(13)、房天下產(chǎn)業(yè)網(wǎng):
網(wǎng)站數(shù)據(jù)來源于中國指數(shù)研究院和CREIS中指數(shù)據(jù),展示國內(nèi)房地產(chǎn)數(shù)據(jù)情況
(14)、國信房地產(chǎn)信息網(wǎng):
國家信息中心主辦的網(wǎng)站,含有1400w+數(shù)據(jù)。
(15)、中指研究院:
主要研究房地產(chǎn)的各項(xiàng)數(shù)據(jù),包括房地產(chǎn)行業(yè)、企業(yè)研究。
5、綜合性數(shù)據(jù)源網(wǎng)站
(16)、鏑數(shù)聚:
提供了12大類、50多萬個數(shù)據(jù)和數(shù)據(jù)報(bào)告,基本上覆蓋了市面上所有細(xì)分行業(yè)。可以點(diǎn)擊分類查看也可以通過數(shù)據(jù)關(guān)鍵詞查詢。網(wǎng)站大部分?jǐn)?shù)據(jù)都可以免費(fèi)下載。
(17)、中國統(tǒng)計(jì)信息網(wǎng):
國家統(tǒng)計(jì)局的官方網(wǎng)站,上面匯集了海量的全國各級政府各年度的國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計(jì)信息,可以在上面找到國家階段發(fā)展數(shù)據(jù)、統(tǒng)計(jì)分析、主要統(tǒng)計(jì)指標(biāo)排行等。
(18)、中國產(chǎn)業(yè)信息網(wǎng):
包含了能源、電力、冶金、化工、機(jī)電、電子汽車、物流等各個行業(yè)相關(guān)的數(shù)據(jù),所有的數(shù)據(jù)全部免費(fèi),做行業(yè)分析經(jīng)常用到的。
三、數(shù)據(jù)可視化的注意事項(xiàng)
可視化的首要任務(wù)是準(zhǔn)確地展示和傳達(dá)數(shù)據(jù)所包含的信息。根據(jù)預(yù)期和需求,提供有效輔助手段以方便用戶理解數(shù)據(jù),從而完成有效的可視化。所以數(shù)據(jù)可視化也有一些注意事項(xiàng):
1. 數(shù)據(jù)可視化系統(tǒng)的服務(wù)模型
當(dāng)數(shù)據(jù)尺寸大、結(jié)構(gòu)復(fù)雜時,有限的空間大大限制了靜態(tài)可視化的效果,有限的可視化空間和數(shù)據(jù)過載之間的處理是非常復(fù)雜的。有時我們會通過物理環(huán)境的變化來改變服務(wù)模型,但更多的時候是通過交互設(shè)計(jì)來完成對復(fù)雜信息的處理。交互可提高可視化系統(tǒng)的效率,幫助用戶處理更多的數(shù)據(jù),完成更復(fù)雜的任務(wù)。
然而,實(shí)現(xiàn)交互本身也有額外成本。互動的系統(tǒng)可以使用戶能探索更大的信息空間,但隨之而來的成本是用戶需要花費(fèi)更多的時間與精力去瀏覽和探索數(shù)據(jù)。如果用戶需要逐一試探每個數(shù)據(jù)點(diǎn),那么可視化系統(tǒng)就成為了完全依靠人力的信息檢索系統(tǒng)。因此,可視化系統(tǒng)應(yīng)當(dāng)采用數(shù)據(jù)挖掘算法自動發(fā)現(xiàn)用戶可能會關(guān)心的數(shù)據(jù)或者模式;并通過可視化呈現(xiàn)給用戶,用戶在這個基礎(chǔ)上通過互動進(jìn)行更深入的挖掘。另一方面,如果一個任務(wù)完全可以通過自動算法得出用戶需要的結(jié)論,交互也就不再需要了。
互動的可視化系統(tǒng),特別是可視分析系統(tǒng)中的自動分析和用戶交互分析是相互補(bǔ)充的兩個部分,權(quán)衡兩者的作用與成本,從而達(dá)到一個合理的平衡。設(shè)計(jì)師的設(shè)計(jì)決定了系統(tǒng)的可理解性,一旦掌握了這個邏輯,在復(fù)雜的頁面也會變得有條不理。另外是我們自己對產(chǎn)品的一套理解力和技巧,可理解性和理解力是對可視化系統(tǒng)復(fù)雜問題處理上兩個決定性要素。
2. 數(shù)據(jù)可視化系統(tǒng)的視覺設(shè)計(jì)
在信息可視化設(shè)計(jì)中,配色方案關(guān)系到可視化結(jié)果的信息表達(dá)和美觀性。好的配色方案的可視化結(jié)果能帶給用戶愉悅的心情,有助于用戶更有興趣地探索可視化所包含的信息;反之,則會造成用戶對可視化的抵觸。另外,和諧的配色方案也能增加可視化結(jié)果的美觀性。
在設(shè)計(jì)可視化的配色方案時,設(shè)計(jì)者需要考慮很多因素:可視化所面向的用戶、群體、可視化結(jié)果是否需要被打印或復(fù)印(轉(zhuǎn)為灰階)、可視化本身的數(shù)據(jù)組成及其屬性等,這里我想重點(diǎn)提出配色與服務(wù)模型的關(guān)聯(lián)關(guān)系。目前市面大部分的運(yùn)營監(jiān)控系統(tǒng)采用的是深色背景色的配色方式。這種配色的優(yōu)勢是:深色背景與高亮度數(shù)據(jù)、表格產(chǎn)生高對比度,更容易凸顯數(shù)據(jù),使人更容易感知到數(shù)據(jù)。但如果生產(chǎn)方式是需要長時間使用系統(tǒng)觀察數(shù)據(jù)分析時,會使人很容易產(chǎn)生視覺疲勞,所以應(yīng)該結(jié)合場景考慮視覺設(shè)計(jì)風(fēng)格。
四、小結(jié)
要做數(shù)據(jù)可視化必然離不開數(shù)據(jù),也只有結(jié)合數(shù)據(jù)可視化用數(shù)據(jù)說話的目的才能達(dá)到,所以各種網(wǎng)站的數(shù)據(jù)對于數(shù)據(jù)可視化來說是很有用也很重要的。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)