最近,我開(kāi)始修訂一些以前發(fā)表過(guò)的文章。對(duì)我來(lái)說(shuō),這是一種復(fù)習(xí)和復(fù)盤(pán),從中發(fā)現(xiàn)可以改進(jìn)的地方,并完善自己的知識(shí)體系。如果你以前看過(guò)這篇文章,那么你也可以再?gòu)?fù)習(xí)一遍,從而加深對(duì)相關(guān)知識(shí)的理解。 1. 數(shù)據(jù)可視化簡(jiǎn)介 數(shù)據(jù)可視化,是指用圖形的方式來(lái)展現(xiàn)數(shù)據(jù),從而更加清晰有效地傳遞信息,主要方法包括圖表類(lèi)型的選擇和圖表設(shè)計(jì)的準(zhǔn)則。隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,我們的工作和生活等各個(gè)方面,每時(shí)每刻都在產(chǎn)生大量的數(shù)據(jù)。數(shù)據(jù)可視化作為一種有效傳遞信息的手段,被越來(lái)越廣泛地應(yīng)用到很多領(lǐng)域,比如說(shuō),是淘寶雙十一的數(shù)據(jù)可視化,在一塊大屏幕上實(shí)時(shí)動(dòng)態(tài)展示交易數(shù)據(jù)。如果想要讓數(shù)據(jù)發(fā)揮更大的價(jià)值,那么合理地運(yùn)用數(shù)據(jù)可視化的方法和工具就顯得特別重要。根據(jù)數(shù)據(jù)分析的實(shí)際情況,需要有針對(duì)性地選擇合適的數(shù)據(jù)可視化方法。但是,可視化的圖表花樣繁多,我們應(yīng)該如何選擇并設(shè)計(jì)好你的圖表呢?本文將把它拆分為 8 個(gè)部分,逐一進(jìn)行介紹。(1) 當(dāng)你需要對(duì)不同的類(lèi)別進(jìn)行比較時(shí),有很多種圖形可供選擇,其中條形圖是最常見(jiàn)的,垂直瀑布圖適合用來(lái)比較并分析各個(gè)組成部分的變化情況,詞云圖適用于大量文本的分析和比較。(2) 當(dāng)你想要直觀反映關(guān)鍵業(yè)績(jī)指標(biāo)隨時(shí)間的變化情況時(shí),用柱形圖或曲線(xiàn)圖是比較好的選擇。(3) 當(dāng)你需要展示二八定律時(shí),用柏拉圖(Pareto)能方便地找出主要因素。(4) 當(dāng)你希望展示數(shù)據(jù)之間的聯(lián)系或關(guān)系時(shí),漏斗圖和散點(diǎn)圖是比較好的選擇。對(duì)于氣泡圖,我個(gè)人覺(jué)得可以適當(dāng)?shù)丶右赃\(yùn)用,因?yàn)樗芫C合反應(yīng)出 3 個(gè)重要的指標(biāo),在一些數(shù)據(jù)分析場(chǎng)景中,氣泡圖能有效地傳遞出重要的信息。比如說(shuō),Hans Rosling 曾經(jīng)利用動(dòng)態(tài)氣泡圖,展現(xiàn)了全球人口、收入、健康的動(dòng)態(tài)變化,在網(wǎng)站 http://www. 上也可以找到大量動(dòng)態(tài)氣泡圖的應(yīng)用。(5) 當(dāng)你關(guān)注數(shù)據(jù)的分布狀況時(shí),可以使用直方圖或小提琴圖。剛開(kāi)始看到小提琴圖,可能會(huì)覺(jué)得她比較費(fèi)解,但當(dāng)你理解她代表的具體含義之后,就會(huì)知道她能傳遞很多專(zhuān)業(yè)的統(tǒng)計(jì)信息,包括數(shù)據(jù)的密度分布、中位數(shù)、四分位數(shù)等。(6) 如果你想增強(qiáng)圖表的表現(xiàn)力,那么可以增加箭頭和標(biāo)簽等圖表元素。(7) 當(dāng)你只需要突出顯示某個(gè)單值,可以用放大的粗體文字或圖片。(8) 在進(jìn)行數(shù)據(jù)可視化的過(guò)程中,應(yīng)該時(shí)刻關(guān)注數(shù)據(jù)可視化的目標(biāo),記住這些圖表設(shè)計(jì)的提示:使用2D圖表,不要使用三維立體效果 使用反映真實(shí)情況的刻度,避免造成誤導(dǎo) 使用單一的 Y 軸,不要使用雙軸圖表 折線(xiàn)圖用角度體現(xiàn)真實(shí)的數(shù)據(jù)變化,不要使用平滑效果
數(shù)據(jù)序列最多不超過(guò) 4 個(gè) 條形圖按大小排序進(jìn)行排列 不要使用無(wú)意義的顏色 高亮顯示重要的圖表元素 坐標(biāo)軸等輔助元素盡量淡化 一個(gè)指標(biāo)值就是一個(gè)數(shù)據(jù),將數(shù)據(jù)的大小以圖形的方式表現(xiàn)。比如說(shuō),用柱形圖的高度表現(xiàn)數(shù)據(jù)大小。 一般用與指標(biāo)含義相近的 icon 圖標(biāo)來(lái)表現(xiàn)。當(dāng)存在多個(gè)指標(biāo)時(shí),挖掘指標(biāo)之間的關(guān)系,并將其圖形化表達(dá),可提升圖表的可視化深度。通過(guò)時(shí)間的維度來(lái)查看指標(biāo)值的變化情況,一般通過(guò)增加時(shí)間軸的形式,也就是常見(jiàn)的趨勢(shì)圖。當(dāng)圖表存在地域信息并且需要突出表現(xiàn)的時(shí)候,可用地圖將空間可視化,地圖作為主背景呈現(xiàn)所有信息點(diǎn)。(五) 將數(shù)據(jù)進(jìn)行概念轉(zhuǎn)換對(duì)數(shù)據(jù)進(jìn)行概念轉(zhuǎn)換,可加深用戶(hù)對(duì)數(shù)據(jù)的感知,常用方法有對(duì)比和比喻。數(shù)據(jù)圖形化完成后,可結(jié)合實(shí)際情況,將其變?yōu)閯?dòng)態(tài)化和可操控性的圖表,用戶(hù)在操控過(guò)程中能更好地感知數(shù)據(jù)的變化過(guò)程,提升體驗(yàn)。實(shí)現(xiàn)動(dòng)態(tài)化主要有兩種方式:交互和動(dòng)畫(huà)。4. 數(shù)據(jù)可視化的十個(gè)準(zhǔn)則 (二) 通過(guò)對(duì)比來(lái)反映問(wèn)題; (三) 提供數(shù)據(jù)指標(biāo)的業(yè)務(wù)背景; (四) 通過(guò)從總體到部分的形式,展示數(shù)據(jù)分析報(bào)告; (五) 聯(lián)系實(shí)際的生產(chǎn)和生活,對(duì)數(shù)據(jù)指標(biāo)的大小進(jìn)行可視化; (六) 通過(guò)明確而全面的標(biāo)注,盡可能消除誤差和歧義; (七) 將可視化的圖標(biāo),同聽(tīng)覺(jué)上的描述,進(jìn)行有機(jī)的整合; (八) 通過(guò)圖形化工具,增加信息的可讀性和生動(dòng)性; (九) 允許但并非強(qiáng)制,通過(guò)表格的形式,呈現(xiàn)數(shù)據(jù)信息; (十) 目標(biāo)是:讓受眾思考呈現(xiàn)的數(shù)據(jù)指標(biāo),而非數(shù)據(jù)的呈現(xiàn)形式。目前市面上的數(shù)據(jù)可視化工具多種多樣,其中 Excel 作圖工具是最常用的。 從數(shù)據(jù)可視化的自動(dòng)化方面來(lái)看,建議使用 Python 編程來(lái)實(shí)現(xiàn)。Python 中用于數(shù)據(jù)可視化的庫(kù)有很多,比較常見(jiàn)的有: Matplotlib(強(qiáng)大、復(fù)雜) Seaborn(基于Matplotlib、簡(jiǎn)單) pyecharts(基于Echarts、炫酷) plotnine(移植于R的ggplot2、圖形語(yǔ)法) PyQtGraph(交互、高性能) 從數(shù)據(jù)可視化工具的敏捷性方面來(lái)看,建議使用 BI 軟件,例如 Tableau、Power BI 等等。有些人打著數(shù)據(jù)可視化的幌子,片面追求視覺(jué)上的花哨,做出來(lái)的圖表只是為了吸引眼球,這就違背了有效傳遞信息的目標(biāo)。數(shù)據(jù)可視化的目標(biāo),并不是單純地為了「好看」,而是為了更加有效地傳遞信息,讓人能準(zhǔn)確快速地獲取有價(jià)值的信息,從而更好地解決問(wèn)題。相關(guān)文章:Python編程實(shí)踐(2):數(shù)據(jù)可視化
關(guān)注林驥,更多干貨早知道。 ▲ 點(diǎn)擊上方卡片...設(shè)為星標(biāo)
|