一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

數(shù)據(jù)可視化的方法和工具V1.1

 雨陽(yáng)2019 2022-04-09
你好,我是林驥。

最近,我開(kāi)始修訂一些以前發(fā)表過(guò)的文章。

對(duì)我來(lái)說(shuō),這是一種復(fù)習(xí)和復(fù)盤(pán),從中發(fā)現(xiàn)可以改進(jìn)的地方,并完善自己的知識(shí)體系。

如果你以前看過(guò)這篇文章,那么你也可以再?gòu)?fù)習(xí)一遍,從而加深對(duì)相關(guān)知識(shí)的理解。

1. 數(shù)據(jù)可視化簡(jiǎn)介
數(shù)據(jù)可視化,是指用圖形的方式來(lái)展現(xiàn)數(shù)據(jù),從而更加清晰有效地傳遞信息,主要方法包括圖表類(lèi)型的選擇和圖表設(shè)計(jì)的準(zhǔn)則。
隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,我們的工作和生活等各個(gè)方面,每時(shí)每刻都在產(chǎn)生大量的數(shù)據(jù)。

數(shù)據(jù)可視化作為一種有效傳遞信息的手段,被越來(lái)越廣泛地應(yīng)用到很多領(lǐng)域,比如說(shuō),是淘寶雙十一的數(shù)據(jù)可視化,在一塊大屏幕上實(shí)時(shí)動(dòng)態(tài)展示交易數(shù)據(jù)。

如果想要讓數(shù)據(jù)發(fā)揮更大的價(jià)值,那么合理地運(yùn)用數(shù)據(jù)可視化的方法和工具就顯得特別重要。

2. 數(shù)據(jù)可視化的圖表選擇

根據(jù)數(shù)據(jù)分析的實(shí)際情況,需要有針對(duì)性地選擇合適的數(shù)據(jù)可視化方法。

但是,可視化的圖表花樣繁多,我們應(yīng)該如何選擇并設(shè)計(jì)好你的圖表呢?

下面這張圖源自 http://ide

圖片

本文將把它拆分為 8 個(gè)部分,逐一進(jìn)行介紹。

(1) 當(dāng)你需要對(duì)不同的類(lèi)別進(jìn)行比較時(shí),有很多種圖形可供選擇,其中條形圖是最常見(jiàn)的,垂直瀑布圖適合用來(lái)比較并分析各個(gè)組成部分的變化情況,詞云圖適用于大量文本的分析和比較。


(2) 當(dāng)你想要直觀反映關(guān)鍵業(yè)績(jī)指標(biāo)隨時(shí)間的變化情況時(shí),用柱形圖或曲線(xiàn)圖是比較好的選擇。

圖片

(3) 當(dāng)你需要展示二八定律時(shí),用柏拉圖(Pareto)能方便地找出主要因素。

圖片

(4) 當(dāng)你希望展示數(shù)據(jù)之間的聯(lián)系或關(guān)系時(shí),漏斗圖和散點(diǎn)圖是比較好的選擇。

對(duì)于氣泡圖,我個(gè)人覺(jué)得可以適當(dāng)?shù)丶右赃\(yùn)用,因?yàn)樗芫C合反應(yīng)出 3 個(gè)重要的指標(biāo),在一些數(shù)據(jù)分析場(chǎng)景中,氣泡圖能有效地傳遞出重要的信息。

比如說(shuō),Hans Rosling 曾經(jīng)利用動(dòng)態(tài)氣泡圖,展現(xiàn)了全球人口、收入、健康的動(dòng)態(tài)變化,在網(wǎng)站 http://www. 上也可以找到大量動(dòng)態(tài)氣泡圖的應(yīng)用。

圖片
圖片

(5) 當(dāng)你關(guān)注數(shù)據(jù)的分布狀況時(shí),可以使用直方圖或小提琴圖。

剛開(kāi)始看到小提琴圖,可能會(huì)覺(jué)得她比較費(fèi)解,但當(dāng)你理解她代表的具體含義之后,就會(huì)知道她能傳遞很多專(zhuān)業(yè)的統(tǒng)計(jì)信息,包括數(shù)據(jù)的密度分布、中位數(shù)、四分位數(shù)等。

圖片

(6) 如果你想增強(qiáng)圖表的表現(xiàn)力,那么可以增加箭頭和標(biāo)簽等圖表元素。

圖片

(7) 當(dāng)你只需要突出顯示某個(gè)單值,可以用放大的粗體文字或圖片。

圖片

(8) 在進(jìn)行數(shù)據(jù)可視化的過(guò)程中,應(yīng)該時(shí)刻關(guān)注數(shù)據(jù)可視化的目標(biāo),記住這些圖表設(shè)計(jì)的提示:
  • 使用2D圖表,不要使用三維立體效果

  • 使用反映真實(shí)情況的刻度,避免造成誤導(dǎo)

  • 使用單一的 Y 軸,不要使用雙軸圖表

  • 折線(xiàn)圖用角度體現(xiàn)真實(shí)的數(shù)據(jù)變化,不要使用平滑效果

  • 數(shù)據(jù)序列最多不超過(guò) 4 個(gè)

  • 條形圖按大小排序進(jìn)行排列

  • 不要使用無(wú)意義的顏色

  • 高亮顯示重要的圖表元素

  • 坐標(biāo)軸等輔助元素盡量淡化


圖片

3. 數(shù)據(jù)可視化的六種制作方

(一) 將指標(biāo)值圖形化

一個(gè)指標(biāo)值就是一個(gè)數(shù)據(jù),將數(shù)據(jù)的大小以圖形的方式表現(xiàn)。比如說(shuō),用柱形圖的高度表現(xiàn)數(shù)據(jù)大小。

(二) 將指標(biāo)圖形化

一般用與指標(biāo)含義相近的 icon 圖標(biāo)來(lái)表現(xiàn)。

(三) 將指標(biāo)關(guān)系圖形化

當(dāng)存在多個(gè)指標(biāo)時(shí),挖掘指標(biāo)之間的關(guān)系,并將其圖形化表達(dá),可提升圖表的可視化深度。

(四) 將時(shí)間和空間可視化

通過(guò)時(shí)間的維度來(lái)查看指標(biāo)值的變化情況,一般通過(guò)增加時(shí)間軸的形式,也就是常見(jiàn)的趨勢(shì)圖。

當(dāng)圖表存在地域信息并且需要突出表現(xiàn)的時(shí)候,可用地圖將空間可視化,地圖作為主背景呈現(xiàn)所有信息點(diǎn)。

(五) 將數(shù)據(jù)進(jìn)行概念轉(zhuǎn)換

對(duì)數(shù)據(jù)進(jìn)行概念轉(zhuǎn)換,可加深用戶(hù)對(duì)數(shù)據(jù)的感知,常用方法有對(duì)比和比喻。

(六) 讓圖表「動(dòng)」起來(lái)

數(shù)據(jù)圖形化完成后,可結(jié)合實(shí)際情況,將其變?yōu)閯?dòng)態(tài)化和可操控性的圖表,用戶(hù)在操控過(guò)程中能更好地感知數(shù)據(jù)的變化過(guò)程,提升體驗(yàn)。實(shí)現(xiàn)動(dòng)態(tài)化主要有兩種方式:交互和動(dòng)畫(huà)。

4. 數(shù)據(jù)可視化的十個(gè)準(zhǔn)則

(一) 明確數(shù)據(jù)可視化的目的;
(二) 通過(guò)對(duì)比來(lái)反映問(wèn)題; 
(三) 提供數(shù)據(jù)指標(biāo)的業(yè)務(wù)背景; 
(四) 通過(guò)從總體到部分的形式,展示數(shù)據(jù)分析報(bào)告; 
(五) 聯(lián)系實(shí)際的生產(chǎn)和生活,對(duì)數(shù)據(jù)指標(biāo)的大小進(jìn)行可視化; 
(六) 通過(guò)明確而全面的標(biāo)注,盡可能消除誤差和歧義; 
(七) 將可視化的圖標(biāo),同聽(tīng)覺(jué)上的描述,進(jìn)行有機(jī)的整合; 
(八) 通過(guò)圖形化工具,增加信息的可讀性和生動(dòng)性; 
(九) 允許但并非強(qiáng)制,通過(guò)表格的形式,呈現(xiàn)數(shù)據(jù)信息; 
(十) 目標(biāo)是:讓受眾思考呈現(xiàn)的數(shù)據(jù)指標(biāo),而非數(shù)據(jù)的呈現(xiàn)形式。

5. 數(shù)據(jù)可視化的工具

目前市面上的數(shù)據(jù)可視化工具多種多樣,其中 Excel 作圖工具是最常用的。

從數(shù)據(jù)可視化的自動(dòng)化方面來(lái)看,建議使用 Python 編程來(lái)實(shí)現(xiàn)。

Python 中用于數(shù)據(jù)可視化的庫(kù)有很多,比較常見(jiàn)的有: 
  • Matplotlib(強(qiáng)大、復(fù)雜)

  • Seaborn(基于Matplotlib、簡(jiǎn)單)

  • pyecharts(基于Echarts、炫酷)

  • plotnine(移植于R的ggplot2、圖形語(yǔ)法)

  • PyQtGraph(交互、高性能)


從數(shù)據(jù)可視化工具的敏捷性方面來(lái)看,建議使用 BI 軟件,例如 Tableau、Power BI 等等。

最后的話(huà)

有些人打著數(shù)據(jù)可視化的幌子,片面追求視覺(jué)上的花哨,做出來(lái)的圖表只是為了吸引眼球,這就違背了有效傳遞信息的目標(biāo)。

數(shù)據(jù)可視化的目標(biāo),并不是單純地為了「好看」,而是為了更加有效地傳遞信息,讓人能準(zhǔn)確快速地獲取有價(jià)值的信息,從而更好地解決問(wèn)題。

相關(guān)文章:Python編程實(shí)踐(2):數(shù)據(jù)可視化


關(guān)注林驥,更多干貨早知道。

▲ 點(diǎn)擊上方卡片...設(shè)為星標(biāo)

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多

    久久一区内射污污内射亚洲| 人妻一区二区三区多毛女| 日韩三级黄色大片免费观看| 国产中文字幕久久黄色片| 91人妻人人揉人人澡人| 富婆又大又白又丰满又紧又硬 | 中国少妇精品偷拍视频| 99久久免费中文字幕| 日韩一级一片内射视频4k| 久一视频这里只有精品| 中文字幕亚洲精品乱码加勒比| 国产精品不卡高清在线观看| 久久午夜福利精品日韩| 欧美激情中文字幕综合八区| 午夜精品久久久免费视频| 中文字幕一二区在线观看| 国产精品午夜小视频观看| 国产精品一区二区有码| 精品香蕉一区二区在线| 婷婷九月在线中文字幕| 国产传媒免费观看视频| 好吊一区二区三区在线看| 久久婷婷综合色拍亚洲| 护士又紧又深又湿又爽的视频| 国产欧美日韩精品自拍 | 深夜少妇一区二区三区| 熟妇人妻av中文字幕老熟妇| 欧美一区二区三区99| 欧美在线观看视频三区| 好吊日视频这里都是精品| 欧美精品亚洲精品日韩精品| 成在线人免费视频一区二区| 国产精品熟女在线视频| 大香蕉大香蕉手机在线视频| 韩国激情野战视频在线播放| 激情亚洲一区国产精品久久| 久久精品蜜桃一区二区av| 亚洲国产四季欧美一区| 亚洲精品国产精品日韩| 久久机热频这里只精品| 中文字幕乱子论一区二区三区|