大家好,上周介紹完餅圖之后,您有沒(méi)有親自動(dòng)手嘗試一下呢? 今天小數(shù)要帶大家熟悉的是散點(diǎn)圖,本文圖表生成所用工具仍然是大眾熟知的 Excel。 說(shuō)到散點(diǎn)圖,它既能用來(lái)呈現(xiàn)數(shù)據(jù)點(diǎn)的分布,表現(xiàn)兩個(gè)元素的相關(guān)性,也能像折線(xiàn)圖一樣表示時(shí)間推移下的發(fā)展趨勢(shì)。可以說(shuō)是最靈活多變的圖表類(lèi)型。 大數(shù)據(jù)時(shí)代,人們更關(guān)注數(shù)據(jù)之間的相關(guān)關(guān)系而非因果關(guān)系。那么如何考量各變量之間的相關(guān)關(guān)系呢?散點(diǎn)圖就是一種最直觀(guān)簡(jiǎn)單的形式。 散點(diǎn)圖的特點(diǎn)?
在實(shí)際應(yīng)用中使用頻率最多的是二維散點(diǎn)圖和三維散點(diǎn)圖,而三維散點(diǎn)圖又與氣泡圖有密切關(guān)系,我們后面會(huì)提到。 二維散點(diǎn)圖的制作相對(duì)簡(jiǎn)單,無(wú)需特殊設(shè)置。可視化方面其實(shí)也還是咱們的老套路,這里再通過(guò)一個(gè)例子帶大家簡(jiǎn)單過(guò)一遍。 小數(shù)收集了某餐館服務(wù)滿(mǎn)意度與排隊(duì)時(shí)間相關(guān)的 15 組數(shù)據(jù),導(dǎo)入 Excel ,直接生成散點(diǎn)圖如下: 可視化操作步驟:
現(xiàn)實(shí)操作中判斷兩個(gè)變量之間的關(guān)系類(lèi)型,還需要引入回歸分析等方法,我在這里只是作為可視化的一個(gè)簡(jiǎn)單舉例,所以就直接插入了線(xiàn)性趨勢(shì)線(xiàn)。 優(yōu)化后如下圖所示: 在 Excel 的散點(diǎn)圖分類(lèi)中,我們還可以看到一類(lèi)變體的散點(diǎn)圖——曲線(xiàn)圖。它經(jīng)常被用來(lái)表示某個(gè)變量隨時(shí)間變量變化的趨勢(shì),與折線(xiàn)圖的功能類(lèi)似。 我將自己最近 30 天的步行數(shù)作為數(shù)據(jù)源,然后生成曲線(xiàn)圖。 這里不再贅述可視化過(guò)程,與普通散點(diǎn)圖基本相同(通過(guò)線(xiàn)條填充半透明處理、背景漸變填充、日期格式和坐標(biāo)軸調(diào)整等) 氣泡圖與散點(diǎn)圖最直觀(guān)的區(qū)別為:散點(diǎn)圖中的數(shù)據(jù)點(diǎn)長(zhǎng)得都一樣,氣泡圖中的氣泡卻大小不同。因?yàn)闅馀輬D在原先散點(diǎn)圖的基礎(chǔ)上引入了第三個(gè)值來(lái)控制氣泡的大小。 舉個(gè)例子,我將某校 30 名學(xué)生的期末成績(jī)與其對(duì)應(yīng)的出勤率作為x值和y值,并引入“去圖書(shū)館的時(shí)間”作為z值,默認(rèn)生成氣泡圖如下: 氣泡擠在一起了,怎么辦呢? 調(diào)整坐標(biāo)軸,將出勤率和分?jǐn)?shù)的最小值和最大值進(jìn)行修改,調(diào)整相應(yīng)顏色,然后再插入趨勢(shì)線(xiàn),就得到了下圖: 可以看出,除了出勤率與分?jǐn)?shù)之間有簡(jiǎn)單的正相關(guān)關(guān)系外,分?jǐn)?shù)越高的同學(xué),去圖書(shū)館的時(shí)間也相對(duì)較高(氣泡普遍更大)。 最后再?gòu)?qiáng)調(diào)一下:散點(diǎn)圖實(shí)際應(yīng)用中更適合大范圍的數(shù)據(jù),本篇文章中的舉例只是為了說(shuō)明問(wèn)題,所以數(shù)據(jù)量都不大。
題外話(huà):其實(shí)看到這些散點(diǎn)圖,總讓小數(shù)想起一款大圓吃小圓的網(wǎng)頁(yè)游戲,當(dāng)初我也是沉溺其中,無(wú)法自拔,它的頁(yè)面如下圖,游戲規(guī)則挺有意思的,感興趣的小伙伴可以去體驗(yàn)一下~ |
|
來(lái)自: 愛(ài)幻想的笨熊 > 《Excel應(yīng)用》