盒須圖又叫箱線圖,是一種常用的統(tǒng)計圖形,用以顯示數(shù)據(jù)的位置、分散程度、異常值等,主要包含6個統(tǒng)計量:下限、第一四分位數(shù)、中位數(shù)、第三四分位數(shù)、上限和異常值。 中位數(shù):數(shù)據(jù)按照大小順序排列,處于中間位置,即總觀測數(shù)的50%的數(shù)據(jù)。對于一組有限個數(shù)的數(shù)據(jù)來說,它們的中位數(shù)是這樣的一種數(shù):這群數(shù)據(jù)里的一半的數(shù)據(jù)比它大,而另外一半數(shù)據(jù)比它小。計算有限個數(shù)的數(shù)據(jù)的中位數(shù)的方法是:把所有的同類數(shù)據(jù)按照大小的順序排列。如果數(shù)據(jù)的個數(shù)是奇數(shù),則中間那個數(shù)據(jù)就是這群數(shù)據(jù)的中位數(shù);如果數(shù)據(jù)的個數(shù)是偶數(shù),則中間那2個數(shù)據(jù)的算術(shù)平均值就是這群數(shù)據(jù)的中位數(shù)。 第一四分位數(shù)、第三四分位數(shù):數(shù)據(jù)按照大小順序排列,處于總觀測數(shù)25%位置的數(shù)據(jù)為第一分位數(shù),處于總觀測數(shù)75%位置的數(shù)據(jù)為第三分位數(shù)。四分位全距是第三分位數(shù)與第一分位數(shù)之差,簡稱IQR。 上限、下限:一般上限是第三分位數(shù)與1.5倍的IQR之和的范圍之內(nèi)最遠的點,下限是第一分位數(shù)與1.5倍的IQR之和的范圍之內(nèi)最遠的點。也可以直接設(shè)置上限為最大值,設(shè)置下限為最小值。 異常值:在上限和下限之外的數(shù)據(jù)。 下面我們來看看Excel中怎樣制作盒須圖。 原始數(shù)據(jù)如圖1: 圖1 Step1:選中A1:C10,點擊“插入”→“推薦的圖表”,選擇所有圖表的“箱型圖”, 圖2 Step2:選中圖表,在圖表樣式中選擇樣式5,得到圖3的圖表。 圖3 Step3:選中每個箱型,右鍵添加數(shù)據(jù)標簽,設(shè)置數(shù)據(jù)標簽格式如圖4,得到如圖5所示圖表。 圖4 圖5 我們可以用函數(shù)QUARTILE.INC驗證一下中位數(shù)和第一四分位和第三四分位,公式圖6所示: 圖6 公式結(jié)果如圖7,和圖表的數(shù)據(jù)標簽完全一致。 圖7 我們再來看看Tableau中怎樣制作盒須圖。 Step1:把原始數(shù)據(jù)轉(zhuǎn)換為一維表,如圖8所示。 圖8 Step2:在tableau中打開excel文件,把月份拉到列功能區(qū),銷售額拉到行功能區(qū),在智能推薦中選中盒須圖,填充顏色設(shè)置如圖10。標記選中圓,把顯示標記標簽打勾。 圖9 圖10 Step3:點擊左上方的“分析”→“自定義”→“參考線”,如圖11,參考線設(shè)置如圖12,得到圖表如圖13。 圖11 圖12 圖13 |
|
來自: sunnynie2021 > 《待分類》