百分位(Percentile)是統(tǒng)計學(xué)中常用的一個指標(biāo),用于衡量一個數(shù)據(jù)點在一組數(shù)據(jù)中的相對位置。比如,25百分位表示數(shù)據(jù)中有25%的值低于這個數(shù)值。在PowerBI中,我們可以使用DAX函數(shù)來計算百分位,并在報表中實現(xiàn)動態(tài)分析。 常用的兩個計算百分位的函數(shù)是PERCENTILE.INC和PERCENTILE.EXC,它們代表的是統(tǒng)計學(xué)中兩種不同的百分位計算方法,主要區(qū)別在于是否考慮端點值。下面以這個簡單的數(shù)據(jù)為例,來看看這兩個函數(shù)的用法和它們的計算邏輯。假如要計算上述數(shù)據(jù)的25%分位,這兩個函數(shù)的寫法分別為:25%分位-INC = PERCENTILE.INC( '表'[數(shù)據(jù)], 0.25 )25%分位-EXC =PERCENTILE.EXC( '表'[數(shù)據(jù)], 0.25 ) 從用法上來說,這兩個函數(shù)完全一樣,都是這樣的寫法,第一個參數(shù)是數(shù)據(jù)列,第二個參數(shù)是百分位k。同樣是計算百分位的函數(shù),為什么結(jié)果不同呢,這就要說到兩個函數(shù)的計算邏輯了。PERCENTILE.INC函數(shù)的計算邏輯和步驟如下:這個例子中,k是0.25,N是10,則0.25*(10-1)+1=3.253、3.25介于第3和第4個位置之間,對應(yīng)值為30和40。4、使用線性插值:30+0.25×(40?30)=32.5結(jié)果:PERCENTILE.INC函數(shù)計算的25%分位值為32.5。PERCENTILE.EXC函數(shù)的計算邏輯和步驟如下:1、按升序排列數(shù)據(jù)。 2、計算位置,位置公式為k×(N+1) 這個例子中,k是0.25,N是10,則0.25*(10+1)=2.75 3、2.75介于第2和第3個位置之間,對應(yīng)值為20和30。 4、使用線性插值:20+0.0.75×(30?20)=27.5 結(jié)果:PERCENTILE.EXC函數(shù)計算的25%分位值為27.5。 通過以上的計算邏輯,可以看出,兩個函數(shù)主要的區(qū)別在于計算百分比位置的邏輯不同導(dǎo)致的,PERCENTILE.INC的百分位置是k×(N?1)+1、PERCENTILE.EXC的百分位置是k×(N+1)。k值越遠(yuǎn)離0.5,二者的計算差異越大,越靠近0.5,差異越小,當(dāng)k值等于0.5時,二者的結(jié)果是一致的,都返回的是中位數(shù)。對于PERCENTILE.INC,它的k值可以從0到1的任意一個值(包括0和1);而PERCENTILE.EXC的k值只能在1/(N+1)與N/(N+1)之間,超出這個范圍將報錯(N是數(shù)據(jù)點的數(shù)量)。比如對于上面的數(shù)據(jù),PERCENTILE.EXC中的k值范圍應(yīng)該在1/11和10/11之間,如果要計算用95%分位,它超出了10/11,結(jié)果將會報錯:因為按PERCENTILE.EXC的計算邏輯,95%的位置應(yīng)該是0.95*(10+1)=10.45,而數(shù)據(jù)點總共才10個,所以報錯了,這就是它的k值有特定范圍的原因。通過這兩個DAX函數(shù),PowerBI可以輕松實現(xiàn)百分位的計算和展示,一般來說,PERCENTILE.INC 更適合離散分布的有限數(shù)據(jù)集,更適用于分布較均勻或數(shù)據(jù)點較少的情況。而PERCENTILE.EXC 的算法更加適合更適合用于連續(xù)分布的樣本數(shù)據(jù),因其排除端點,能夠避免極端值的影響。不同的領(lǐng)域和應(yīng)用場景可根據(jù)特定的需求和假設(shè)選擇不同的方法和函數(shù)。Excel中也有這兩個函數(shù),也是同樣的計算邏輯,在PowerBI,還有對應(yīng)的迭代函數(shù)PERCENTILEX.INC和PERCENTILEX.EXC,用于更靈活的百分位計算,它們的具體用法與區(qū)別,與前面介紹的SUM與SUMX一樣:
|