統(tǒng)計學習方法第四章貝葉斯估計題參考1:https://blog.csdn.net/bumingqiu/article/details/73397812 參考2:https://blog.csdn.net/bitcarmanlee/article/details/82156281
一、第一個公式:其中,為第種類別,共有種;為樣本數目; 證:設,且服從參數為的Dirichlet分布(先驗分布),則有概率質量函數(即離散變量的概率密度函數)如下: ; (2)式可改寫成: 設為各類別的觀測數,有: 則根據觀測數據對先驗分布改進如下: 其中,,又是與無關的量,故(5)式可寫為: 設服從多項分布,則有: (7)式可改寫成: 將(3)式和(8)式帶入(6)式,可得: 因此得出結論,的后驗概率服從參數為的Dirichlet分布: 故的期望有(Dirichlet分布期望公式): 即有: 故原式得證。 二、第二個公式其中,表示第個樣本的第維特征值,表示第維特征可取值個數,表示特征維數,表示類別數,為樣本數; 證明:參考第一個公式的證明,設: ,且服從參數為的Dirichlet分布(先驗分布),則有概率質量函數(即離散變量的概率密度函數)如下:
(2)是可改寫為: 設為第維度種特征值的觀測數,有: 根據觀測數據對(3)式進行改進如下: 其中,,又是與無關的量,故(5)式可寫為: 設服從多項分布,則有: (7)式可改寫為: 將(3)式和(8)式帶入(6)式,則有: 因此得出結論,的后驗概率服從參數為的Dirichlet分布: 故的期望有(Dirichlet分布期望公式): 即有: 于是,原式得證。 |
|