數(shù)學(xué)之美 系列十九 - 馬爾可夫鏈的擴(kuò)展 貝葉斯網(wǎng)絡(luò) (Bayesian Networks)我們?cè)谇懊娴南盗兄卸啻翁岬?a target="_blank" href="http:///2006/04/blog-post_17.html">馬爾可夫鏈 (Markov Chain), 它描述了一種狀態(tài)序列,其每個(gè)狀態(tài)值取決于前面有限個(gè)狀態(tài)。這種模型,對(duì)很多實(shí)際問題來講是一種很粗略的簡(jiǎn)化。在現(xiàn)實(shí)生活中,很多事物相互的關(guān)系并不能用 一條鏈來串起來。它們之間的關(guān)系可能是交叉的、錯(cuò)綜復(fù)雜的。比如在下圖中可以看到,心血管疾病和它的成因之間的關(guān)系是錯(cuò)綜復(fù)雜的。顯然無法用一個(gè)鏈來表 示。 我們可以把上述的有向圖看 成一個(gè)網(wǎng)絡(luò),它就是貝葉斯網(wǎng)絡(luò)。其中每個(gè)圓圈表示一個(gè)狀態(tài)。狀態(tài)之間的連線表示它們的因果關(guān)系。比如從心血管疾病出發(fā)到吸煙的弧線表示心血管疾病可能和吸 煙有關(guān)。當(dāng)然,這些關(guān)系可以有一個(gè)量化的可信度 (belief),用一個(gè)概率描述。我們可以通過這樣一張網(wǎng)絡(luò)估計(jì)出一個(gè)人的心血管疾病的可能性。在網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)概率的計(jì)算,可以用貝葉斯公式來進(jìn)行, 貝葉斯網(wǎng)絡(luò)因此而得名。由于網(wǎng)絡(luò)的每個(gè)弧有一個(gè)可信度,貝葉斯網(wǎng)絡(luò)也被稱作信念網(wǎng)絡(luò) (belief networks)。 和馬爾可夫鏈類似,貝葉斯網(wǎng)絡(luò)中的每個(gè)狀態(tài)值取決于前面有限個(gè)狀態(tài)。不同的是,貝葉斯網(wǎng)絡(luò)比馬爾可夫鏈靈活,它不受馬爾可夫鏈的鏈狀結(jié)構(gòu)的約束,因此可以更準(zhǔn)確地描述事件之間的相關(guān)性??梢灾v,馬爾可夫鏈?zhǔn)秦惾~斯網(wǎng)絡(luò)的特例,而貝葉斯網(wǎng)絡(luò)是馬爾可夫鏈的推廣。 使 用貝葉斯網(wǎng)絡(luò)必須知道各個(gè)狀態(tài)之間相關(guān)的概率。得到這些參數(shù)的過程叫做訓(xùn)練。和訓(xùn)練馬爾可夫模型一樣,訓(xùn)練貝葉斯網(wǎng)絡(luò)要用一些已知的數(shù)據(jù)。比如在訓(xùn)練上面 的網(wǎng)絡(luò),需要知道一些心血管疾病和吸煙、家族病史等有關(guān)的情況。相比馬爾可夫鏈,貝葉斯網(wǎng)絡(luò)的訓(xùn)練比較復(fù)雜,從理論上講,它是一個(gè) NP-complete 問題,也就是說,對(duì)于現(xiàn)在的計(jì)算機(jī)是不可計(jì)算的。但是,對(duì)于某些應(yīng)用,這個(gè)訓(xùn)練過程可以簡(jiǎn)化,并在計(jì)算上實(shí)現(xiàn)。 值得一提的是 IBM Watson 研究所的茨威格博士 (Geoffrey Zweig) 和西雅圖華盛頓大學(xué)的比爾默 (Jeff Bilmes) 教授完成了一個(gè)通用的貝葉斯網(wǎng)絡(luò)的工具包,提供給對(duì)貝葉斯網(wǎng)絡(luò)有興趣的研究者。 貝葉斯網(wǎng)絡(luò)在圖像處理、文字處理、支持決策等方面有很多應(yīng)用。在文字處理方面,語義相近的詞之間的關(guān)系可以用一個(gè)貝葉斯網(wǎng)絡(luò)來描述。我們利用貝葉斯網(wǎng)絡(luò),可以找出近義詞和相關(guān)的詞,在 Google 搜索和 Google 廣告中都有直接的應(yīng)用。 |
|