我們?nèi)粘Uf(shuō)的概率,有多種內(nèi)涵。比如拋硬幣得到正面的概率為0.5,這是跟硬幣的本身構(gòu)造有關(guān)系的,這被稱為習(xí)性理論,每次拋硬幣只跟硬幣本身有關(guān),跟前一次后一次的結(jié)果無(wú)關(guān)。 比如降雨概率,這是跟百分比有關(guān)的。根據(jù)歷史的氣象資料,然后再根據(jù)現(xiàn)在氣象的監(jiān)測(cè)數(shù)據(jù),推斷今天的降雨概率,這種判斷之后的結(jié)果會(huì)影響下一次判斷。 比如我認(rèn)為神馬今天在群里冒泡的概率為0.1,這種是主觀的概念,是基于個(gè)人認(rèn)知,個(gè)人效用計(jì)算的。 一般統(tǒng)計(jì)學(xué)里主要的概率,就是區(qū)間估計(jì)。比如有一堆數(shù)字,我隨機(jī)抽取,然后認(rèn)為在0.95的置信水平下,它能落在5~10之間。也就是,抽取100次,會(huì)有95次抽取的數(shù)字在[5,10]里面。 0.95是個(gè)經(jīng)驗(yàn)值,一般這么認(rèn)為,現(xiàn)在統(tǒng)計(jì)學(xué)家認(rèn)為這不是個(gè)好數(shù)字,做統(tǒng)計(jì)的應(yīng)該在數(shù)據(jù)分析明確表現(xiàn)出他的置信水平。 概率(1):馬爾可夫鏈 在高中學(xué)初等概率時(shí),一般都強(qiáng)調(diào)事件與事件之間相互獨(dú)立,但是在有些情況下是不獨(dú)立的。不獨(dú)立的話,就會(huì)有相關(guān)性,馬爾可夫鏈講的就是這類相關(guān)。 舉個(gè)例子,這有一枚硬幣,正反兩面,經(jīng)過(guò)測(cè)試,它是無(wú)偏向的,正面反面的概率各為0.5?,F(xiàn)在規(guī)則如下:假設(shè)初始值S=0,讓你拋這枚硬幣,如果是正面,那么就加一,S=S+1;如果是反面,就減一,S=S-1。如果S大于等于0,就記為藍(lán)色,如果S小于0,就記為紅色。當(dāng)你不斷地拋硬幣,然后就會(huì)得到一個(gè)序列,像“紅藍(lán)藍(lán)藍(lán)紅紅……”之類。這就是一條馬爾可夫鏈。 然后有科學(xué)家進(jìn)行實(shí)際測(cè)試,發(fā)現(xiàn)結(jié)果中,紅藍(lán)的比例不是1:1,而是有很大的偏差。 所以,在馬爾可夫鏈的例子里我們并不能用在獨(dú)立條件下的那套計(jì)算方法,雖然上面那個(gè)例子中拋硬幣是個(gè)獨(dú)立的過(guò)程。 深入地理解一下,比如某一次S=3,即這一次是藍(lán)色,無(wú)論下一次硬幣是正面(+1),或是反面(-1),結(jié)果S都大于0,即結(jié)果都是藍(lán)色。 馬爾可夫鏈在日常生活中很常見(jiàn),比如天氣。昨天的天氣跟今天的天氣有很大程度的相關(guān),而前天,乃至大前天的天氣可能就跟今天的天氣沒(méi)有關(guān)系。(這個(gè)例子就是馬爾可夫鏈的定義) 馬爾可夫鏈的引入,在書中是來(lái)自一個(gè)反常的現(xiàn)象,即波普爾提出來(lái)的關(guān)于太陽(yáng)東升的例子。在過(guò)去的7000多年里,有史料記錄,太陽(yáng)每次都是東升的,大概是7000x360次(粗略計(jì)算)。假如明天,太陽(yáng)不東升了。讓你預(yù)測(cè)后天太陽(yáng)東升的概率。如果按照獨(dú)立性的那套來(lái)計(jì)算,那么p=(7000x360)/(7000x360+1)=0.9999996~1。也就是說(shuō),后天太陽(yáng)依舊會(huì)東升。但這種想法明顯是反常的。 太陽(yáng)東升也是馬爾可夫鏈,不能這么算,所以出了這樣的差錯(cuò)。波普爾利用這個(gè)例子來(lái)引出它的那個(gè)猜想與反駁的觀念(用一個(gè)解釋力更強(qiáng)的假說(shuō)替代原假說(shuō))。 |
|