常言道:世界唯一不變的就是變化。其實,還有一個永恒不變的東西——數(shù)學(xué)。 無論是物理定律、化學(xué)方程、生物基因,還是人工智能、社會研究、經(jīng)濟(jì)計量等等,都需要用數(shù)學(xué)描述,甚至有一派觀點認(rèn)為,這個世界的本質(zhì)就是數(shù)學(xué),因為萬物由原子組成,原子由質(zhì)子、中子和電子組成,這些又由夸克等基本粒子組成,而基本粒子分解到盡頭就是數(shù)學(xué)結(jié)構(gòu)。這個世界如此完美的符合數(shù)學(xué)邏輯,令人驚嘆,但它又充滿了變化和不確定,以至于隨機(jī)和概率成了世界的常態(tài)和底色。今天我們就來聊聊這個底層的數(shù)學(xué)思維。 概率思維的整體視角 我們開車出行會提前規(guī)劃路線,投資股票、基金會考慮漲跌,就連買彩票也會看看哪個號碼出現(xiàn)的可能性更大,這些背后都有意無意地用到了概率思維。其實我們每個人都有概率意識,只是缺少對概率的深入理解和感知。 概率思維解決問題的基本思路就是把局部的隨機(jī)性轉(zhuǎn)換為整體的確定性,以得出大致確定性的判斷。比如,普通人買彩票是隨機(jī)的,但發(fā)行彩票機(jī)構(gòu)的收益率是確定的;道路上發(fā)生的交通事故是隨機(jī)的,但一個城市一年的事故率是大致確定的。所以概率不是預(yù)測下一次會發(fā)生什么,而是從整體視角看問題,以刻畫事物的整體確定性。 兩個概念 了解概率思維,必須弄清兩個核心概念:隨機(jī)和獨立性。他們?nèi)缤胃怕世碚摯髲B的兩根不可或缺的立柱。 我們平時玩游戲可以選隨機(jī)英雄,聽音樂可以選隨機(jī)播放模式。隨機(jī)是事情結(jié)果的不可預(yù)測,但有別于日常說的“不確定”。隨機(jī)和不確定主要差異在于事情的結(jié)果是否可知。比如玩王者榮耀,隨機(jī)是指可選的所有英雄已知,但某次具體選到哪個英雄不知道,而不確定是指可選的英雄有哪些都不知道。再比如,上大學(xué)遇到的第一個同學(xué)的名字就是不確定,而不是隨機(jī),因為遇到的同學(xué)可以是張三,也可以是李四......,無法窮盡所有可能的結(jié)果。 只有確定了全部可能的結(jié)果,才能分析它們的概率,否則就無法使用概率,這是概率思維的邊界。概率處理的是隨機(jī)性,而不是不確定性,所以概率可以用來分析灰犀牛,但不能預(yù)測黑天鵝。 隨機(jī)事件之間的關(guān)系,要么具有獨立性,要么具有非獨立性。正確判斷隨機(jī)事件之間的獨立性與否,是分析和度量概率的前提。拋硬幣是一個典型的獨立事件,每次拋的結(jié)果互不影響,而網(wǎng)絡(luò)效應(yīng)則是一個點典型的非獨立事件,比如淘寶平臺,買家與賣家互為影響,買家越多,會吸引更多的賣家,反之亦然。每次彩票結(jié)果其實就是一個獨立事件,不受前期結(jié)果的影響,若你真正理解了獨立性,想必以后不會再去買彩票了。 概率分布 抽象是數(shù)學(xué)解決問題的基本方式,也是連接現(xiàn)實世界和數(shù)學(xué)世界的橋梁。如果一類事物呈現(xiàn)出相同的現(xiàn)象,我們就可以把這種現(xiàn)象抽離成一個數(shù)學(xué)量,這大體就是抽象的含義。通過抽象和數(shù)學(xué)邏輯的確認(rèn),事物的現(xiàn)象就可以上升到我們常說的規(guī)律,具有了通用性。 在處理隨機(jī)事件的問題上,抽象出來的數(shù)學(xué)量稱作“隨機(jī)變量”。 換句話說,就是把隨機(jī)事件所有的結(jié)果抽象成一個數(shù)字,每個數(shù)字對應(yīng)一個概率,這個隨機(jī)變化的數(shù)字就是隨機(jī)變量。通過隨機(jī)變量,我們就可以把現(xiàn)實世界和概率世界連接起來。 要探究一個隨機(jī)事件的規(guī)律,我們直接分析其對應(yīng)的隨機(jī)變量這個具體的數(shù)字變化即可。比如,研究一個城市的居民年均收入情況,可以將其分為5萬以下、5萬-10萬、10萬-30萬、30萬-50萬、50萬-200萬、200萬以上等6個等級,每個等級就是隨機(jī)變量的一個結(jié)果,把隨機(jī)變量所有的結(jié)果和它對應(yīng)的概率全部統(tǒng)計出來后,我們就得出這個城市居民年均收入的概率分布。 由此,我們可以看到概率分布就是通過從整體上描述一個隨機(jī)事件所有可能的結(jié)果和對應(yīng)的概率分布,提供整體上的確定性。這樣,我們就可以鳥瞰世界,從整體上把握一件事的基本輪廓,以便做進(jìn)一步的探索。 常見的概率分布有正態(tài)分布、對數(shù)正態(tài)分布、冪律分布和泊松分布等,他們代表某些隨機(jī)事件特有的變化規(guī)律。比如,人的身高、體重和智商都服從正態(tài)分布,而網(wǎng)絡(luò)流量和個人財富則都服從冪律分布。 正態(tài)分布圖 對數(shù)正態(tài)分布圖 冪律分布圖 正態(tài)分布是概率分布中最重要的分布,沒有之一。因為大量獨立的隨機(jī)變量相加,其結(jié)果必定會趨向于正態(tài)分布;同樣,任何分布疊加最終也都會形成正態(tài)分布,這是由中心極限定理和大數(shù)定律決定的。 冪律分布在現(xiàn)實生活中也很普遍,常說的“二八法則”就是其一個十分直觀的表現(xiàn)。比如,全社會80%的財富集中在20%的人手里,一個行業(yè)80%的利潤被20%的頭部公司攫取等。冪律分布是一條向下的曲線,拖著一個長長的尾巴,它的數(shù)學(xué)特征只有一個,就是無標(biāo)度,也叫“無尺度”。即在任何觀測尺度下,冪律分布都呈現(xiàn)同樣的分布特征。比如個人財富的分布,在一個國家、一個城市,甚至一個村子,都服從冪律分布。形成冪律分布的因素有很多,比如自組織臨界、滲流模型和優(yōu)先連接等,但最關(guān)鍵的兩個因素是其數(shù)值上限趨于無限和隨機(jī)變量的非獨立性。由于冪律分布隱藏著財富和名望的秘密,作為個體,它充滿了誘惑。 正態(tài)分布和冪律分布是兩個極其重要和普遍的概率模型,我們可以從隨機(jī)變量之間的兩種關(guān)系做一個簡單地區(qū)分,即“獨立” 和“相加或相乘”。凡是多個獨立隨機(jī)變量相加的事件,結(jié)果就是正態(tài)分布。而多個獨立隨機(jī)變量相乘的事件,它的分布是對數(shù)正態(tài)分布,介于冪律分布和正態(tài)分布之間。冪律分布則是由非獨立的隨機(jī)變量相乘的結(jié)果。正態(tài)分布下,你不用擔(dān)心會有什么極端的情況發(fā)生,而在對數(shù)正態(tài)分布和冪律分布下,你就必須做好應(yīng)對極端情況的準(zhǔn)備。 概率與系統(tǒng)思維 從某種意義上講,現(xiàn)代社會就是建立在數(shù)學(xué)這顆大樹上,她先是分枝了物理學(xué),進(jìn)而長出化學(xué)、生物學(xué),后來又有了現(xiàn)代醫(yī)學(xué)、經(jīng)濟(jì)學(xué)等等,最終催生了現(xiàn)代工業(yè)文明。概率論作為數(shù)學(xué)的一大分支,在現(xiàn)實生活中又具有很強(qiáng)的普遍性,所以我們有必要做一番了解,但限于篇幅,如條件概率和貝葉斯定理等同樣實用有力的思維武器,以后再作討論。 NBA有句名言:訓(xùn)練時,用正確姿勢投丟的球比用錯誤姿勢投進(jìn)的球,更有價值。還有個概率算式想必都聽過:1.01的365次方是37.8,而0.99的365次方是0.03,原本兩個初始概率相差無幾,但只要加入“時間”這一個變量,長期結(jié)果則判若云泥,正所謂“差之毫厘,謬以千里”。 這些都在告訴我們一個道理:相信系統(tǒng),堅持長期主義。這是概率思維贈給我們的禮物。只要決策系統(tǒng)有概率優(yōu)勢,我們就應(yīng)該相信系統(tǒng),長期堅持,而不要在乎單次決策結(jié)果的成敗,即重視過程,而非結(jié)果。 這應(yīng)該成為一個科學(xué)決策者的思維品質(zhì)。 |
|