心智從幼稚到成熟,重要標志是描述灰色地帶的詞匯越來越豐富。談論事態(tài),幼稚心智的特點是黑白分明,非此即彼,非好即壞,非雞湯即毒雞湯,語言特點是有兩極無中段。心智開始成熟,語言就增加了描述斑駁不純的詞匯,黑白之間有灰色,彼此之間有中立,天使與魔鬼之間有常人。 心智越成熟,描述灰色地帶的詞匯越多,應用越精確。有與無之間的灰色地帶是可能。“可能性很小”“不排除這種可能”“不大可能”“可能性不大”“有這種可能”指小于五五開的可能性,但程度有別;“或許”“有可能”“也許”指大致五五開的可能性;“大概”“很可能”“可能性很大”“可能性極大”“幾乎可以肯定”指大于五五開的可能性,但程度有別。 日常語言有用,然而模糊?!坝小睘榘祝盁o”為黑,“可能”為灰,灰度有別。能把灰色的“可能”大致分為三個譜段,就足以應付日常生活了。 從常識到哲學,也有語言標志。談論過去與現(xiàn)在,用“不可能”“可能”“現(xiàn)實”;談論現(xiàn)在與未來,用“不可能”“可能”“必然”。辯證思維,以無始無終的動態(tài)永恒為對象,把關(guān)于過去和關(guān)于未來的兩個三段論合二為一,進而把這個一轉(zhuǎn)化為無限的動態(tài)延續(xù)。不可能不是一種狀態(tài),是可以無限趨近但無法到達的極限;必然不是一種狀態(tài),是可以無限趨近但無法到達的極限;可能也不是一種狀態(tài),而是介于不可能與必然之間的無限延續(xù)上的一個運動中的點。 統(tǒng)計分析也以可能性為對象。統(tǒng)計分析的目的是展望未來的可能,手段是分析過去的可能。為了炫耀嚴謹,統(tǒng)計學家約定用不同的英文詞標識這兩種可能性。過去的可能性叫likelihood,一般譯為“或然”或“似然”,未來的可能性叫probability,一般譯為概率。 統(tǒng)計數(shù)據(jù)是過去的記錄,分析過去為了展望未來,努力當好事后諸葛亮,為的是有助于當好能掐會算的諸葛亮。分析過去的可能性,工具是對數(shù)回歸(logistic regression,logit regression)。 學統(tǒng)計方法的關(guān)鍵是正名,這一點對學“對數(shù)回歸”格外重要?!皩?shù)回歸”是我的譯法,常見的是音譯,“邏輯斯蒂回歸”(logistic regression)和邏輯特回歸(logit regression)。這類音譯有點像“阿耨多羅三藐三菩提”,用神秘的說法表達并不復雜的事態(tài)。“阿耨多羅三藐三菩提”指的是“無上正等正覺”,即最高級的智慧覺悟?!斑壿嬎沟佟薄斑壿嬏亍弊屓讼氲健斑壿嫛?,但那是被誤導的“遐想”;“對數(shù)”讓人想到“對數(shù)”,才是踏入征途的“聯(lián)想”。 概率為0,是不可能;概率為1,是必然。統(tǒng)計分析不關(guān)心不可能,也不關(guān)心必然,只關(guān)心從極?。o限接近0)到極大(無限接近1)的可能性。應用統(tǒng)計方法,不關(guān)心無限接近0的概率,也不關(guān)心無限接近1的概率,只關(guān)心具有現(xiàn)實意義的概率。對社會科學研究而言,極小概率是萬分之一,極大概率是萬僅一失。 思考可能性,似易實難。首先難在用什么單位測量可能性。在常識層面思考可能性,測量單位是彼此相等的小片段。比如,最常聽見但最不精密的測量單位是0.1,即“幾成把握”的“成”和“幾分把握”的“分”;更精密的測量單位是 0.01,0.001,0.0001。 其次難在思維方式。用彼此相等的小片段作為可能性的測量單位,采用的是線性思維方式。用直線思維思考概率的變化,即使測量單位精細到十萬分之一百萬分之一,回歸模型總會預測出小于零和大于一的概率。 關(guān)于可能性的對數(shù)回歸采用對數(shù)作為測量單位,相應的思維方式是S型曲線。統(tǒng)計學家用分數(shù)測量概率,但不停留于此,再做兩步轉(zhuǎn)換。第一步是把標志概率的分數(shù)轉(zhuǎn)換成發(fā)生率(odds),即一個事件發(fā)生的概率與其不發(fā)生的概率的比率(發(fā)生的概率為分子,不發(fā)生的概率為分母)。第二步是取發(fā)生率的自然對數(shù)(natural logarithm)(即以2.718為底的對數(shù))。這個對數(shù)就是logit,即 log of it,natural logarithm of it,it是發(fā)生率。以可能性為因變量,以logit為可能性的測量單位,回歸分析就是logit regression(邏輯特回歸),為了悅耳,叫做logistic regression(邏輯斯蒂回歸)。 統(tǒng)計學家用發(fā)生率的自然對數(shù)作為概率(可能性)的測量單位,實現(xiàn)了從直線思維到曲線思維的轉(zhuǎn)變。我們既能以近似線性回歸的方式分析自變量的變化如何影響因變量的變化,同時又不做出不合乎邏輯荒謬的預測。下圖展示的是與自然對數(shù)從-9.21增加到9.21相對的概率變化。 用SPSS自帶的“雇員數(shù)據(jù)”(Employee Data)分析雇員教育程度如何影響當經(jīng)理的概率,最小二乘回歸的模型會預測出負概率和大于一的概率,如下圖所示。 用同一個數(shù)據(jù)分析雇員教育程度如何影響當經(jīng)理的概率,對數(shù)回歸模型的預測符合邏輯。先看上學年數(shù)的增加如何影響當經(jīng)理的發(fā)生率自然對數(shù)。 再看上學年數(shù)的增加如何影響當經(jīng)理的概率。 |
|
來自: heshingshih > 《寫作》