二、因果函數(shù)(決定論/因果論) 決定論是六西格瑪?shù)暮诵乃枷?。大多?shù)人認為科學性是這一觀點的基礎,并主張每一個現(xiàn)有現(xiàn)象都是由另一個或多個現(xiàn)有現(xiàn)象造成的。例如,我們知道“答案”源于“問題”。反過來,我們可以說“問題”是“思考”的結果。因此,許多人認為,我們的日?,F(xiàn)實可以由一系列相互交叉的因果關系來定義。當然,我們可以影響一些因果鏈,而其他的則超出了我們的控制范圍。盡管如此,我們也會努力挖掘、理解并利用決定論的力量。 某種原因使得X不能完全解釋Y,或X不是導致Y變化的唯一因素,這時,我們必須采用誤差模型Y=f(X)+ε,其中ε是其他因素對Y的貢獻,是其他因素對Y預測的擾動,是導致Y預測不確定性的來源。從這個角度來看,科學概念中的誤差與不確定性是同義詞。誤差(本身)不是“犯錯”,而是人們對“偏離或不同”的科學理解。誤差是客觀實在,而犯錯是主觀判斷。 在這樣的背景之下,我們懂得了不確定性(風險)來源于Y或X的變異,無關乎變異的種類。因此,變異的概念密切相關于可再現(xiàn)和可重復的概念,而后兩個概念又關聯(lián)于仿行誤差的概念。為了更好的解釋誤差,我們來比較Y的性能觀測與對應的模型預測ζ。如果觀測值Yi不等于ζ,就可以說Y的觀測值與模型(預期)預測不同(偏離),因此|δi |>0。 一般而言,ζ可以是特性的名義值(如T)、也可以是中心趨勢的度量(如μ),甚至可以是規(guī)定的其他Y(如Yk)。當考慮差值δi=Yi–μ時,我們發(fā)現(xiàn)誤差δi是一種特殊的“平均偏差”。據(jù)此,我們可能會試圖根據(jù)偏差的具體大小、方向、在某時間段的情況和在某時刻點的情況對其進行分類描述。當然,這種刻畫研究的結果將使我們能夠更好地定義或以其他方式描述潛在的因果系統(tǒng),唯有如此,Y才能在科學上與x聯(lián)系起來。誤差的逐步分類是現(xiàn)代問題解決和六西格瑪實踐的核心。 三、函數(shù)的多元拓展 遺憾的是單個自變量不能來充分描述自然界中的大多數(shù)現(xiàn)象,因為大多數(shù)現(xiàn)象比較復雜。某種程度上來說,單變量情況的研究基本表明ε>0。為了完全消除這種不確定性(誤差),有必要阻斷所有其他原因(自變量)。隨后需要檢查因變量之間的獨立性以及因子的交互效應 — 瞬時和長時。只有當這些效應已知或假設合理時,才能得出Y=f(X1,…,XN)。如前所述,我們認為Y是因變量,f是傳遞函數(shù)(因果機制),X是自變量,N是最后一個可能的X。 只有確定了或以有效可靠的方式定義了所有影響Y的X時,才能說自變量的集合是完備的或“詳盡的”。這意味著對掌握了或以其他方式說明了所有影響Y的自變量。簡而言之,從邏輯上可以斷言,當數(shù)量N接近其自然上限時,Y中的固有誤差必然會接近于零,也就是說沒有誤差。 然而,在實踐中,幾乎不可能在所有的X定義域內建立可行的聯(lián)系Y與X的函數(shù),所以很難發(fā)現(xiàn)N是完全詳盡的并且函數(shù)f是絕對有效和可靠的。所以我們得承認,至少從某種統(tǒng)計和實用的程度上來講,Y的預測與實際值之間是不相等的,亦即存在誤差。所以,我們必須修改上述函數(shù)關系,等到新的模型,也就是Y=f(X1,…,XN)+ε。和單變量情況一下,此處的ε也是其他因素對Y的貢獻,是其他因素對Y預測的擾動,是導致Y預測不確定性的來源。只有在給定有效可靠的傳遞函數(shù)f和一組詳盡的因變量時,我們才有可能合理地宣稱ε=0。總之,我們通常被迫處理ε>0的情況,因此,一直存在著對數(shù)理統(tǒng)計的需求。 對于任何因變量Y,相應因果關系系統(tǒng)中的每個X都會產(chǎn)生獨特的影響貢獻(W)。當然,每個X的權重都是在0.0<Wi<1.0的范圍內,其中Wi是第i個自變量的貢獻權重。 基于如上討論這一知識、f的充分合理性以及N是完備的聲明,可以合理地斷言通過Xs來完美無誤的描述Y。換言之,我們對Y的描述不會有任何固有的“誤差”,因為這是根據(jù)有效且完全可靠的傳遞函數(shù)f得到的Y的數(shù)值。也就是說,對于任何一組獨特的瞬時或縱向條件,都有可能100%確定地預測或以其他方式描述Y的性質。 掃碼加好友,群聊更精彩 |
|