你知道智商是什么嗎？

殘云伴鶴歸 2017-09-25

展開全文

如果說有哪個心理學術語是被最廣泛地誤解的，我會投票給“智商”。

智商這個概念，在中國幾乎已經(jīng)成了普通詞匯，但大多數(shù)人都沒有正確地理解什么是智商，只是把它當作“聰明程度”的近義詞來使用。

在這篇文章中，我會通過一系列問題，來科學地解釋一下，什么是智商。

心理學家為什么要發(fā)明智商測驗？

在心理學家們發(fā)明“智商”這個理論術語之前，人們也有描述類似現(xiàn)象的日常詞匯，在漢語里，有“聰明”，“靈敏”，“天賦異稟”，“愚蠢”，“呆板”，“笨拙”等詞匯。

這些日常用語很模糊，沒有精確含義，無法具體形容一個人的聰明程度或者愚蠢程度。由于沒有量化的表達方式，所以心理學家們對此表示很不滿意。

心理學家想要發(fā)明一套標準化的智商測驗，用具體的數(shù)字來丈量一個人的聰明程度或愚蠢程度。

之所以叫做智商（intelligence quotient），是因為它是被除數(shù)除以除數(shù)所得的商。以前用的是心理年齡除以生理年齡再乘100，一個孩子的心理年齡是7歲，生理年齡是6歲，那么智商就是117。

現(xiàn)在已經(jīng)不再用這么粗陋的算法了，而是用正態(tài)分布來計算離差智商。定義一群同齡人的平均智商是100，標準差是15。68%的人的智商在85到115之間，95%的人的智商在70到130之間。智商145的人幾乎比99.9%的同齡人要高，智商55的人比99.9%的同齡人要低。

這樣的標準化智商測驗，成功發(fā)明出來了嗎？

不完美的智商測驗，100多年前就已經(jīng)發(fā)明出來了，隨著100多年來的改進，今天已經(jīng)有很多種大規(guī)模應用的標準化智商測驗。比如，斯坦福—比奈量表、韋氏智力測驗、瑞文智力測驗，等等。

完美的智商測驗，還沒有發(fā)明成功，而且很可能永遠也發(fā)明不成功。因為智力和身高不同，它本身無法客觀衡量，只能通過發(fā)明心理量表來估測。既然說是估測，那就必然會有誤差。

但也不一定，也許再過幾十年或者幾百年，隨著科學和技術的發(fā)展，人類可以通過某種神經(jīng)測量手段，客觀地測量一個人的智力程度。當然，這種說法偏科幻，大家不要有什么期望。

這種標準化的智商測驗有什么用處？

可以用在科研上，應用范圍非常廣，就不多介紹了。

可以用在教育上，將不同智力的學生區(qū)分為不同的小組，進行分組教學，實現(xiàn)因材施教。

可以用在醫(yī)療上，為一些智力缺陷者（唐氏綜合癥、笨丙酮尿癥等等）進行輔助診斷。

可以用在軍隊中，將已有的智力太低的士兵開除，或者拒絕智力太低的士兵入伍，以免在前線戰(zhàn)斗上誤傷友軍。

可以用在社交上，一些高智商俱樂部（門薩俱樂部、三九俱樂部等等）使用智商測試作為入會門檻，方便俱樂部成員進行社交。

可以用在社會工程上，一個國家的獨裁者可以強制實施優(yōu)生學政策，將智力低下者進行絕育手術，以提高一國之國民的平均智力。這種方式的缺陷就是見效很慢（需要一兩代人的時間），測驗誤差的后果也很嚴重，而且違背當今的人道主義精神，會面臨國際上的嚴重批評。

可以用在公司招聘中，公司可以依據(jù)應聘者的智商分數(shù)，決定錄用或者不錄用，或者錄用后的崗位安排。我曾幫朋友做過阿里巴巴公司的校招筆試（在計算機上在線做，擋住攝像頭就行了），其中有部分題目是邏輯推理題，是智商測驗中的常用題目。

總之，只要用得好，那標準化的智商測驗，用處就很大。但難點就在于，智商測驗很難用好。

為什么說智商測驗很難用好？

小明出生于2010年，2017年時是7歲，他花了50分鐘，做了一套40道題目的智商測驗，答對了34道題目?，F(xiàn)在問，小明的智商是多少？

小強出生于1980年，2017年是37歲，他花了200分鐘，做了一套120道題目的智商測試，答對了82道題目。現(xiàn)在問，小強的智商是多少？

正確答案是，不知道。因為我們不知道應該拿什么樣的一群人和小明與小強做對比。

假設小明是中國人，那么理論上，我們可以用同樣的這套40道題目的智商測試，去找10萬個同樣是2010年出生的中國孩子，給他們也測量一下。如果這10萬個人的平均分數(shù)是34分，那么這就說明小明的智商是100，也就是平均值。

如果這10萬個人的平均分是20分，而標準差是5分，那么就說明小明的智力比平均值高出大約3個標準差，大概比98%的同齡人要高。

如果這10萬個人的平均分是20分，而標準差是1分，那么內(nèi)行人一眼就能看出這套測試設計得很爛，需要重新設計。小明的分數(shù)沒有任何意義，需要另外找一套智商測驗，重新測試。

那10萬個人的分數(shù)，就叫做常?！，F(xiàn)在的實際情況是，大多數(shù)時候，我們沒有足夠好的常模。當初建立常模時，數(shù)據(jù)量可能不夠多。哪怕數(shù)據(jù)量足夠多，也可能有些過時，沒有2010年版本的，只有1950年版本的。

之所以如此，是因為建立足夠好的常模并且不斷更新，需要很多錢。測試題本身的修訂和完善，也需要很多錢。一般的組織和機構，都沒有這么多錢。

網(wǎng)絡上流行的智商測試，靠譜嗎？

智商測試是否可靠，除了信度和效度這種最基本的要求之外，關鍵就是看常模了。只有具備很強經(jīng)濟實力的組織，才能夠建立并維持一個足夠好的常模。比如，韋氏智商測試和瑞文智商測試的版權，現(xiàn)在就是培生集團所有。培生是一個很有錢的全球化教育集團。

由于智商測試的常模通常是不公開的內(nèi)部機密數(shù)據(jù)。互聯(lián)網(wǎng)上流行的那些測試，是拿不到已有的常模數(shù)據(jù)的，所以它們大多是不靠譜的。或許有例外，比如2015年，瑞文智商測驗的標準答案就曾經(jīng)泄露到互聯(lián)網(wǎng)上，如果常模也泄露了，那么一些網(wǎng)站就可以對測試分數(shù)進行準確的解讀了。

就我所知，目前在網(wǎng)絡上沒有靠譜的免費的智商測試，如果有人知道，可以告訴我。

要在中國進行靠譜的智商測試，并非沒有可能。那些擁有智商測試版權的機構，會授權一些醫(yī)院、學校等組織，允許它們進行智商測試，把原始分數(shù)結果發(fā)回給公司總部，然后總部再參照常模給出解釋。所以，在中國可以找到一些有授權的醫(yī)院或其他組織。比如，中南大學湘雅醫(yī)院可以為幼兒和兒童進行智商測試。

普通人有必要主動做智商測試嗎？

通常情況下，沒有任何必要。智商分數(shù)和學校里的考試成績的相關系數(shù)，在0.5到0.7之間。也就是說，學校里的那些不同科目的考試，可以部分替代智商測試的功能，而且還是免費的。

假設你去正規(guī)組織，花了一些錢，做了一套智商測試，假設就是韋氏成人智商測試，得出了一個分數(shù)結果，假設就是120，那又能怎樣呢？這個120分不能讓你去更好的學校讀書，也不能讓你去更好的公司工作。這個分數(shù)的唯一用處就是讓你自我感覺良好而已。

麻煩在于，假設你的韋氏成人智商測試的分數(shù)，只有85分，那這個分數(shù)的唯一用處就是讓你自我感覺很糟糕，如此而已。

所以，對于絕大多數(shù)沒有智力障礙的普通人來說，沒有必要去主動做智商測試。從小到大，大家經(jīng)歷了這么多考試，在和同齡人的比較當中，對自己的智力水平，心中多少是有數(shù)的。

有什么學習或訓練的方法，可以提高一個人的智商嗎？

作為測試分數(shù)的智商，是可以提高的。只要拿到一套智商測試題，反復做很多次，就可以很熟練這套題目了。或者，讓得分高的人拿到題目給你講解一番，讓你也明白題目背后的邏輯原理。那么等你正式測試的時候，分數(shù)就提高了。

但這種提高是沒有意義的，只是讓表面的智商分數(shù)好看一些，智力實際上沒有提高。

從雙生子研究來看，智商的變異可以50%到80%由遺傳變異來解釋。這意味著，在給定一個人健康成長的情況下，比如母親懷孕時不酗酒，兒童成長過程中沒有營養(yǎng)不良，可以接觸到足夠豐富的心理刺激，沒有受到嚴重的腦部外傷，等等。我們不可控制的遺傳因素其實很大程度上決定了我們的智力。任何后天的培養(yǎng)，都很難提高一個人的智力。

這個說法可能導致一個誤解，那就是讀書無用論。很多低學歷農(nóng)村家長會誤以為供孩子們讀書沒有用處，但實際上讀書非常有用。接受義務教育或更高級的高中教育以及高等教育，就是接觸更豐富的心理刺激，這些雖然不是提升智商的方式，但它們是防止智力不充分發(fā)育的方式。所以，某種意義上說，唯一可靠的提升智商的方式，就是不要讓孩子輟學。

有一個很反直覺的研究結論，很多人都會以為，隨著兒童長大成人，影響智商變異的環(huán)境因素應該越來越大，遺傳因素應該越來越小，但實際結果恰好相反。成年人的智力，比起兒童的智力，其遺傳影響更大。這是為什么呢？

很可能是因為高智力者更可能去追求有著更豐富心理刺激的環(huán)境，從而鍛煉自己的智力。這意味著環(huán)境對于智力的提升，其實也有不小的作用。但人們很難利用起這個作用，因為一個人選擇什么樣的環(huán)境，很大程度上也受到了智力的影響。

不同的人群，智商會有什么差異嗎？

從地域來看，智商測試分數(shù)的結果，東亞人最高，歐美人居中，非洲人最低。不過原因倒不是東亞人智力最高，而可能是東亞人最熟悉紙筆考試，非洲人最不熟悉這種考試。

從社會經(jīng)濟地位來看，有錢人比窮人的智商要高，背后的原因很復雜?？赡苁且粋€人智力更高，能完成更有難度的工作，所以有更高的收入，能給孩子提供更好的教育。而不是反過來，一個人只要更有錢，就可以有更高的智力。一個中了巨額彩票的人，會突然變得更有錢，但智力不會突然變高。

從學歷來看，高學歷者比低學歷者智商要高，不過這很符合常識，我也不多解釋了。不過，不要把統(tǒng)計意義上的相關理解錯，這句話不是說任意高學歷者的智商會比任意低學歷者的智商高，而是說隨機選取100位高學歷者的平均智商會比隨機選出的100位低學歷者的平均智商要高。

從性別來看，目前沒有發(fā)現(xiàn)男性和女性的顯著差異。通常也認為男性和女性之間沒有智力差異。如果得出有差異的結論，那就是政治不正確，也不大可能發(fā)表。

從族裔來看，美國的黑人會比美國的白人的智商要低一些，不過這不大可能是由遺傳因素導致，更可能是教育因素導致的。美國黑人往往社會經(jīng)濟地位更低一些，對教育的投入也沒有白人那么大。

從年齡上來看，由于現(xiàn)有的離差智商是以某一個體和他的同齡人進行對比，所以不同年齡人的智商分數(shù)的比較沒有意義。但從智力來看，一般認為成年人的智力比兒童高，而老年人比自己年輕時可能會有一定程度的認知能力的降低。這些結論都是常識。

如果從歷史發(fā)展的角度來看，還有一個很有趣的現(xiàn)象，叫做弗林效應。它描述的是人類的智商測試分數(shù)大概每10年就提高了3點。換句話說，讓100年前的人做今天的智商測試，他們的平均分數(shù)就只有70。而一般低于70，就會被認為是弱智患者了。

為什么會出現(xiàn)弗林效應呢？

最可能的原因，不是人類的智力在這100年的時間里提高了30點，而是用來測量智力的智商量表的設計問題。

實際上，已有的智商量表并不能直接測量g因素，它只能測量s因素。最常用的s因素，就是抽象邏輯推理能力。換句話說，我們實際上是在通過測量一個人的抽象邏輯推理能力，來推測一個人的一般認知能力。

所以，這100年來，人類的智力可能沒有多少提高，但抽象邏輯推理能力大大提高了。

為什么人類的抽象邏輯推理能力大大提高了呢？

這主要是因為教育普及導致的。以前，接受教育是貴族的特權。而今天，義務教育強制所有孩子都要去上學，接受高等教育的人也越來越多。在這些教育中，無論是數(shù)學、語文、物理、化學、生物還是什么科目，都在強調(diào)抽象的邏輯推理能力。

換句話說，是科學教育的普及，導致了弗林效應的出現(xiàn)。

哪些心理學家為智商測驗的發(fā)展做出了巨大的貢獻？

非常多，我只列舉最先出現(xiàn)在我腦海中的三位：

達爾文的表弟，高爾頓（Francis Galton，1822—1911）是我想到的第一個。他可以看作心理測量學之父。他曾試圖發(fā)明標準化的智商測驗，但沒有成功。失敗的原因之一，就是他想要通過測量顱骨大小來判斷智力高低，事后發(fā)現(xiàn)這種方式很不靠譜。但高爾頓對智力的定量測量的嘗試，是很有價值的。

第一套真正有用的智商測驗，法國心理學家比奈（Alfred Binet，1857—1911）發(fā)明的。法國1882年就在全國范圍推進了免費的義務教育制度，孩子們必須去學校上學。隨之而來出現(xiàn)了一個問題，有些孩子在學習上總是跟不上別的孩子，所以學校就想著把這群孩子們集中到一起，進行特殊的強化教育。1905年，比奈和他的同事們試圖通過測量孩子們的語言能力來判斷他們的智力高低，事后發(fā)現(xiàn)這種方式還算靠譜。在比奈發(fā)明這套智商測試之前，學校里判斷學生是否需要特殊強化教育，都是靠教師的主觀判斷，誤差很大。

英國心理學家斯皮爾曼（Charles Spearman，1863—1945）做出很多理論上和數(shù)學上的貢獻。他區(qū)分了g因素和s因素。s因素就是某種具體的能力，比如記憶能力、語言能力、空間想象能力、數(shù)學計算能力、邏輯推理能力、問題解決能力、學習能力等等。g因素現(xiàn)在又叫一般認知能力，是很多智商測驗試圖測量的因素。換句話說，g因素（g factor）、一般認知能力（general cognitive ability）、智商（IQ）這三個詞，幾乎是同義詞。