作者介紹 楊志明/湖南師范大學(xué)測(cè)評(píng)研究中心主任、外國(guó)語(yǔ)學(xué)院教授,ETS Assessments(Beijing)顧問(wèn),(美國(guó))教育考評(píng)局(ERB)原技術(shù)總監(jiān),香港中文大學(xué)博士。 【摘 要】 高考新方案中學(xué)業(yè)水平等級(jí)考試的賦分方案?jìng)涫軤?zhēng)議,因?yàn)榉桨笇?shí)施后選考物理等較難學(xué)科的中上水平考生因“高手對(duì)決”得了低分,而選考較易學(xué)科的考生因“矮子里面拔將軍”獲得了高分,導(dǎo)致高考總分排序出現(xiàn)了問(wèn)題。本文根據(jù)國(guó)際考試行業(yè)的成功經(jīng)驗(yàn)和我國(guó)的實(shí)際情況,為完善賦分方案提出了“理想方案”和“滿意方案”,討論了一些“無(wú)奈方案”,期待這些討論能為正在制定高考新方案的有關(guān)省市帶來(lái)新的視角。 【關(guān)鍵詞】 高考;學(xué)業(yè)水平考試;賦分方法 2014年9月頒布的《國(guó)務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》(以下簡(jiǎn)稱《實(shí)施意見》)明確提出,要“改革招生錄取機(jī)制,探索基于統(tǒng)一高考和高中學(xué)業(yè)水平考試、參考綜合素質(zhì)評(píng)價(jià)的多元錄取機(jī)制”,并在賦予學(xué)生“選學(xué)選考自由”的權(quán)利、克服“一考定終身”的弊端、實(shí)現(xiàn)“由選分為主到選人為主”的招生模式等方面提出了殷切期待。從社會(huì)經(jīng)濟(jì)發(fā)展對(duì)人才素質(zhì)的要求等方面來(lái)看,《實(shí)施意見》是完全順應(yīng)時(shí)代發(fā)展方向的一項(xiàng)重大舉措。然而,“好馬還需配好鞍”,一項(xiàng)政策的實(shí)施效果往往受制于許多因素,如思想觀念、公平機(jī)制、技術(shù)手段等,其中任何一個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題都可能造成嚴(yán)重的負(fù)面影響。從浙江、上海兩地的試點(diǎn)情況來(lái)看,“技術(shù)環(huán)節(jié)”的一些不足直接導(dǎo)致了“選考物理的學(xué)生人數(shù)大幅度下降”[1][2],以及“選學(xué)自由被'田忌賽馬’規(guī)則所左右”[3]等非常棘手的問(wèn)題。從已經(jīng)公布的6省市高考綜合改革方案來(lái)看,大家的問(wèn)題解決思路基本局限在“限制選擇”等政策調(diào)整方面,技術(shù)方面的問(wèn)題解決力度明顯不夠[4][5][6][7][8]。比如,目前所設(shè)計(jì)的一些“保障機(jī)制”[9][10]就很可能演變成一系列“防不勝防”的麻煩。其實(shí),“賦分方案”好比是一輛汽車的“發(fā)動(dòng)機(jī)”,汽車設(shè)計(jì)得再好,如果發(fā)動(dòng)機(jī)質(zhì)量存在先天缺陷,整臺(tái)汽車的質(zhì)量就會(huì)大打折扣。為了完善高考改革新方案,很有必要把“賦分方案”這臺(tái)“發(fā)動(dòng)機(jī)”設(shè)計(jì)到盡可能地令人滿意。為此,本文從教育測(cè)量學(xué)的理論與應(yīng)用角度,為完善高中學(xué)業(yè)水平等級(jí)考試賦分方案,設(shè)計(jì)了“理想方案”和“滿意方案”,并討論了一些“無(wú)奈方案”,期待可以為其他正在準(zhǔn)備實(shí)施高考新方案的?。▍^(qū)、市)提供一些參考。 高考新方案的一個(gè)亮點(diǎn)是賦予了學(xué)生選考的自由,即語(yǔ)文、數(shù)學(xué)和外語(yǔ)為必考科目,其他3門可以從政治、歷史、地理、物理、化學(xué)、生物6門或7門(含信息技術(shù))科目中任選。其中,必考科目主要為全國(guó)統(tǒng)一命題,其他科目為分?。ㄊ校┟},統(tǒng)考之外的科目成績(jī)來(lái)自高中學(xué)業(yè)水平等級(jí)考試。不過(guò),目前的學(xué)業(yè)水平等級(jí)考試賦分規(guī)則值得進(jìn)一步完善。教育部在《關(guān)于普通高中學(xué)業(yè)水平考試的實(shí)施意見》[11]中規(guī)定,“計(jì)入高校招生錄取總成績(jī)的學(xué)業(yè)水平考試3個(gè)科目成績(jī)以等級(jí)呈現(xiàn),其他科目一般以'合格、不合格’呈現(xiàn)。以等級(jí)呈現(xiàn)成績(jī)的一般分為五個(gè)等級(jí),位次由高到低為A、B、C、D、E。原則上各?。▍^(qū)、市)各等級(jí)人數(shù)所占比例依次為:A等級(jí)15%,B等級(jí)30%,C等級(jí)30%,D、E等級(jí)共25%。E等級(jí)為不合格,具體比例由各省(區(qū)、市)根據(jù)基本教學(xué)質(zhì)量要求和命題情況等確定”。根據(jù)這個(gè)規(guī)定,目前出臺(tái)的6省市高考綜合改革賦分方案設(shè)計(jì)了如表1所示的具體賦分規(guī)則(海南省使用標(biāo)準(zhǔn)分,本文不做討論)。 表1 目前出臺(tái)的部分省市學(xué)業(yè)水平等級(jí)考試賦分規(guī)則 十分遺憾的是,這些賦分規(guī)則存在著一些問(wèn)題,因?yàn)樵凇斑x考自由”的情況下,這些規(guī)則會(huì)直接導(dǎo)致很多考生的等級(jí)分?jǐn)?shù)被嚴(yán)重低估或高估。也就是說(shuō),一旦發(fā)生大量低水平考生棄考的情況(如物理),選考群體的原始得分分布必定會(huì)呈極端負(fù)偏態(tài),這時(shí),很多中上水平考生的等級(jí)分?jǐn)?shù)就會(huì)比應(yīng)有水平低估很多;一旦出現(xiàn)大多數(shù)高水平考生沒有選考的情況(如浙江省的信息技術(shù)學(xué)科),選考群體的原始得分分布必定會(huì)呈極端正偏態(tài),這時(shí)很多中下水平考生的等級(jí)分?jǐn)?shù)就會(huì)比應(yīng)有水平高估很多。有大數(shù)據(jù)模擬研究發(fā)現(xiàn),只要某門學(xué)科的競(jìng)爭(zhēng)對(duì)手很強(qiáng)并且低水平考生大規(guī)模棄考,很多實(shí)質(zhì)上水平不錯(cuò)的考生(約66%)就必定會(huì)獲得比自己應(yīng)有水平更低的分?jǐn)?shù)(最不幸者會(huì)少得6分);只要某門學(xué)科的競(jìng)爭(zhēng)對(duì)手不強(qiáng)并且大多數(shù)高水平考生沒有選考,很多實(shí)質(zhì)上水平不高的考生(約84%)就必定會(huì)獲得比自己應(yīng)有水平更高的分?jǐn)?shù)(最幸運(yùn)者可多得6分)。[12]于是,一個(gè)中等水平的考生,一旦他選考了很多低水平考生棄考的,而且一流高校招生又強(qiáng)行要求的較難學(xué)科(比如物理),則很可能會(huì)比應(yīng)有水平少拿6分;若他選考了大部分高水平考生看不上的,而且一流高校招生也可以使用的較易學(xué)科(比如信息技術(shù)),則很可能會(huì)比應(yīng)有水平多得6分。這樣一反一復(fù),一個(gè)中等水平考生的“選考決策”會(huì)直接導(dǎo)致高考總分少拿12分左右的嚴(yán)重后果。特別地,當(dāng)這種“低估或高估”現(xiàn)象在試點(diǎn)過(guò)程中被大家親身感受之后,選學(xué)選考過(guò)程中的“田忌賽馬”行為就變得更加嚴(yán)重,這就極大地增加了社會(huì)治理成本。 更為不妙的是,由于“避難就易”是人的天性,所以選學(xué)物理等較難學(xué)科的人數(shù)一定會(huì)更少。這種現(xiàn)象即使在國(guó)家或高校大力鼓勵(lì)學(xué)生選學(xué)物理等學(xué)科的情況下也無(wú)法杜絕。比如,美國(guó)的高考是高度自由選擇的,學(xué)生在9~12年級(jí)期間,每年都有12次機(jī)會(huì)(6次SAT和6次ACT)參加任何一門學(xué)科或SAT-I的高考。令人吃驚的是,美國(guó)的高中生僅有16%的人對(duì)較難學(xué)科STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))相關(guān)的職業(yè)感興趣[13],這還是在美國(guó)政府和許多高校從招生到助學(xué)貸款等方面給出許多實(shí)質(zhì)性優(yōu)惠政策,大力鼓勵(lì)學(xué)生選學(xué)STEM項(xiàng)目的情況下發(fā)生的。于是,“避難就易”的人性特點(diǎn)疊加上“田忌賽馬”的游戲規(guī)則,直接導(dǎo)致了選學(xué)選考物理學(xué)科人數(shù)大幅度下降等一系列問(wèn)題。 為了解決物理等學(xué)科出現(xiàn)的大規(guī)模棄考等問(wèn)題,試點(diǎn)省市推出了等級(jí)分?jǐn)?shù)計(jì)算過(guò)程中的“保障機(jī)制”。比如,浙江省規(guī)定,當(dāng)物理考生人數(shù)低于6.5萬(wàn)人時(shí),各等級(jí)分?jǐn)?shù)的人數(shù)比例按分母為6.5萬(wàn)人由高到低計(jì)算(上海市為1.5萬(wàn))。十分遺憾的是,這種保障機(jī)制存在著很多隱患。比如,除了物理學(xué)科,其他學(xué)科是否也需要設(shè)置保障機(jī)制?這個(gè)保障基數(shù)為什么是6.5萬(wàn)而不是7萬(wàn)或8萬(wàn)?不同省市的保障機(jī)制該如何設(shè)定?假若全省只有6500人參加物理考試,則無(wú)論大家的物理知識(shí)和能力水平如何,任何選考了物理學(xué)科的學(xué)生閉著眼睛也可以獲得91分以上的成績(jī)(按照浙江省的賦分規(guī)則)。假若真的出現(xiàn)這種情況,其他沒有選考物理的考生是否會(huì)特別委屈?這種保障機(jī)制是在消除“田忌賽馬”投機(jī)行為,還是在迫使大家更加仔細(xì)地去琢磨誰(shuí)可能是自己的競(jìng)爭(zhēng)對(duì)手?顯然,目前設(shè)置的保障機(jī)制可能帶來(lái)意想不到的麻煩。 實(shí)際上,高中學(xué)業(yè)水平等級(jí)考試賦分問(wèn)題的解決還需要有測(cè)量技術(shù)手段的強(qiáng)力支持,簡(jiǎn)單的行政命令或維穩(wěn)措施是不可能消除“田忌賽馬”行為的。這就好比一輛汽車,一旦其發(fā)動(dòng)機(jī)在設(shè)計(jì)上出了問(wèn)題,要想依靠調(diào)整汽車外形或內(nèi)部裝修等手段來(lái)解決問(wèn)題顯然是不可能的。目前一些省市因?yàn)橛龅椒謹(jǐn)?shù)轉(zhuǎn)換等難題而推出的“限考一次”等規(guī)定,顯然屬于政策調(diào)整,其問(wèn)題的完全解決還需要依靠教育測(cè)量科學(xué)等方面的手段。 從教育測(cè)量的理論與應(yīng)用角度看,根治“低估或高估等級(jí)分?jǐn)?shù)”和“田忌賽馬”問(wèn)題的理想方案是采用“標(biāo)準(zhǔn)設(shè)定”(standard setting)與“測(cè)驗(yàn)等值”(test equating)相結(jié)合的解決方法。[4]也就是說(shuō),各選考科目首次考試成績(jī)要進(jìn)行等級(jí)標(biāo)準(zhǔn)設(shè)定,以后每年要精心選擇一個(gè)測(cè)驗(yàn)等值樣本,通過(guò)測(cè)驗(yàn)等值的辦法推算每個(gè)科目、每次考試的水平等級(jí)線。具體來(lái)說(shuō),該方案包括“標(biāo)桿試卷的研發(fā)”“學(xué)業(yè)標(biāo)準(zhǔn)的設(shè)定”“分?jǐn)?shù)常模的研制”以及“測(cè)驗(yàn)等值的實(shí)現(xiàn)”4項(xiàng)內(nèi)容。[5]簡(jiǎn)單地說(shuō),規(guī)避學(xué)業(yè)水平等級(jí)考試賦分方案風(fēng)險(xiǎn)的理想方案是“固定標(biāo)準(zhǔn) 年年等值”。其具體操作技術(shù)需要由相關(guān)的專業(yè)團(tuán)隊(duì)來(lái)完成。 事實(shí)上,我國(guó)目前遇到的問(wèn)題在20世紀(jì)30~40年代美國(guó)推行高考(SAT)選考自由機(jī)制時(shí)也同樣存在。比較幸運(yùn)的是,他們?cè)诮?jīng)過(guò)3年左右的混亂之后,通過(guò)“固定標(biāo)準(zhǔn)與年年等值”相結(jié)合的辦法,在1941年就把問(wèn)題解決了。他們?cè)?941年設(shè)定好高考標(biāo)桿和標(biāo)準(zhǔn)之后,不再每年每次更新標(biāo)準(zhǔn),而是長(zhǎng)期使用同樣的標(biāo)準(zhǔn)(1941—1990),所有新測(cè)驗(yàn)都被通過(guò)類似于美元與人民幣兌換的測(cè)驗(yàn)等值方式,把卷面分?jǐn)?shù)轉(zhuǎn)換成標(biāo)桿試卷刻度系統(tǒng)上的分?jǐn)?shù)(量表分?jǐn)?shù))。廣東省當(dāng)年的高考標(biāo)準(zhǔn)分制度本來(lái)效果不錯(cuò),可惜其具體操作過(guò)程中所采用的“年年設(shè)定新標(biāo)準(zhǔn)”而不是“固定標(biāo)準(zhǔn) 年年等值”的思路,在遇到學(xué)生具有選考自由的情況下(“3 X”高考方案),直接造成了“低估高水平學(xué)生成績(jī)”的嚴(yán)重后果。這種“缺失標(biāo)準(zhǔn)和缺失等值”的“偽標(biāo)準(zhǔn)分”制度最終被廣東省所拋棄。 有評(píng)論說(shuō)[8],“固定標(biāo)準(zhǔn) 年年等值”的賦分方案“是理論上最為完美的解決方案,是最與世界接軌的思路與做法,也是國(guó)外很多著名考試項(xiàng)目的常規(guī)做法”。不過(guò),不少人對(duì)這個(gè)方案表示擔(dān)憂,認(rèn)為“老百姓可能不會(huì)接受等值分?jǐn)?shù)”。比如,有學(xué)者指出,“我國(guó)的考情和歐美一些發(fā)達(dá)國(guó)家大不一樣,他們很多成熟有效的做法在我國(guó)未必可行。如每次考試都要組織動(dòng)機(jī)相似的考生樣本組進(jìn)行保密的額外測(cè)試和數(shù)據(jù)分析等值等工作,不僅在我國(guó)由于操作可行性原因難以實(shí)施,從理論上看,我國(guó)高考和西方以選擇題等客觀性題目為主的考試形式不同,大量?jī)?nèi)容是難以定量分析的主觀性試題,更有滿分達(dá)60分之多的寫作等大型主觀題,也會(huì)提出更多的技術(shù)挑戰(zhàn)”[8]。 誠(chéng)然,我國(guó)國(guó)情的特殊性的確會(huì)造成一定困難,但這些困難也是有辦法被克服的。比如,關(guān)于我國(guó)高考中主觀題題量大的問(wèn)題,如果采用代表性樣本基礎(chǔ)上的等值“等組設(shè)計(jì)”(equivalent group design),配合“線性等值”(linear equating)或“等百分位等值”(equipercentile equating)技術(shù),就不會(huì)成為問(wèn)題。關(guān)于“等值樣本應(yīng)考動(dòng)機(jī)不強(qiáng)”和保密等問(wèn)題,也可以通過(guò)“外錨設(shè)計(jì)”配合一定的優(yōu)惠政策等辦法得到解決。當(dāng)然,具體的等值操作過(guò)程需要有一批經(jīng)過(guò)專門訓(xùn)練的測(cè)量分析專家(psychometrician),這就需要轉(zhuǎn)變各省(區(qū)、市)考試機(jī)構(gòu)的職能,變單純的管理部門為考試專業(yè)服務(wù)機(jī)構(gòu),通過(guò)培訓(xùn)和招募專業(yè)人才等辦法,提升測(cè)驗(yàn)命題和測(cè)量分析的水平。在美國(guó)的考試行業(yè)一直流行這樣一個(gè)“潛規(guī)則”:如果舍不得花大價(jià)錢聘用高水平的測(cè)驗(yàn)命題和測(cè)量分析專家,就不得不花費(fèi)大價(jià)錢聘用高水平的律師去幫測(cè)評(píng)機(jī)構(gòu)打官司。兩種人才盡管都是為測(cè)評(píng)機(jī)構(gòu)“消災(zāi)解難”服務(wù)的,但管理的層次卻差別很大。顯然,這個(gè)規(guī)則在我國(guó)同樣很有參考價(jià)值,如果大家舍不得花大力氣建設(shè)好各省市的測(cè)評(píng)機(jī)構(gòu),就一定會(huì)為后續(xù)的社會(huì)維穩(wěn)等工作付出較高成本。事實(shí)上,在海外所有專業(yè)性考試機(jī)構(gòu)中,測(cè)驗(yàn)等值等心理計(jì)量學(xué)的工作一般由測(cè)量學(xué)家(psychometrcian)和統(tǒng)計(jì)分析師(statistician)組成的專業(yè)團(tuán)隊(duì)合作完成,他們大多具有心理計(jì)量學(xué)(psychometrics)、統(tǒng)計(jì)學(xué)和數(shù)學(xué)等相關(guān)專業(yè)的博士學(xué)位,并有過(guò)3年以上的實(shí)戰(zhàn)經(jīng)驗(yàn)。這些做法值得各級(jí)考試機(jī)構(gòu)參考。 由于各級(jí)考試機(jī)構(gòu)大多缺乏測(cè)驗(yàn)等值的專業(yè)團(tuán)隊(duì),老百姓也不太明白什么是等值分?jǐn)?shù),因此,直接使用國(guó)際考試行業(yè)通行做法的時(shí)機(jī)尚不成熟。為此,建議暫時(shí)放棄“理想方案”中的“測(cè)驗(yàn)等值”,嘗試使用另一種方案,即保留各省(區(qū)、市)目前推出的賦分規(guī)則,但在確定各科等級(jí)分?jǐn)?shù)時(shí),“以全省(區(qū)、市)的代表性樣本為參照”。因?yàn)楦鶕?jù)代表性樣本所確定的等級(jí)分?jǐn)?shù),不會(huì)受到選考群體的得分分布為極端正偏態(tài)或極端負(fù)偏態(tài)的影響。這個(gè)方案盡管不能保障每次考試的分?jǐn)?shù)是等值的,但可以避免“田忌賽馬”行為所造成的分?jǐn)?shù)被低估或高估等問(wèn)題,因此,這個(gè)方案可以稱之為“滿意方案”。 實(shí)施“滿意方案”的步驟十分簡(jiǎn)單。第一步,根據(jù)歷年的高考數(shù)據(jù)確定全?。▍^(qū)、市)代表性樣本的構(gòu)成方式。其中最重要的兩個(gè)變量是:在理科綜合(含物理、化學(xué)、生物)或文科綜合(政治、歷史、地理)考試中,全省各地、州、市歷年的考生比例均值(用變量D表示),以及示范性高中與普通高中歷年的考生比例均值(用變量K表示);第二步,按照原有模式舉行學(xué)業(yè)水平等級(jí)考試,不改變現(xiàn)行考試的所有做法;第三步,從全省(區(qū)、市)選考群體中通過(guò)控制變量D和K的方式,隨機(jī)選取100個(gè)代表性樣本(也可以是1000個(gè)代表性樣本等);第四步,對(duì)每個(gè)代表性樣本按照各?。▍^(qū)、市)現(xiàn)行賦分規(guī)則確定等級(jí)分?jǐn)?shù)線(如5等21級(jí)),再求取這些分?jǐn)?shù)線在100個(gè)或更多個(gè)代表性樣本上所得等級(jí)分?jǐn)?shù)線的均值,這些均值即為全省(區(qū)、市)該學(xué)科的“原始分?jǐn)?shù)與等級(jí)分?jǐn)?shù)的轉(zhuǎn)換關(guān)系”(年度學(xué)科常模);第五步,根據(jù)“年度學(xué)科常模”,把所有考生在對(duì)應(yīng)學(xué)科上的原始分?jǐn)?shù)轉(zhuǎn)換為等級(jí)分?jǐn)?shù)。其他工作與常規(guī)步驟完全一致。 根據(jù)大數(shù)據(jù)模擬研究的結(jié)果,使用代表性樣本確定等級(jí)分?jǐn)?shù)線的方案,無(wú)論考生群體是特別優(yōu)秀的還是優(yōu)秀學(xué)生特別少的,其原始分?jǐn)?shù)經(jīng)過(guò)“年度學(xué)科常模”轉(zhuǎn)化之后的等級(jí)分?jǐn)?shù),都與“沒有選考自由”情況下很多考生參加考試時(shí)的分?jǐn)?shù)非常相似,沒有考生的等級(jí)分?jǐn)?shù)會(huì)被低估,但約有5.98%的中等水平考生可以多得3分。這與“大約66%的中上水平考生成績(jī)被低估”和“大約84%的中下水平考生成績(jī)被高估”的局面完全不同。[12]可以說(shuō),“田忌賽馬”無(wú)法獲得明顯好處。這時(shí),只要明確高校招生工作中對(duì)物理等學(xué)科的要求,選考物理學(xué)科的學(xué)生人數(shù)一定可以得到有力的保障。不過(guò),只要存在選考的自由,選考物理等較難學(xué)科的人數(shù)一定會(huì)有所下降,但使用“滿意方案”后不會(huì)因?yàn)橘x分規(guī)則的不合理而加劇這種下降。 使用“滿意方案”的最大好處是,不需要對(duì)現(xiàn)行賦分規(guī)則做調(diào)整,僅僅需要在確定等級(jí)分?jǐn)?shù)線的時(shí)候增加一個(gè)前提條件——用代表性樣本確定等級(jí)分?jǐn)?shù)線,“田忌賽馬”難題就可以得到根治。由此,中學(xué)選課走班制的試行、高考招生工作中管理成本的降低等,都有了期許。 為了完善學(xué)業(yè)水平等級(jí)考試的賦分方案,許多專家提出了自己的解決方案,其中,“使用標(biāo)準(zhǔn)分”“使用原始分”和“將語(yǔ)、數(shù)、外考試作為錨測(cè)驗(yàn)去預(yù)測(cè)物理等學(xué)科等級(jí)分?jǐn)?shù)”這3種思路影響最大。其實(shí),這些方案各自存在著一些不足,可以被統(tǒng)一歸納為“無(wú)奈方案”。 關(guān)于“使用標(biāo)準(zhǔn)分”方案,該方案的前提條件是“標(biāo)準(zhǔn)設(shè)定或常模研發(fā)與分?jǐn)?shù)等值相結(jié)合”“測(cè)驗(yàn)的原始得分分布基本上呈正態(tài)分布”,缺乏其中任何一個(gè)環(huán)節(jié)的標(biāo)準(zhǔn)分方案都屬于“偽標(biāo)準(zhǔn)分”方案。這是因?yàn)?,一方面,一旦選考群體為高水平群體(如浙江省的物理考生),則注定會(huì)出現(xiàn)原始分?jǐn)?shù)的極端負(fù)偏態(tài)分布的局面(圖1)。這時(shí),無(wú)論使用何種方法計(jì)算標(biāo)準(zhǔn)分(公式方法、百分位等級(jí)化方法、正態(tài)化方法等),由原始分所轉(zhuǎn)換過(guò)來(lái)的任何標(biāo)準(zhǔn)分?jǐn)?shù)都是不恰當(dāng)?shù)模驗(yàn)闀?huì)有相當(dāng)多的中上水平考生的標(biāo)準(zhǔn)分?jǐn)?shù)變得比應(yīng)有的分?jǐn)?shù)更低。 圖1 大量低水平考生棄考物理等較難學(xué)科時(shí)的負(fù)偏態(tài)分布 另一方面,一旦發(fā)生大家只能在物理和信息技術(shù)兩科中選考一門的情況,優(yōu)秀學(xué)生為了報(bào)考“985”和“211”等高水平學(xué)校,必定會(huì)選考物理。于是,選考信息技術(shù)的考生群體中的“高手”很可能會(huì)變得較少,考生原始得分分布很可能會(huì)是極端的正偏態(tài)分布(圖2)。因此,這種情況下的“偽標(biāo)準(zhǔn)分”一定會(huì)把很多中下水平的考生成績(jī)推高,造成另一種不公平的結(jié)果。廣東省當(dāng)年試行了幾十年的高考標(biāo)準(zhǔn)分制度,在遇到“3 X”方案時(shí),就因?yàn)槲锢磉x考群體主要由“尖子”學(xué)生構(gòu)成,導(dǎo)致了許多物理高水平學(xué)生的標(biāo)準(zhǔn)分?jǐn)?shù)被嚴(yán)重低估。 圖2 大量高水平考生沒有選考較易學(xué)科時(shí)的正偏態(tài)分布 關(guān)于使用原始分?jǐn)?shù),這種方案也是一種無(wú)奈的倒退。這種倒退還特別久遠(yuǎn),因?yàn)檫@與持續(xù)了1300多年的科舉考試賦分方法基本一致。其中的問(wèn)題或后果已經(jīng)有大量研究報(bào)告,此處不再進(jìn)行討論。不過(guò),使用原始分?jǐn)?shù)也有一個(gè)好處,即沒有“3分一跳”的麻煩,老百姓認(rèn)為這個(gè)分?jǐn)?shù)很“公平”。其實(shí),“3分一跳”的麻煩若采用“山東方案”也是可以解決的,前提是命題水平要足夠高,不能出現(xiàn)很多高手都得同一個(gè)分?jǐn)?shù)的局面,否則,誰(shuí)也沒有辦法把學(xué)生區(qū)分開來(lái)。 關(guān)于“將語(yǔ)、數(shù)、外考試作為錨測(cè)驗(yàn)去預(yù)測(cè)物理等學(xué)科等級(jí)分?jǐn)?shù)”的方案,它在現(xiàn)代考試科學(xué)面前是屬于一種特別沒有底氣的辦法。因?yàn)檎Z(yǔ)、數(shù)、外與物理等學(xué)科的成績(jī)之間僅僅具有一定的正相關(guān)關(guān)系,用語(yǔ)、數(shù)、外成績(jī)來(lái)預(yù)測(cè)物理等學(xué)科的等級(jí)分?jǐn)?shù),不僅計(jì)算過(guò)程復(fù)雜,而且誤差特別大,并具有明顯的“混淆相關(guān)關(guān)系與因果關(guān)系”痕跡,這個(gè)辦法實(shí)在是自找麻煩的無(wú)奈方案。 總之,高中學(xué)業(yè)水平等級(jí)考試的賦分方案存在著明顯缺陷。這個(gè)問(wèn)題如果放任自流,必定會(huì)帶來(lái)重大負(fù)面影響,甚至造成“播下龍種收獲跳蚤”的后果。本文所歸納的“理想方案”“滿意方案”和“無(wú)奈方案”可以粗略地看作是問(wèn)題解決的上、中、下三策,期待能為正在制定賦分規(guī)則的有關(guān)部門帶來(lái)一些啟發(fā)。當(dāng)然,除了上述3類方案,可能還有其他更合適的方案。無(wú)論何種方案,希望有關(guān)部門能組織考試科學(xué)方面的專業(yè)團(tuán)隊(duì),結(jié)合本省(區(qū)、市)自身的特點(diǎn)進(jìn)行攻關(guān)和試點(diǎn),盡早把這個(gè)隱患消除在沒有發(fā)生之前,使得新高考這臺(tái)“高檔汽車”能夠盡早配上高質(zhì)量的“發(fā)動(dòng)機(jī)”,安全、平穩(wěn)和高效地行駛在改革大道之上。 [1]熊丙奇.浙滬新高考改革試點(diǎn),我們?cè)嚨迷趺礃??[EB/OL].(2017-08-16)[2017-12-10].http://www.sohu.com/a/165029675_567589. [2]朱邦芬.為什么浙江省選考物理人數(shù)大幅下降值得擔(dān)憂[EB/OL][.2018-11-10].http://cul.qq.com/a/20171024/013215.htm. [3]浙江省教育廳辦公室.關(guān)于糾正部分普通高中學(xué)校違背教育規(guī)律和教學(xué)要求錯(cuò)誤做法的通知(浙教辦基〔2016〕97號(hào))[EB/OL][.2018-11-10].http://www./news/147737035226665750.html. [4]楊志明.學(xué)業(yè)水平考試成績(jī)等級(jí)化中的風(fēng)險(xiǎn)及其規(guī)避辦法[J].教育測(cè)量與評(píng)價(jià),2015(9):62-64. [5]楊志明.做好高中學(xué)業(yè)水平考試所必需的四項(xiàng)測(cè)量學(xué)準(zhǔn)備[J].中國(guó)考試,2017,297(1):8-13. [6]新高考改革研究課題組.滬浙新高考改革4年效果如何?等級(jí)賦分技術(shù)待改進(jìn)[EB/OL](.2018-07-13)[2018-09-10].http://cnews.chinadaily.com.cn/2018-07/13/content_36566407.htm. [7]溫忠麟.新高考選考科目計(jì)分方式探討[J].中國(guó)考試,2017(12):23-29. [8]于涵,韓寧,關(guān)丹丹,等.關(guān)于改進(jìn)新高考選考科目賦分方案的若干思考[J].中國(guó)高等教育研究,2018(6):44-49. [9]浙江省教育考試院.浙江:深化高考綜合改革試點(diǎn)相關(guān)政策解讀 [EB/OL](.2017-11-30)[2018-09-10].http://www./jyb_zwfw/zwfw_gdfw/gdfw_zjs/201711/t20171130_320254.html. [10]上海市人民政府《.關(guān)于進(jìn)一步深化本市高考綜合改革試點(diǎn)工作的若干意見》政策解讀[EB/OL].(2018-04-03)[2018-09-10].http://www./nw2/nw2 314/nw2319/nw12344/u26aw55501.html. [11]教育部.關(guān)于普通高中學(xué)業(yè)水平考試的實(shí)施意見(教基二〔2014〕10號(hào))[EB/OL](.2014-12-10).http://old.moe.gov.cn//publicfiles/business/htmlfiles/moe/s4559/2014 12/181664.html. [12]Yang,Z.Big Data-Based Norming for Academic Proficiency Tests in China[R/OL].Keynote Speech at the Annual Conference of the Chinese American Educational Research and Development(2018-04-12).https://www./2018_caerda_conference_nyc.php. [13]U.S.Department of Education.Science,Technology,Engineering and Math:Education for Global Leadership[EB/OL][.2018-10-20].https://www./Stem. |
|