教學評價應包括認知、情感和技能三個方面。對于認知和技能領域的學業(yè)成就,最常用的教學評價手段是標準化成就測驗和教師自編測驗。而對于情感以及道德行為表現(xiàn)則常常采用非測驗性的評價手段。
一、標準化成就測驗 (一)標準化成就測驗的含義 標準化成就測驗是指由專家或學者們所編制的適用于大規(guī)模范圍內評定個體學業(yè)成就水平的測驗。它是評價學生學業(yè)成績的重要工具之一。 (二)標準化成就測驗的特點 測驗是由專門機構或專家學者按一定測驗理論和技術,根據(jù)全國或某一地區(qū)所有學校的共同教育目標來編制的。所有受試人所做的試題、時限等施測條件相同,計分手段和分數(shù)的解釋也完全相同。 (三)標準化成就測驗的優(yōu)越性 第一,客觀性;第二,計劃性;第三。可比性。 (四)標準化成就測驗的缺點 第一,與學校課程之間的關系很不協(xié)調。在我國.每個地區(qū)的教學狀況還存在著一定的差距,教師在選用標準化測驗前,仔細查閱內容效度,使得測驗的目標與評價的目的相匹配。第二,測驗結果的不當使用。我們通常利用標準化成就和能力測驗對學生分類和貼標簽,對個體造成了不良影響。 (五)標準化成就測驗的目的 標準化成就測驗則用來判斷學生與常模相比時所處的水平。 二、教師自編測驗 (一)自編測驗的含義與特點 教師自編測驗是由教師根據(jù)具體的教學目標、教材內容和測驗目的,自己編制的測驗,是為特定的教學服務的。教師自編測驗通常用于測量學生的學習狀況。 (二)自編測驗的優(yōu)勢 (1)操作過程簡單;(2)施測手續(xù)方便;(3)應用范圍一般限于l9己所教的學科,在實際教學中頗為有用。 (三)測驗前的計劃 1.確定測驗的目的。 2.確定測驗要考查的學習結果。 3.列出測驗要包括的課程內容。 4.寫下考試計劃或細目表。細目表是將考試具體化的最重要的工具,使得測驗能夠與教學的目標和內容保持一致。細目表的形式是兩維表,一般縱攔表示學習結果,橫欄表示課程的內容或范圍。中間的欄目,就是教師根據(jù)自己的情況填上在測驗中計劃測量多大比例的學習結果和課程內容。 5.針對計劃測量的學習結果,選擇適合的題型。自編測驗包括客觀題和主觀題兩種類型。教師使用哪一種類型的題目是由測驗的目的、內容和時間決定的。 (四)自編測驗的類型 1.客觀題 客觀題具有良好的結構,對學生的反應限制較多。這類題目包括選擇題、是非題、匹配題和填空題等。 (1)選擇題。選擇題是由題干和兩個或更多的選項組成的。題干可以是直接提問或者以不完整的句子的形式出現(xiàn),目的是為了設置問題情境。而選項則提供可供選擇的答案,包括一個正確答案和若干具有干擾性的錯誤項或迷惑項。 學生的任務就是閱讀題目,再從一系列選項中挑選出正確的項目。 教師在出題時,要綜合考慮題干和選項,使整個題目清楚明了。選項的數(shù)量一般沒有統(tǒng)一的規(guī)定,大多足4~5個,良好的選擇題.題干應該明確簡單,而選項又深具迷惑性。選擇題還有一種常用變式.選項中有一至多個正確答案,即通常被稱為多選題。 選擇題可適用于不同材料,可考查學生多方面知識,加上評分客觀、省時,因此在標準化測驗中廣泛使用;但它答案固定,測不出組織材料的能力和創(chuàng)造力;同時由于題量大,要為每個題目編寫迷惑答案,任務比較繁重。 (2)是非題,是非題又稱正誤題,此類題學生需要識別、選擇出正確答案。常用的形式是,陳述一句話要求學生判斷對錯或是非。是非題可用于測量不同水平的教學目標。 是非題形式簡單。能夠在一份試卷內覆蓋大量的內容。教師在評判時也較客觀,計分簡便省時。但是。一個重要的問題是:學生只有兩種選擇--對或錯,容易猜測。 (3)匹配題。區(qū)配題是另一種可提供多種選擇的考試形式。通常,題目包括兩列詞句,一列是問題選項。一列是反應選項。學生根據(jù)題意按照某種關系將左右的項目連接起來。匹配題形式簡單,能夠有效地測量學生對知識聯(lián)系的掌握情況.且易于計分。但是,它只能用于測查彼此存在著簡單關系的知識。 (4)填空題。填空題是呈現(xiàn)給學生一句或一段不完整的話或者直接提問,要求學生簡要做答。填空題可以考查學生對知識記憶和理解,以及推理和判斷能力。填空題的問題在于,學生的答案各不相同甚至還會出現(xiàn)出人意料的答案.學生的答案還會受筆跡、用詞等無關因素的影響。 2.主觀題 主觀題則要求學生自己組織材料,并采用合適的方式表達陳述出來。這類題型包括論文題及問題解決題。教師在評分時,對學生的回答需要給出不同量的分值。 (1)論文題。論文題是指要求學生用文字論述方式闡述相關觀點的題目,回答字數(shù)可以從幾段到幾大頁不等。一一般較常使用的有兩種類型。有限制的問答題和開放式論文。有限制的問答題,是指教師對回答的內容和長度都有規(guī)定,開放式論文,則允許學生在內容上可以自由選材,自由發(fā)揮,而且篇幅較長。論文題可以測驗知識、理解或運用水平,也可考查學生的分析、綜合、類比和評估知識的能力。還可考查學生組織信息或表達陳述某項意見的能力。 使用論文題也有不妥之外。首先,學生回答論文題需要花費很多時間。其次,對于熟悉自己學生的教師,在判卷時很難做到客觀,導致信度較低。在評分時。經常出現(xiàn)一種現(xiàn)象一一暈輪效應,即教師對學生的總體印象影響到對論文題目的評價。 (2)問題解決題。問題解決題是向學生提供一定的問題情境和目標情境,要求學生通過對知識進行組織、選擇和運用等復雜的程序來解決問題。通常有兩種形式,一種是間接測驗,是采用紙筆測驗來評價學生的學業(yè)成就或能力。學生在完成時,通常必須寫出若干步驟或過程,以展現(xiàn)他的思路。評分時,按照步驟計分。如果缺少某些步驟就不能得分。問題解決題的另一種方式則是直接測驗。由于它考查了學生處理實際問題的能力。所以有時又叫做操作評價。操作評價對于考查高級思維技能十分有效,但是往往費時費錢。而且主觀性較大,并且效度也經常受到質疑 (五)命題的一般原則
1.試題要符合測驗的目的。測驗目的不同,編制測驗的取材范圍和試題難度也就有所不同。 2.試題內容的取樣要有代表性,最好能代表該學科的全部內容。 3.題目格式應多樣化。 4.語句要簡明、清晰、易懂。 5.答案應準確。 6.測題應彼此獨立,彼此考查知識點不能明顯重復。 (六)有效自編測驗的特征 1.信度 信度是指測驗的可靠性,即多次測驗分數(shù)的穩(wěn)定、一致的程度。它既包括在時間上的一致性,也包括內容和不同評分者之間的一致性。 信度指標通常以相關系數(shù)表示.即用同一被試樣本所得的兩組資料的相關系數(shù)作為測量一致性的指標,稱為信度系數(shù)。影響信度的相關因素有:①測題數(shù)量;②測驗難度;③施測對象;④施測過程。 2.效度 效度是指測量的正確性,即一個測驗能夠測量出其所要測量的東西的程度,它是科學測量工具最重要的質量指標。效度考慮的問題是:測驗測量什么?測驗對測量目標的測量精確性和真實性有多大?效度的重要性大于信度。但效度并不是絕對的,而是相對的.任何一種測驗只是對一定的目的來說是有效的,對其他目的和用途卻不一定有效。 3.區(qū)分度 區(qū)分度是指測驗項目對所測量屬性或品質的區(qū)分程度或鑒別能力。項目的效度越高,其區(qū)分度越犬,鑒別力越強。它是根據(jù)學生對測驗項目的反應與某種參照標準之間的關系來估計的。項目區(qū)分度高低與測驗目的密切相關。 (七)自編測驗的常見錯誤 1.教師過于相信自己的主觀判斷而忽視測驗的信度和效度指標。 2.許多教師對測驗準備的重要性缺乏足夠的認識,對測驗準備不夠充分,甚至沒有準備。 3.許多教師編制的測驗太簡單,題量太小。 三、非測驗的評價技術 (一)案卷分析 案卷分析是一種常用的評價策略,其內容主要是按照一定標準收集起來的學生認知活動的成果。對學生的作品進行考查分析,并形成某種判斷和決策的過程就是案卷分析。 (二)觀察 通過教學過程中的非正式觀察,教師也能夠收集到大量的關于學生學業(yè)成就的信息。這種觀察不只限于智能的發(fā)展,還包括學生生理、社會和情緒的發(fā)展。為了確保觀察的有效性,教師應注意自然地對學生進行全面系統(tǒng)的觀察,然后客觀、詳細地記錄下觀察信息。 1.行為檢查單 教師可以使用檢查單來記錄其在教學中的觀察結果。檢查單一般包括一系列教師認為重要的目標行為.通常采用有/無的方式記錄,但有時也記錄下次數(shù)。行為檢查單使用簡便易行,對于教師非常有用。 2.軼事記錄 軼事記錄是描述所觀察的事件。它可以提供比較詳細的信息,這些記錄一般按照發(fā)生時間排列的。教師可以在事先有明確的觀察目標,就某一方面的行為進行記錄;也可以沒有明確目的,事后再專門分析或考查某一件事。 它的缺點是:軼事記錄比較費時,而且也很難排除主觀偏見。 3.等級評價量表 等級評價量表對于連續(xù)性的行為,可能更為有效。它可用于判斷某種行為的發(fā)生頻率,以及某種操作或活動的質量,使得觀察信息被量化。評價量表是一種間接的觀察技術,通過量化所觀察的信息,可以迅速簡便地獲得概括化的信息。評價量表和行為檢查單有-一定關系。二者都要求教師對學生的行為進行判斷,可以在觀察過程中或結束后使用。但是它們的評價標準不同,檢查單只需要做定性的判斷,而等級評價量表是做定量的判斷。 (三)情感評價 教師可以自行編寫開放式問題、問卷等。對學生的情緒、學習動機、個人觀點等進行評價。而在對結果的評價時,教師也需要寫一份詳細的報告。 四、教學評價結果的處理與報告 (一)測驗結果的分析 測驗結果的分析主要包括對測驗本身的分析和對教學活動的分析兩個方面。 1.對測驗本身的分析 對每個測驗題而言,主要應分析的是其難度和區(qū)分度。對于多選題還要分析備選答案的合適度。 對整個測驗而言.應分析其信度和效度,并確定其分數(shù)的分布。 2.對教學活動的分析 對教學活動的分析首先要對測驗中的錯誤進行登記和分析;然后對錯誤進行詳細分析.以說明教學中存在的問題;最后,針對教學中存在的問題提出改進措施,以促進學習。 (二)評分 評分的標準可分為絕對標準和相對標準兩種。絕對標準是以學生所學的課程內容為依據(jù)。它強調。由于不同學生的學習起點和背景情況的差異。所以他們的學習結果也是不可比較的。它對應的評價方式.是標準參照評價。相對標準是以其他學生的成績?yōu)橐罁?jù),對應于常模參照評價。相對標準的評價不僅與學生自己的成績有關,還與其他同學的成績有關。 合理的評分過程應包括如下步驟:①收集有關學生的信息,信息可以來源于不同類型、性質的測驗甚至觀察的評價方式。②系統(tǒng)地記錄下評價的結果。并隨時保持最新的結果。③盡量將收集的資料量化,用數(shù)據(jù)來表示學生的學習情況。④為了把評價的重點放在最終的學習成就.教師需要加大最后測驗得分的權重。⑤評價應該以成就為依據(jù),而其他特征的評價,不要和成就的評價混雜起來。 評分注意事項: (1)評分標準要客觀公正。在評分過程中,常常出現(xiàn)評分主觀性問題,應確定好評分標準。力求取得較好的信度,對教學活動發(fā)揮積極作用; (2)評分標準要規(guī)定答案要點及可接受的變式; (3)評分標準要依據(jù)題目的難易及要點的主次配給分數(shù); (4)評分時要注意分析評分和綜合評分相結合。分析評分是要按要點給分.綜合評分即從整體上考察,分別為不同等級確定出樣本; (5)評分標準應注意內容,不宜注重形式。 (三)合格與不合格 有些課程采用合格與不合格來評價學生的成就。 (四)其他報告方式 教師寫學生的個人鑒定或定期的綜合評價,提供給家長和學生。觀察報告也是一種報告評價結果的形式。此外,通過與家長面談,也可以交流關于學生的學習、行為和態(tài)度等方面的資料。 |
|