Loading AI tools
来自维基百科,自由的百科全书
教育評估是通過評估的模式,對知識、技能、態度和信仰等進行歸檔的評估方式,可以對個人學習者,也可以對學習社區(班級、學校、小組等)、可對教育機構甚至整個教育系統。根據季度學術交流: "理論、經驗學習(案例研究、書本學習、探索、實驗課)中,對學習者準備、態度、動機、學習方法、學習效果、滿意度進行評估,學習還包括通過可測量的標準和標杆進行評估。"[1]
教育的最終評估目的在於對學習者和研究者提供理論框架,對其信仰、意見、知識來源和學習流程進行跟蹤。
教育評估是"確定教育重要性、規模和價值"的手段。[2]
評估一詞往往用於所有教師的幫助學生學習、測量學生進步的活動。[3]評估一般可分為以下種類:
可根據分析目標,分為建立型和歸納型評估:
教育研究者Robert Stake提出歸納型和建立型的區別:
廚師嘗菜,是建立型;客人嘗菜,是歸納型。[4]
建立型和歸納型評估一般把學習環境稱為對學習的評估和學習為了評估。對學習的評估一般是歸納型,通過評估學習結果,匯報給學生、家長和管理者。學習為了評估一般在課程、學期、學年結束時進行,一般是建立型的,老師一般用來改善教學方法。[5]
建立型和歸納型評估還可以分為主觀性和客觀型,客觀評估是問卷只有固定正確的答案,主觀是問卷是開放式的。客觀型可分為對/錯題、多選題、配對題等。主觀問題可分為開放性問題和寫論文等。客觀型問答以及很多使用計算機答卷,用在線評估的方式進行。
測試結果可以和標準答案進行對比,或者與其他同學答案進行對比:
標準評估,一般使用標準化測試,測試者通過固定的(客觀的)標準進行作答。
規則評估 (也稱為"貝爾曲線問卷"),一般對問卷答案設定規則,適於將學生進行對比。例如:IQ測試。國外很多著名的大學都使用規則評估,允許一定比例的學生入選。[6]
可靠性是評估的一致性,可靠的評估需要永遠達到同一個結果,或類似的結果。多種因素可能影響一貫性,如模稜兩可的問題、過多選項、模糊的問題指導以及沒有經驗的監考官。
如何進行最佳評估,一直是公共學校爭議的問題,同時,關於高風險測試和標準化測試也一直有爭議。
對於教育研究者和實踐者,問題並非測試是否覆蓋所有人—共識是如果測試方法得當,測試對學生進步、課程設置可提供有用資訊。[7]
在美國,無童落後法案要求全國進行標準化測試,這些測試根據國家課程設定,把教師、學生、區、州與教育測試結果掛鈎。無童落後法案倡導者提出,為測量教育成功、將教育失敗進行歸責,縮小班級和種族之間的教育差距非常有用。[8]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.