Rubric เครื่องมือในการวัดและประเมินผล 

feather-calendarPosted by จันทิมา ปัทมธรรมกุล feather-calendarPosted on 22 สิงหาคม 2023 document
  • ,
  • Pedagogy
แชร์


รูบริค เป็นเครื่องมือการให้คะแนนที่มีการอธิบายระดับคุณภาพของพฤติกรรมหรือสิ่งที่ประเมินจากผลลัพธ์การเรียนรู้ที่ตั้งไว้ โดยสามารถใช้ได้ทั้งในการประเมินกระบวนการและผลงาน  

รูบริคมีความสำคัญในการประเมินการเรียนรู้ 2 ด้าน ดังนี้  

1. รูบริค ช่วยในการสอน   

ทำให้ผู้สอนได้เจาะจงไปที่การเรียนรู้มากกว่าการเน้นตามสิ่งที่ตนต้องการ “สอน”  นับว่าเป็นเครื่องมือที่ช่วยเชื่อมโยงระหว่างการสอนกับการประเมิน  

2. รูบริค ช่วยในการเรียนรู้    

ผู้เรียนได้รู้ถึงเป้าหมายของการเรียนรู้ และความคาดหวังของการเรียนนั้น ๆ  โดยเฉพาะหากใช้รูบริคเพื่อมุ่งเน้นการประเมินพัฒนาการของผู้เรียนและให้โอกาสผู้เรียนได้ฝึกฝนซ้ำ  เกณฑ์ประเมินรูบริคจะช่วยให้เห็นถึงการพัฒนาระดับความสามารถไปสู่เป้าหมายการเรียนรู้   
 

หากผู้เรียนมีส่วนร่วมในการออกแบบเกณฑ์ของรูบริค ยังเป็นการฝึกให้ผู้เรียนตั้งเป้าหมายการเรียนรู้ด้วยตนเองมากกว่าเน้นการทำงานให้เสร็จตามที่ได้รับมอบหมาย  

องค์ประกอบของรูบริค  
รูบริคประกอบด้วย 3 องค์ประกอบหลัก ได้แก่  


1.เกณฑ์ประเมิน (coherent set of criteria) คือ องค์ประกอบที่บ่งชี้ถึงการเรียนรู้  ตามความหมายและขอบเขตของ learning outcome ที่จะประเมิน
2. ระดับพฤติกรรม (performance level) คือ การกำหนดระดับพฤติกรรมของเกณฑ์ประเมินนั้น ๆ ซึ่งอาจกำหนดเป็นตัวเลข เช่น 1 ถึง 5  หรือ ใช้คำที่แสดงถึงความแตกต่างกันในแต่ละระดับ เช่น ระดับเริ่มต้น ระดับกำลังพัฒนา ระดับเชี่ยวชาญ เป็นต้น  

3.คำอธิบายระดับพฤติกรรม (descriptions of levels of performance) คือ คำอธิบายพฤติกรรมที่แสดงถึงคุณภาพในแต่ละระดับของเกณฑ์ประเมินนั้น ๆ   

เราสามารถแบ่งประเภทของรูบริคออกเป็น 2 ลักษณะ ดังนี้  

1. แบ่งตามการเขียนเกณฑ์ประเมิน 
Analytic rubric คือการกำหนดเกณฑ์ประเมินแบบแยกส่วน เหมาะกับการใช้ประเมินแบบ formative โดยจะช่วยในการให้ฟีดแบ็คกับผู้เรียน และเป็นข้อมูลให้ผู้สอนนำไปปรับปรุงหรือพัฒนาการสอนได้
เนื่องจากมีรายละเอียดของแต่ละประเด็นการประเมิน ผู้ประเมินกำหนดการให้น้ำหนักความสำคัญในแต่ละเกณฑ์ได้ต่างกันได้   
แต่มีข้อจำกัด คือ ใช้เวลาในการประเมินมากกว่าเกณฑ์การให้คะแนนแบบภาพรวม เนื่องจากต้องพิจารณาคำอธิบายรายละเอียดของแต่ละเกณฑ์ 

Holistic rubric  คือการกำหนดเกณฑ์ประเมินแบบภาพรวม  เหมาะกับการประเมินในกรณีที่ไม่ต้องมีการให้ feedback แก่ผู้เรียน เช่น ในการประเมินแบบ final summative assessment  
ส่วนข้อจำกัดของ Holistic rubric คือ  การอธิบายทุกเกณฑ์รวมกัน และพิจารณาภาพรวม จะไม่สามารถถ่วงน้ำหนักว่าให้ความสำคัญกับคุณลักษณะใดมากกว่า  ผลการประเมินอาจให้ข้อมูลที่ไม่ละเอียดเจาะจงเพียงพอที่จะเป็นข้อมูลป้อนกลับเพื่อการปรับปรุงหรือพัฒนาการสอน และการเรียนรู้ของผู้เรียน 

  

2. แบ่งตามลักษณะงานหรือผลการเรียนรู้ที่ประเมิน 

General rubric คือรูบริคที่ใช้กับการประเมินผลการเรียนรู้หรือประเมินงานที่ใกล้เคียงกัน เหมาะสมสำหรับใช้ประเมินทักษะพื้นฐาน (fundamental skills) ที่แสดงถึงการพัฒนาทักษะกระบวนการ เป็นการระบุเกณฑ์ประเมินที่ไม่ได้เจาะจงสำหรับงานชิ้นใดชิ้นหนึ่ง แต่สามารถใช้ได้กับการประเมินงานที่มีผลการเรียนรู้ลักษณะเดียวกัน เช่น Learning Outcome ของการเขียนเรียงความ การแก้ปัญหาทางคณิตศาสตร์ ที่ไม่ได้เจาะจงว่าต้องเป็นการแก้ปัญหาที่ดีอย่างไร หรือเจาะจงว่าเป็นการแก้โจทย์ปัญหาอะไร 

ข้อดีของ General Rubric คือ การไม่เจาะจงคำอธิบายเกณฑ์ประเมินต่างๆ เป็นการไม่จำกัดกรอบให้ผู้เรียนจนเกินไป ผู้เรียนสามารถทำหรือมีส่วนร่วมในการกำหนดสิ่งที่พวกเขาควรเรียนรู้ได้เอง ให้ความสำคัญกับการประเมินทักษะ และความรู้ของผู้เรียนมากกว่าที่ชิิ้นงานหนึ่งๆ   

การใช้ general rubric ประเมินการเรียนรู้ของผู้เรียน แม้จะเป็นการทำงานที่ต่างรายวิชา ต่างชิ้นงาน แต่จะช่วยให้ทั้งผู้สอนและผู้เรียนเห็นถึงพัฒนาการของ Learning outcome นั้นได้ดีกว่า  

ส่วนข้อจำกัด คือ ในกรณีที่ต้องมีผู้ประเมินหลายคน การใช้ General rubric นั้นยากกว่าแบบ Task specific ส่งผลต่อ scoring reliability โดยเฉพาะกรณีที่ใช้สำหรับการประเมินผู้เรียนจำนวนมาก และมีผู้สอนหลายคน จึงควรให้ผู้ประเมินฝึกใช้รูบริคก่อน  

Task-specific rubric คือรูบริคที่มีเกณฑ์ประเมินและคำอธิบายที่เฉพาะเจาะจงสามารถใช้กับการประเมินในระดับความจำและความเข้าใจในเนื้อหาความรู้ และใช้กับการประเมินแบบเขียนตอบที่ให้ผู้เรียนเขียนหรือบรรยายภายใต้เงื่อนไขที่กำหนด เช่น แบบเติมคำหรือข้อความ แบบตอบสั้น และแบบบรรยาย เป็นต้น

ข้อดีของ Task-specific rubric คือ ใช้ได้ง่ายกว่า General rubric เพราะระบุเกณฑ์ มีคำอธิบายที่ละเอียดเจาะจงของสิ่งที่จะประเมิน  

แต่มีข้อจำกัดคือ เหมาะสำหรับการประเมินแบบ summative ซึ่งมีวัตถุประสงค์เพื่อสรุปผลการเรียนรู้ หรือกรณีที่ผู้เรียนจะได้รู้เพียงคะแนน โดยไม่มีการให้ผลป้อนกลับ เนื่องจาก task-specific rubric มีคำอธิบายที่เจาะจงในแต่ละระดับ จึงสามารถชี้นำคำตอบให้แก่ผู้เรียนและส่งผลต่อคะแนน 
นอกจากนี้ อาจไม่เหมาะกับการใช้ task-specific rubric เพื่อให้ผู้เรียนประเมินตนเอง และต้องสร้างเกณฑ์การให้คะแนนใหม่สำหรับงานที่แตกต่างกัน  

  

ระวัง รูบริคที่เป็น Task-based 

  การใช้รูบริคเพื่อประเมินความสำเร็จของกิจกรรมหรือการทำงานนั้นๆ มากกว่าที่การเรียนรู้หรือ Learning outcome เป็นการเขียนรูบริคที่แสดงถึง “ตัวงาน” ไม่ใช่เกณฑ์ที่บ่งชี้ถึงผลการเรียนรู้ กลายเป็นการประเมินว่าทำกิจกรรมเสร็จตามที่กำหนดหรือไม่ ถือว่าบรรลุเพียงการทำงานที่จบหรือครบถ้วนขั้นตอน ต่างจากรูบริคที่ดีที่ควรเป็น learning-based ที่เน้นว่าเกิดการเรียนรู้อะไรในการทำกิจกรรมหรือขั้นตอนนั้น


ความแตกต่างระหว่างรูบริคกับ Checklist 

ระวังการเขียนรูบริคที่เป็น “checklist” ที่ประเมินถึงการทำตามข้อกำหนด ว่าทำ-ไม่ทำ หรือ มี-ไม่มี   

ในสิ่งที่ไม่ได้บ่งชี้การเรียนรู้ หรือการตรวจปริมาณ หากใช้รูบริคเพื่อการประเมินผู้เรียนด้วยวิธีคิดนี้ ก็เท่ากับกำลังทำให้ผู้เรียนให้ความสนใจกับการทำงานให้ครบถ้วนแต่อาจไม่ได้เรียนรู้อะไร  

ความแตกต่างระหว่างรูบริคกับ Rating Scale 
ระวังการเขียนคำอธิบายพฤติกรรมที่ไม่ได้บอกรายละเอียดใดๆ มีเพียงการแบ่งเป็น rating scales เช่น Excellent, Good, Fair, Poor หรือใช้กราฟฟิคที่สื่อว่าดี-แย่ เป็นต้น เพื่อตัดสินในลักษณะของการไล่ระดับจากน้อย-มาก ไม่ดี-ดี โดยที่ไม่มีคำอธิบายว่าคุณภาพของแต่ละระดับเป็นอย่างไร


คำถามที่พบได้บ่อยในการใช้งานรูบริค  

Q : รูบริคไม่เหมาะกับการประเมินอะไร  

A : งานหรือข้อสอบที่ประเมินความรู้ระดับความจำ โดยประเมินจากคำตอบว่าถูกหรือผิดโดยที่ผู้เรียนไม่ได้แสดงวิธีทำ เช่น ข้อสอบแบบเลือกตอบ ข้อสอบแบบจับคู่ ข้อสอบแบบถูกผิด


สิ่งที่ผู้สอนควรคำนึงถึงเมื่อต้องประเมิน

  • Order effect ลำดับของงานที่ตรวจหรือความเหนื่อยล้าของผู้ตรวจจนส่งผลต่อการประเมิน  
  • Item or task carry over effect งานที่ตรวจไปแล้วก่อนหน้าหรือข้อก่อนหน้านี้ (ของคนคนเดียวกัน) ส่งผลต่อการให้คะแนนของงานหรือข้อที่กำลังตรวจ  
  • Test or performance carry over effect ผลการประเมินของคนก่อนหน้าส่งผลต่อการตรวจงานของคนที่กำลังตรวจอยู่ปัจจุบัน   
  • Halo effect ความลำเอียงจากความพึงพอใจและความประทับใจอื่น ที่ไม่เกี่ยวข้องกับสิ่งที่ต้องการประเมิน  
  • Writing or language mechanics effects ทักษะการเขียนของผู้เรียนส่งผลต่อการประเมิน ทั้งที่ งานชิ้นดังกล่าวไม่ได้ต้องการวัดคุณภาพของการเขียนหรือการใช้ภาษา

เรียบเรียงโดย น.ส.จันทิมา ปัทมธรรมกุล นักวิจัย สถาบันการเรียนรู้ 

แท็กที่เกี่ยวข้อง

chantima , assessment , Pedagogy

บทความแนะนำ