ข้อสอบ เป็นเครื่องมือที่พบกันได้บ่อยในการวัดผลลัพธ์การเรียนรู้ด้านพุทธิพิสัย (Cognitive Domain) หรือการวัดความรู้ความสามารถทางสมองหลังจากผ่านกระบวนการเรียนรู้มาแล้ว
การสร้างข้อสอบจะต้องคำนึงถึงผลลัพธ์การเรียนรู้ เพื่อให้ทราบถึงระดับความรู้ของผู้เรียนว่าเป็นตามระดับมาตรฐานที่ตั้งไว้หรือไม่ และยังช่วยให้ทราบพัฒนาการด้านความรู้ของผู้เรียน หากมีการทดสอบอย่างต่อเนื่อง
นอกจากนี้ ผู้สอนยังสามารถนำผลการสอบที่ได้ มาวิเคราะห์กับกลุ่มผู้เรียนอื่น เพื่อพิจารณาความเหมือนหรือความต่าง แล้วสังเคราะห์เป็นแนวทางพัฒนาการสอนหรือพัฒนาผู้เรียนในอนาคต
โดยการออกแบบข้อสอบในเบื้องต้น ผู้สอนจะต้องวางเป้าหมายว่าต้องการสร้างข้อสอบประเภทใด เช่น ผู้สอนต้องการวัดความรู้ขั้นสูงหรือระดับการประยุกต์ใช้ขึ้นไปของ Bloom’s taxonomy ข้อสอบควรจะมีลักษณะที่ใช้ความคิดองค์รวม และให้เวลาในการทำข้อสอบที่มากพอสมควร เรียกว่า แบบทดสอบใช้เวลามาก หรือ Power Test
ในขณะเดียวกัน หากผู้สอนต้องการวัดความรู้ระดับความจำไปถึงการประยุกต์ใช้ ที่วัดความคล่องแคล่ว เน้นความถูกต้องและแม่นยำภายใต้ระยะเวลาที่จำกัด ควรใช้แบบทดสอบที่เรียกว่า แบบทดสอบใช้ความเร็ว หรือ Speed Test เป็นต้น
นอกจากการวางเป้าหมายเพื่อให้ทราบถึงระดับการเรียนรู้ของผู้เรียนแล้ว ข้อสอบจะต้องมีการวัดให้หลากหลายระดับการเรียนรู้ เพื่อให้รู้ว่าผู้เรียนมีความรู้อยู่ในระดับใด มีสิ่งใดบ้างที่ทำได้ดีแล้วหรือสิ่งใดบ้างที่สามารถพัฒนาเพิ่มเติมได้
ขั้นตอนในการสร้างข้อสอบ มีทั้งหมด 4 ขั้นตอนดังนี้
- กำหนดผลลัพธ์การเรียนรู้หรือ Learning Outcomes
- จัดทำตารางวิเคราะห์ความสัมพันธ์ของผลลัพธ์การเรียนรู้กับระดับพฤติกรรมที่มุ่งวัดและผังการสร้างข้อสอบ ที่เรียกว่า พิมพ์เขียวข้อสอบ หรือ Test Blue Print
- สร้างข้อสอบให้สอดคล้องกับผลลัพธ์การเรียนรู้ที่วิเคราะห์ไว้
- วิเคราะห์คุณภาพข้อสอบ
ขั้นตอนที่ 1 กำหนดผลลัพธ์การเรียนรู้หรือ Learning Outcomes
สำหรับการสร้างข้อสอบด้าน Cognitive ให้เขียนผลลัพธ์การเรียนรู้ในลักษณะของพฤติกรรมที่สังเกตได้ ตามระดับขั้นการเรียนรู้ด้านพุทธิพิสัยของ Blooms โดยแบ่งเป็น 6 ระดับ
ในการสร้างข้อสอบนั้นสามารถเลือกระดับการเรียนรู้ที่เน้นให้สอดคล้องกับผลลัพธ์การเรียนรู้และเนื้อหา โดยไม่จำเป็นต้องมีครบทุกระดับในข้อสอบชุดเดียว ซึ่งแต่ละระดับการเรียนรู้ด้านพุทธพิสัยของ Blooms มีรายละเอียดดังต่อไปนี้
- ระดับที่ 1 การจำ (Remember) ซึ่งเป็นระดับล่างสุด หมายถึง ความสามารถในการระลึก จดจำในสมอง สามารถทำการทดสอบในส่วนของ ชื่อ วัน ความหมาย คุณลักษณะ เวลา เหตุการณ์ บุคคล ข้อเท็จจริง ระเบียบ แบบแผน ขั้นตอนแนวโน้ม ประเภท เกณฑ์ ทฤษฎี เป็นต้น
- ระดับที่ 2 การเข้าใจ (Understand) หมายถึง ความสามารถในการสร้างความหมายหรือความรู้จากการศึกษาด้วยตนเอง สามารถทำการทดสอบในส่วนของ อธิบาย เหตุการณ์ เรื่องราว นิยาม ความน่าจะเป็น หลักการจุดมุ่งหมายความสำคัญของเรื่อง เป็นต้น
- ระดับที่ 3 การประยุกต์ใช้ (Apply) หมายถึง ความสามารถในการใช้กระบวนการที่ได้เรียนรู้มาในสถานการณ์ใหม่ หรือสถานการณ์ที่คล้ายคลึงกัน สามารถทำการทดสอบในส่วนของ โจทย์ปัญหา หรือการนำใช้ประโยชน์ในสถานการณ์ต่าง ๆ เป็นต้น
- ระดับที่ 4 การวิเคราะห์ (Analyze) หมายถึง ความสามารถในการแยกความรู้ออกเป็นส่วน ๆ โดยสามารถให้เหตุผลได้ว่าความรู้ส่วนย่อยที่แยกแต่ละส่วนมีความเกี่ยวข้องกับโครงสร้างของความรู้ทั้งหมดอย่างไร สามารถทำการทดสอบในส่วนที่ ต้องการให้ระบุความสำคัญ ต้นตอ สาเหตุ ความสัมพันธ์ ความแตกต่าง ข้อดีและข้อด้อย
- ระดับที่ 5 การประเมินค่า (Evaluate) หมายถึง ความสามารถในการตรวจสอบ วิพากษ์ และตัดสิน สามารถทำการทดสอบตัดสิน วิพากษ์ เปรียบเทียบว่าสิ่งไหนดีกว่า คุ้มค่ากว่า พิสูจน์น่าถูกต้อง สนับสนุนด้วยเหตุผล
- ระดับที่ 6 การสร้างสรรค์ (Create) หมายถึง ความสามารถในการสร้างสิ่งใหม่จากสิ่งที่เคยเรียนรู้หรือสิ่งที่พบเห็นในบริบทต่าง ๆ สามารถสร้างสรรค์งาน แผนงาน หรือผลิตภัณฑ์ หรือชิ้นงานที่แปลกใหม่ โดยจะใช้เมื่อต้องการทดสอบที่ต้องการรวบรวมความรู้รอบยอด วางแผน ปรับปรุง แก้ปัญหา ออกแบบผลงาน หรือการนำไปใช้ประโยชน์ เป็นต้น
ขั้นตอนที่ 2 จัดทำตารางวิเคราะห์ความสัมพันธ์ของผลลัพธ์การเรียนรู้กับระดับพฤติกรรมที่มุ่งวัดและผังการสร้างข้อสอบ ที่เรียกว่า พิมพ์เขียวข้อสอบ หรือ Test Blue Print
เมื่อกำหนดผลลัพธ์การเรียนรู้เรียบร้อยแล้ว จะนำมาสร้างตารางวิเคราะห์ความสัมพันธ์ของผลลัพธ์การเรียนรู้กับระดับพฤติกรรมที่มุ่งวัดด้วยวิธีการดังนี้
1.วิเคราะห์ในลักษณะตารางสองทาง แนว Roll จะจำแนกตามผลลัพธ์การเรียนรู้ และแนว Column แสดงระดับพฤติกรรมที่มุ่งวัดตามระดับการเรียนรู้ทั้ง 6 ระดับ
2.ระบุเครื่องหมายเพื่อแสดงความสัมพันธ์ของผลลัพธ์การเรียนรู้ว่าสอดคล้องกับระดับพฤติกรรมที่มุ่งวัดตามระดับใดบ้าง
3. นับความถี่ในแต่ละระดับการเรียนรู้ และกำหนดสัดส่วนที่ Roll สุดท้ายของตาราง โดยนำผลการนับความถี่มาใส่ตัวคูณแล้วแสดงผลเป็นอัตราส่วนที่สื่อความเข้าใจได้ง่าย เช่น รวมกันแล้วได้เต็ม 100 หรือแสดงผลในรูปของจำนวนเต็ม
เมื่อได้สัดส่วนของระดับพฤติกรรมที่มุ่งวัดแล้ว ให้นำไปกำหนดใน Test Blue Print
โดยตารางแนว Column จะแบ่งตามระดับพฤติกรรมที่มุ่งวัด และแนว Roll จะแบ่งตามเนื้อหาและระยะเวลาในการเรียน จากนั้นระบุจำนวนข้อสอบด้วยวิธีการหาสัดส่วน แบ่งออกเป็น แนว Column รวมจำนวนข้อ แบ่งตามระยะเวลาในการเรียนแต่ละเนื้อหา และ Roll รวมจำนวนข้อ แบ่งตามสัดส่วนของระดับของพฤติกรรมที่มุ่งวัด
ขั้นตอนสุดท้ายในการทำ Test Blue Print คือระบุจำนวนข้อย่อยตามระดับพฤติกรรมที่มุ่งวัดให้สอดคล้องกับสัดส่วนของระยะเวลาในการเรียนแต่ละเนื้อหา ซึ่งการสร้าง Test Blue Print นั้น จะช่วยกำกับการออกข้อสอบให้ครอบคลุม และจัดลำดับความสำคัญตามทางที่สอนและตามที่หลักสูตรกำหนด พร้อมทั้งจะให้ข้อมูลที่สะท้อนถึงระดับการเรียนรู้ของผู้เรียนที่ชัดเจนได้อีกด้วย
ขั้นตอนที่ 3 สร้างข้อสอบให้สอดคล้องกับผลลัพธ์การเรียนรู้ที่วิเคราะห์ไว้
การออกข้อสอบมีสิ่งที่ควรคำนึงดังต่อไปนี้
- อายุผู้เรียนที่ถูกทดสอบ
ผู้สอนควรเลือกชนิดของแบบสอบ ระยะเวลาการสอบ และระดับพฤติกรรมที่มุ่งวัดให้เหมาะสมกับอายุ เช่น ข้อสอบสำหรับผู้เรียนปฐมวัยควรใช้คำที่เข้าใจง่าย ไม่ซับซ้อน มีระยะเวลาการสอบไม่มากนักและระดับพฤติกรรมที่มุ่งวัดอาจระบุที่ระดับความจำ ความเข้าใจ
- ระยะเวลาในการทดสอบ
โดยพิจารณาระยะเวลาในการทำข้อสอบว่าผู้เรียนสามารถทำข้อสอบได้ภายในระยะเวลาที่กำหนด และไม่ทำเสร็จก่อนเวลามาก
- ชนิดของแบบสอบที่ใช้
ควรเลือกใช้ชนิดของแบบสอบที่ผู้เรียนสามารถแสดงพฤติกรรมที่มุ่งวัดตามระดับการเรียนรู้ได้
โดยข้อสอบแบ่งออกเป็น 2 ชนิด คือ
ข้อสอบอัตนัยหรือแบบเขียนตอบ และ ข้อสอบปรนัยหรือแบบเลือกตอบ
ข้อสอบอัตนัย มี 2 ลักษณะคือ
ข้อสอบแบบความเรียง (Essay Questions) และ ข้อสอบแบบตอบสั้น (Short Answer)
ข้อสอบอัตนัยแบบความเรียง (Essay Questions) คือข้อสอบที่ให้อิสระแก่ผู้เรียนในการประมวล สรุป คัดเลือกความรู้ความสามารถที่มี นำมาสังเคราะห์ เรียบเรียงและเขียนเป็นคำตอบ ภายใต้ระยะเวลาที่กำหนด จึงเหมาะสมกับการวัดความสามารถระดับการวิเคราะห์ สังเคราะห์ และประเมิน
ข้อสอบอัตนัยแบบตอบสั้น (Short Answer) คือข้อสอบที่ผู้เรียนต้องคิดคำตอบขึ้นมาเอง แต่เป็นคำตอบสั้น ๆ หรือคำสำคัญ ที่เหมาะสม การออกข้อสอบในลักษณะนี้เหมาะสำหรับวัดความรู้ ความจำ หลักการและกฎเกณฑ์ต่าง ๆ
ข้อสอบอัตนัย จะต้องมีการกำหนดรายละเอียดและคุณภาพ โดยสร้างเกณฑ์การประเมิน ซึ่งจำแนกเป็น 2 ประเภทตามลักษณะของการให้คะแนน คือ
1. เกณฑ์การประเมินแบบภาพรวม (Holistic Scoring)
2. เกณฑ์การประเมินแบบแยกส่วน (Analytic Scoring)
ข้อสอบปรนัย คือการกำหนดคำตอบมาให้ผู้เรียนเลือกตอบ โดยมีคำตอบที่ตายตัว ผู้เรียนมักไม่มีโอกาสแสดงความคิดเห็นส่วนตัว เหมาะสำหรับวัดความรู้ ความจำ หลักการและกฎเกณฑ์ต่าง ๆ
การสร้างคำถามสำหรับข้อสอบปรนัย มีข้อควรคำนึง 4 ข้อ ดังนี้
1. คำถามนั้นควรอ่านแล้วเข้าใจง่าย ไม่กำกวม
ถ้าหากข้อคำถามมีข้อความทางลบ เช่น ไม่ ยกเว้น ไม่ใช่ ไม่ถูกต้อง ให้เน้นคำหรือข้อความนั้น โดย การขีดเส้นใต้ ทำเป็นอักษรตัวเอียง หรือทำตัวทึบ หากเป็นภาษาอังกฤษ สามารถเขียนเป็นตัวพิมพ์ ใหญ่ได้
ข้อคำถามไม่ควรใช้คำถามทางลบซ้อนทางลบ ที่ทำให้เกิดความสับสน เช่น ครูที่ไม่ดีต้องไม่มีคุณสมบัติใด
2. ควรหลีกเลี่ยงการสร้างคำถามที่ชี้นำคำตอบ หรือ คำถามที่สามารถตอบได้จากคำถามข้ออื่น ๆ
3. หลีกเลี่ยงการใช้คำย่อโดยไม่ได้อธิบาย เว้นเสียแต่ว่าคำย่อนั้นเป็นคำที่รู้จักกันโดยทั่วไป
4. ทบทวนและปรับปรุงข้อคำถามอยู่เสมอ พร้อมทั้งให้บุคคลที่เกี่ยวข้องช่วยตรวจสอบความถูกต้องอีกครั้ง
การสร้างตัวเลือก ( Choices or Responses) สำหรับข้อสอบปรนัย มีข้อคำนึง ดังนี้
1. ตัวเลือกต้องมีลักษณะคำตอบที่สมเหตุสมผลและเกี่ยวข้องกับข้อคำถาม
2. สร้างตัวเลือกเพียงตัวเลือกเดียวเท่านั้นที่เป็นคำตอบที่ถูกต้อง
ขั้นตอนที่ 4 การวิเคราะห์คุณภาพข้อสอบ
ข้อคำนึงเบื้องต้นในการวิเคราะห์คุณภาพข้อสอบ มีดังนี้
1. ผู้สอนควรตรวจสอบว่าข้อสอบที่สร้างขึ้นสอดคล้องกับตารางวิเคราะห์ความสัมพันธ์ของผลลัพธ์การเรียนรู้กับระดับพฤติกรรมที่มุ่งวัด และผังการสร้างข้อสอบหรือไม่ ?
2. เมื่อทำการทดสอบแล้วพบข้อสอบที่ผู้เข้าสอบผิดพลาดจำนวนมาก
อาจารย์ต้องพิจารณาในประเด็นเหล่านี้
- ข้อสอบข้อนั้นสามารถอ่านเข้าใจในสิ่งที่ต้องการวัด หากพบว่าข้อคำถามยังผิดพลาดในประเด็นนี้ ผู้สอนควรปรับปรุงข้อคำถามให้เข้าใจมากขึ้น
- ระดับความยากเหมาะสมแล้วหรือไม่ โดยพิจารณาเบื้องต้นจากความสอดคล้องของข้อสอบกับเนื้อหาที่สอน หากพบว่าความยากเหมาะสมกับเนื้อหาแล้ว แสดงให้เห็นว่าผู้เรียนยังขาดองค์ความรู้ตามข้อคำถามที่ทำผิด ผู้สอนจะต้องนำประเด็นดังกล่าวมาปรับปรุงหรือพัฒนาการสอนต่อไป
- หากมีตัวลวงที่ไม่มีผู้เรียนตอบหรือตอบน้อยมาก ๆ ควรพิจารณาปรับปรุงตัวลวง เพื่อให้ข้อสอบมีประสิทธิภาพมากยิ่งขึ้น
กรณีค่าเฉลี่ยของคะแนนภาพรวมทั้งชั้นเรียนอยู่ในระดับน้อย ผู้สอนควรพิจารณาว่าข้อสอบมีความยากเกินไปหรือไม่ หรือข้อสอบดังกล่าวยังสามารถบอกจุดด้อยของผู้เรียนได้หรือไม่