ผลการวิจัยเกี่ยวกับอคติจากการตรวจให้คะแนนตามลำดับ
- นักวิจัยจากมหาวิทยาลัยมิชิแกนวิเคราะห์บันทึกคะแนนใน Canvas มากกว่า 30 ล้านรายการ และพบว่านักศึกษาที่มีนามสกุลอยู่ท้ายลำดับตัวอักษรมีแนวโน้มจะได้คะแนนต่ำกว่า
- สาเหตุคืออคติจากการตรวจแบบต่อเนื่อง และลำดับเริ่มต้นของงานส่งนักศึกษาใน Canvas อิงตามลำดับตัวอักษรของนามสกุล
- นักศึกษาที่เสียเปรียบจากลำดับตัวอักษรยังได้รับคอมเมนต์ที่เป็นลบและไม่สุภาพมากกว่า และคุณภาพการให้คะแนนซึ่งวัดจากการร้องเรียนเรื่องคะแนนภายหลังก็ต่ำกว่า
- ทีมวิจัยระบุว่าแม้พวกเขาจะคิดเรื่องความยุติธรรมและความแม่นยำของการให้คะแนนอยู่เสมอ แต่ก็ไม่ทันตระหนักจนกระทั่งเห็นจากข้อมูลว่าลำดับนั้นสร้างความแตกต่าง
ข้อมูลวิจัยและผลลัพธ์
- มีการรวบรวมข้อมูลย้อนหลังทั้งหมดที่ใช้งานได้ของทุกโปรแกรม นักศึกษา และงานมอบหมายใน Canvas ตั้งแต่ภาคการศึกษาฤดูใบไม้ร่วงปี 2014 ถึงภาคการศึกษาฤดูร้อนปี 2022
- และเสริมด้วยข้อมูลการลงทะเบียนของมหาวิทยาลัยเพื่อรวมรายละเอียดเกี่ยวกับภูมิหลัง ข้อมูลประชากร และเส้นทางการเรียนของนักศึกษาในมหาวิทยาลัย
- แม้ข้อมูลจะมาจากมหาวิทยาลัยมิชิแกน แต่นักวิจัยกล่าวว่าสามารถสรุปใช้กับสถาบันและหลักสูตรอื่นได้เช่นกัน เนื่องจากเป็นปัญหาด้านการออกแบบที่พบร่วมกันในระบบจัดการการเรียนรู้
- ซึ่งมีที่มาจากการตั้งค่าเริ่มต้นที่เรียงงานของนักศึกษาตามลำดับตัวอักษรของชื่อ
- ทีมวิจัยพบรูปแบบที่ชัดเจนว่าคุณภาพการให้คะแนนลดลงเมื่อผู้ประเมินต้องตรวจงานจำนวนมากขึ้น
- นักศึกษาที่มีนามสกุลขึ้นต้นด้วย A, B, C, D, E จะได้คะแนนสูงกว่าการตรวจแบบสุ่ม 0.3 คะแนนจาก 100 คะแนน
- ในทำนองเดียวกัน นักศึกษาที่มีนามสกุลอยู่ท้ายลำดับอักษรจะได้คะแนนต่ำลง 0.3 คะแนน ทำให้เกิดความต่างรวม 0.6 คะแนน
- แม้ความต่าง 0.6 คะแนนจะดูเล็กน้อย แต่ความคลาดเคลื่อนลักษณะนี้ส่งผลต่อเกรดเฉลี่ยรายวิชาของนักศึกษา และอาจกระทบต่อโอกาสในเส้นทางอาชีพของแต่ละคนในทางลบ
ที่มาของงานวิจัยและข้อเสนอ
- แนวคิดของงานวิจัยนี้เกิดขึ้นระหว่างที่ Wang ซึ่งวิจัยด้านเทคโนโลยีการศึกษา และ Fei ซึ่งวิจัยด้าน AI กำลังอภิปรายเกี่ยวกับงานวิจัย
- พวกเขาสังเกตว่าการติดป้ายกำกับข้อมูล ซึ่งเป็นงานพื้นฐานของ machine learning ก็เป็นงานต่อเนื่องที่ยาวนานและน่าเบื่อได้เช่นกัน แต่โดยทั่วไปจะทำแบบสุ่ม
- จากการศึกษานำร่อง พวกเขาตรวจสอบว่ามีความไม่สมดุลของคะแนนตามเวลาที่ใช้ตรวจหรือไม่
- ทีมวิจัยคาดว่าความเหนื่อยล้าอาจเป็นหนึ่งในปัจจัยสำคัญที่ก่อให้เกิดผลดังกล่าว
- เมื่อทำสิ่งเดิมต่อเนื่องเป็นเวลานาน คนเราจะอ่อนล้า สมาธิลดลง และความสามารถในการรับรู้ก็ถดถอย
- ใน Canvas และระบบจัดการการเรียนรู้ออนไลน์อื่น ๆ มีตัวเลือกให้ตรวจงานแบบสุ่ม และมีผู้สอนบางส่วนใช้อยู่ แต่โหมดเริ่มต้นยังคงเป็นลำดับตัวอักษร
- ทางแก้ที่ง่ายคือเปลี่ยนการตั้งค่าเริ่มต้นให้เป็นลำดับแบบสุ่ม
- นอกจากนี้ยังมีข้อเสนอให้สถาบันการศึกษาจ้างผู้ตรวจเพิ่มสำหรับชั้นเรียนขนาดใหญ่ กระจายภาระงานให้คนจำนวนมากขึ้น หรือฝึกอบรมให้ตระหนักถึงอคติและลดอคติดังกล่าว
ความเห็นของ GN⁺
- การที่อคติจากการตรวจให้คะแนนตามลำดับส่งผลต่อคะแนนของนักศึกษาอย่างเป็นรูปธรรม ทำให้เกิดคำถามเรื่องความเป็นธรรมของระบบประเมินผลการศึกษา เนื่องจากคะแนนมีผลอย่างมากต่ออนาคตของนักศึกษา การปรับปรุงในเรื่องนี้จึงดูเป็นเรื่องเร่งด่วน
- อย่างไรก็ตาม งานวิจัยนี้จำกัดอยู่ในประเทศที่ใช้ภาษาอังกฤษ จึงอาจไม่ใช่ปัญหาใหญ่ในเกาหลี การวิจัยภายในประเทศเกี่ยวกับว่าปรากฏการณ์เดียวกันจะเกิดขึ้นหรือไม่เมื่อเรียงตามลำดับพยัญชนะเกาหลีหรือจำนวนขีดของแซ่จีนก็ดูน่าจะมีความจำเป็น
- ข้อค้นพบที่ว่าความเหนื่อยล้าของผู้ประเมินส่งผลต่อคุณภาพการให้คะแนน บ่งชี้ว่าสถานศึกษาอาจต้องมีค่าตอบแทนและการสนับสนุนที่เหมาะสมสำหรับงานประเมิน ภาระงานที่มากเกินไปอาจบั่นทอนความเป็นธรรมของการประเมิน
- การนำระบบตรวจให้คะแนนอัตโนมัติที่ใช้ AI มาใช้ก็อาจเป็นอีกทางเลือกหนึ่ง แต่ก็คงยากที่จะขจัดปัญหาอคติได้อย่างสมบูรณ์ และยังจำเป็นต้องมีแนวทางเสริมเพื่อดูแลด้านคุณภาพเชิงเนื้อหาของการประเมิน
1 ความคิดเห็น
ความเห็นจาก Hacker News
ต่อไปนี้คือสรุปความคิดเห็นจากคอมเมนต์ใน Hacker News: