ศาสตราจารย์ที่ Brown เปิดโปงการทุจริตด้วย AI ครั้งใหญ่ในการสอบ
(english.elpais.com)- เกิดข้อกล่าวหาว่าอย่างน้อย 50 คนใช้ AI ทุจริตระหว่างการสอบกลางภาคเดือนมีนาคมของวิชาเศรษฐศาสตร์คณิตศาสตร์ระดับสูง ECON 1170 ที่ Brown University ทำให้ความน่าเชื่อถือทางวิชาการกลายเป็นประเด็นใหญ่
- การสอบเป็นแบบ take-home ปิดหนังสือ และพบข้อความผิดปกติในคำตอบบางส่วนที่ตรงกับผลลัพธ์เมื่อใส่โจทย์ลงใน ChatGPT
- คะแนนเฉลี่ยของสอบกลางภาคอยู่ที่ 96 คะแนน และมีผู้ได้คะแนนเต็ม 40 คน แต่เมื่อเปลี่ยนเป็นสอบปลายภาคแบบเข้าสอบในห้อง คะแนนเฉลี่ยลดลงเหลือ 48 คะแนน และมีผู้เข้าสอบเพียง 59 จาก 89 คน
- Roberto Serrano มองว่าการตอบสนองของมหาวิทยาลัยยังไม่เพียงพอ และตัดสินใจว่าตั้งแต่ปีการศึกษาถัดไปจะไม่นำ งานรายสัปดาห์ มาคิดคะแนน และจะยกเลิก การสอบ take-home ด้วย
- Princeton ก็ยุติธรรมเนียมการสอบแบบไม่มีผู้คุมที่ยึดตาม Honor Code ซึ่งสืบเนื่องมาตั้งแต่ปี 1893 เช่นกัน สะท้อนว่า AI กำลังเปลี่ยนรูปแบบการประเมินที่สืบทอดมายาวนานของมหาวิทยาลัยชั้นนำในสหรัฐฯ
ข้อสงสัยเรื่องการทุจริตด้วย AI ใน Brown ECON 1170
- Roberto Serrano เป็น Harrison S. Kravis University Professor of Economics แห่ง Brown University และสอนวิชาเศรษฐศาสตร์คณิตศาสตร์ระดับปริญญาตรีขั้นสูง ECON 1170
- เขาระบุว่ามี หลักฐานชี้ขาด ว่าอย่างน้อย 50 คนทุจริตในการสอบกลางภาคเดือนมีนาคม
- เขามองว่านี่คือคดีอื้อฉาวเรื่องการทุจริตครั้งใหญ่ที่สุดที่เป็นที่รับรู้กันใน Brown และอาจรวมถึงทั้ง Ivy League
- Ivy League รวมถึง Princeton, Harvard, Yale, Columbia, Cornell, Dartmouth College และ University of Pennsylvania
- เขารายงานเรื่องนี้ต่อผู้บริหารระดับสูงของ Brown แต่กล่าวว่าปฏิกิริยาจากมหาวิทยาลัยยังไม่เพียงพอ
- อธิการบดีนิ่งเงียบ และคณบดีเพิ่งส่งบันทึกในเชิงว่าเป็น “wake-up call” หลังจากเรื่องถูกส่งต่อไปยัง Academic Code Committee
- Serrano กล่าวว่า “Academic integrity is a value worth defending” และมองว่าหากต้องการปกป้องอนาคตของการศึกษาระดับอุดมศึกษา จำเป็นต้องยอมรับ ความร้ายแรงของปัญหา อย่างเปิดเผยและเริ่มการถกเถียงในวงกว้าง
รูปแบบการสอบและคะแนนที่สูงผิดปกติ
- สอบกลางภาคและสอบปลายภาคของภาคการศึกษานี้เดิมวางแผนให้เป็นแบบ take-home, closed-book ทั้งคู่
- มหาวิทยาลัยในกลุ่ม Ivy League บางแห่งยังคงมีธรรมเนียมการสอบลักษณะนี้อยู่
- Serrano อธิบายว่าเพราะเปิดเวลาให้นักศึกษาแทบไม่จำกัด จึงสามารถออกข้อสอบที่ยากกว่าปกติเพื่อดูขีดความสามารถของนักศึกษาได้
- ข้อสอบมีลักษณะเป็นการเปลี่ยนสมมติฐานบางส่วนของแบบจำลองที่เรียนในชั้น และให้พิสูจน์ว่าข้อความบางข้อเป็นจริงหรือเท็จภายใต้สมมติฐานใหม่
- โดยปกติ ECON 1170 เป็นวิชายากที่มีผู้เรียนไม่มากและมักเป็นนักศึกษาที่เก่ง
- ในอดีตไม่เคยมีผู้เรียนเกิน 30 คนต่อครั้ง และบางครั้งมีเพียง 8 คน
- ภาคการศึกษานี้มีผู้ลงทะเบียน 86 คน ซึ่งอาจเป็นเพราะรูปแบบการประเมินใหม่
- ผลสอบกลางภาคเมื่อวันที่ 5 มีนาคมสูงผิดปกติอย่างมาก
- คะแนนเฉลี่ยอยู่ที่ 96 จาก 100
- มี 40 คน ได้คะแนนเต็ม
- ผู้ตรวจข้อสอบพบความผิดปกติหลายอย่าง และในคำตอบบางส่วนมีข้อความผิดปกติที่ตรงกับผลลัพธ์จากการนำโจทย์ไปใส่ใน ChatGPT
ช่องว่างที่ปรากฏหลังการสอบปลายภาคแบบเข้าสอบในห้อง
- Serrano ไม่ได้ทำให้ผลสอบกลางภาคเป็นโมฆะ แต่แจ้งนักศึกษาว่าสอบปลายภาคซึ่งคิดเป็น 50% ของคะแนนรวมจะจัดเป็น การสอบในห้อง
- เขายังประกาศด้วยว่าหากการกระจายคะแนนของสอบปลายภาคไม่คล้ายกับสอบกลางภาค จะใช้คะแนนสอบปลายภาคเพียงอย่างเดียวในการตัดเกรด
- ผลสอบปลายภาคแบบเข้าสอบในห้องแตกต่างจากสอบกลางภาคอย่างมาก
- คะแนนเฉลี่ยลดลงเหลือ 48 จาก 100
- จากผู้สอบกลางภาค 89 คน มีเพียง 59 คน ที่เข้าสอบปลายภาค
- จาก 27 คนที่ไม่มาสอบปลายภาค มี 22 คน เคยได้คะแนนเต็มในสอบกลางภาค
- เปรียบเทียบคะแนนเฉลี่ย:
- Serrano กล่าวว่า “หลักฐานเชิงประจักษ์เรื่องการทุจริตมีอย่างท่วมท้น”
- เขาตัดสินใจเปลี่ยนวิธีประเมินตั้งแต่ปีการศึกษาถัดไป
- งานรายสัปดาห์ จะไม่ถูกนำมาคิดคะแนนสุดท้าย เพราะสามารถใช้ AI ทำได้
- ต่อให้ดูเหมาะสมเพียงใด ก็จะไม่มี การสอบ take-home อีกต่อไป
เหตุกราดยิงในมหาวิทยาลัยที่ส่งผลต่อรูปแบบการสอบ
- ที่ Brown University เกิดเหตุกราดยิงเมื่อวันที่ 13 ธันวาคมของปีก่อน
- Neves Valentes อดีตนักศึกษาปริญญาเอกวัย 48 ปี ปรากฏตัวในมหาวิทยาลัยพร้อมอาวุธปืนและก่อเหตุยิง
- มีผู้เสียชีวิต 2 คน และบาดเจ็บ 9 คน โดยบางคนอาการสาหัส
- เหตุยิงเกิดขึ้นในห้องเรียนที่กำลังมีช่วงถามตอบเตรียมสอบปลายภาควิชา Introduction to Economics
- ช่วงดังกล่าวนำโดย Rachel Friedberg เพื่อนร่วมงานของ Serrano
- ในบรรดาผู้บาดเจ็บ 9 คน มี 2 คนเป็นนักศึกษาในชั้นเรียนของ Serrano และรอดชีวิตหลังอาการวิกฤตอยู่นานหลายสัปดาห์
- หนึ่งในผู้เสียชีวิตคือ Ella Cook ซึ่งในสัปดาห์เดียวกับที่เกิดเหตุ เธอเพิ่งมาหา Serrano ที่ห้องทำงาน
- เธอขอคำแนะนำเกี่ยวกับแผนลงเรียนวิชา Intermediate Microeconomics ในภาคการศึกษาถัดไป และเส้นทางการเรียนสาขาคู่เศรษฐศาสตร์กับคณิตศาสตร์
- Serrano กล่าวว่าเขาต้องผ่านช่วงเวลาที่ยากลำบากมากทางจิตใจหลังเหตุยิง และเพื่อบรรเทาภาระของนักศึกษาในภาคการศึกษาที่เริ่มขึ้นหลังเหตุการณ์ราวหนึ่งเดือน เขาจึงตัดสินใจเปลี่ยนการสอบเป็นแบบ take-home
- นักศึกษาหลายคนบอกว่ายังรู้สึกกังวลเมื่ออยู่ในมหาวิทยาลัยหลังเหตุการณ์เดือนธันวาคม
- เขากล่าวว่าตลอด 34 ปีที่ผ่านมา เขาเคยให้สอบ take-home เพียงครั้งเดียวด้วยเหตุผลที่สมควรอย่างยิ่ง แต่ผลตอบแทนกลับเป็นการทุจริตครั้งใหญ่ ซึ่งเป็นเรื่องเจ็บปวด
AI กำลังสั่นคลอนธรรมเนียมการประเมินของมหาวิทยาลัยชั้นนำ
- AI กำลังเปลี่ยน ธรรมเนียมการประเมินผลทางการศึกษา ที่สืบทอดมายาวนานของมหาวิทยาลัยชั้นนำในสหรัฐฯ
- Princeton ยุติธรรมเนียมที่ดำเนินมา 133 ปี และต่อจากนี้อาจารย์จะเข้าสอบเป็นผู้คุมการสอบแบบในห้อง
- หลังการใช้ Honor Code ในปี 1893 นักศึกษาที่ Princeton ต้องให้คำมั่นว่าจะไม่ทุจริต และอาจารย์จะเพียงแจกข้อสอบแล้วออกจากห้อง กลับมาอีกครั้งเมื่อหมดเวลา
- หากมีใครทุจริต นักศึกษาคนอื่นต้องเป็นผู้แจ้งรายงาน
- Theo Baker นักข่าววัย 22 ปีที่จบจาก Stanford เขียนใน The New York Times ว่า “A.I. has made deception easier and more remunerative than ever before”
- เขาเข้าเรียนที่ Stanford สองเดือนก่อน ChatGPT รุ่นแรกเปิดตัว และตลอด 4 ปี เขาเห็นนักศึกษารอบตัวจำนวนมากต้านทานสิ่งล่อใจในการใช้ AI ไม่ไหว
- เขายังเขียนว่า “I don’t know a single person who hasn’t used A.I. to get through some assignment in college”
- Serrano ก็เห็นว่า AI ให้แรงจูงใจมากขึ้นแก่นักศึกษาในการทุจริต
- เขากล่าวว่าไม่ควรปกปิดเหตุการณ์เช่นนี้ และหากเราไม่ยึดมั่นในความจริง ศักดิ์ศรี และความซื่อสัตย์อีกต่อไป วงวิชาการก็ยากจะรักษาความน่าเชื่อถือไว้ได้
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
ใน ยุค AI การสอบน่าจะต้องกลับไปเป็นแบบพบหน้ากันและเขียนด้วยมือ
ผมเขียนบทความไว้ว่าได้ปรับการสอนให้เข้ากับสถานการณ์นี้อย่างไร: https://htmx.org/essays/universities-and-ai/
น่าขันตรงที่ โครงสร้างพื้นฐานยุคก่อนคอมพิวเตอร์ อย่างห้องเลกเชอร์ขนาดใหญ่และเครื่องถ่ายเอกสารขนาดใหญ่ อาจทำให้ปริญญามหาวิทยาลัยเป็นสัญญาณบ่งชี้ความสามารถทางปัญญาของนักศึกษาได้ดีกว่าเดิม
ใช้เดสก์ท็อปพีซีเก่า ๆ การ์ด LAN แบบมีสาย สวิตช์ในห้องเดียวกันที่ไม่มีการเชื่อมต่อออกไปภายนอก เครื่องพิมพ์เลเซอร์ และแค่ lubuntu กับ libreoffice writer ก็สร้างห้องสอบได้ในราคาถูก
อย่างน้อยควรให้พิมพ์เรียงความด้วยฟีเจอร์ของโปรแกรมประมวลผลคำระดับ MS Word 2000 ขึ้นไป
ผมว่าวิธีนั้นตอนนี้ก็ยังน่าจะใช้ได้
มาเรียนเพราะอยากเรียนและอยากรู้ ดังนั้นความท้าทายแบบนั้นเป็นเรื่องดี
ผมไม่เข้าใจจริง ๆ ว่าลงเรียนหลักสูตรปริญญาแล้วทำไมต้องโกงด้วย การต้องทนเรียนวิชาที่ไม่ได้สนใจเลยคงเหมือนการทรมาน
นักศึกษาก็ล้ำหน้าเช่นกันด้วยโพย iPad ที่ซ่อนไว้ โทรศัพท์มือถือ และการกระซิบกันแบบดั้งเดิมระหว่างสอบ
อีกทางเลือกหนึ่งคือวิธีอย่าง Safe Exam Browser ที่ล็อกอุปกรณ์ระหว่างสอบได้ค่อนข้างดี
เปิดเผยผลประโยชน์: ผมทำสตาร์ทอัพเล็ก ๆ ที่ช่วยให้ครูสร้างและจัดสอบดิจิทัล และกำลังเชื่อมต่อกับ Safe Exam Browser เพราะการโกงเป็นปัญหาที่ครูบ่นมากที่สุดในการสอบดิจิทัล
การสอบที่บ้านครั้งล่าสุดที่ผมเห็นคือ EE364a: Convex Optimization เป็น การสอบ 24 ชั่วโมง และตอนนั้นผมยังเป็นหวัดด้วย
ที่บ้านไม่มีแอร์เลยจองห้องโรงแรมไว้ และมันโหดมาก ผมทำโจทย์โปรแกรมมิงถูกเป็นส่วนใหญ่ แต่พิสูจน์ถูกแค่ไม่กี่ข้อ ค่าเฉลี่ยของห้องสำหรับข้อสอบนั้นและแทบทุกการบ้านอยู่เหนือ 80% และเกรดสุดท้ายของผมคือ A-
สำหรับนักศึกษา Stanford วิชานี้อาจไม่ได้ยากขนาดนั้น แต่ถ้าคะแนนเฉลี่ยของการบ้านแทบทั้งหมดสูงขนาดนั้น ก็ทำให้สงสัยเรื่องการโกงได้ เบาะแสคือ office hours ไม่ว่าวิชาไหน ถ้าไป office hours ก็จะมีคิว และผมก็รู้ได้เร็วว่าผู้ช่วยสอนมักจะหลุดใบ้คำใบ้ที่ช่วยแก้โจทย์ยาก ๆ ได้ง่าย ๆ นั่นเป็นข้อได้เปรียบที่ไม่ยุติธรรมสำหรับนักศึกษาที่เข้าร่วมได้
ทำให้นึกถึงสแกนดัลใหญ่เรื่องการโกง USMLE ในหมู่นักศึกษาแพทย์ชาวเนปาล: https://www.medpagetoday.com/special-reports/features/113627
ผมได้พบแพทย์จบต่างประเทศเก่ง ๆ มาหลายคน และในนั้นมีหลายคนที่ได้คะแนน USMLE สูงจนน่าทึ่ง ข้อเท็จจริงคือ นักศึกษาอเมริกันเตรียมตัวระหว่างเรียนแพทย์ไม่ถึง 2 ปี แต่ผู้สมัครต่างประเทศสามารถรอหลายปีหลังจบการศึกษาแล้วค่อยสอบได้ จึงไม่มีข้อจำกัดด้านเวลาเตรียมตัว
ก่อนสแกนดัลนั้น ผมนึกไม่ถึงเลยว่าจะโกง USMLE ได้ ศูนย์สอบ Prometric ควบคุมเข้มงวดมาก แต่วิธีการโกงเป็นอีกแบบ ผู้เข้าสอบก่อนหน้าจำคำถามได้บางข้อแล้วเพิ่มลงในฐานข้อมูลลับ และเมื่อเวลาผ่านไปหลายปี ก็สะสมจนแทบครบทุกข้อ ผู้เข้าสอบทุ่มเทอย่างมากเพื่อท่องจำคำถามทั้งหมด เพราะรางวัลคือการได้เป็นแพทย์ประจำบ้านในสหรัฐฯ ซึ่งเปลี่ยนชีวิตได้ จึงเข้าใจได้ว่าทำไมการโกงถึงแพร่หลาย
ผมเห็นกับตาในภาควิชา CS ของ Dartmouth และสถานการณ์แย่มาก
เรากำลังออกแบบหลักสูตรระบบเบื้องต้นใหม่ และมองเรื่องนี้เป็น ปัญหาเชิงปฏิปักษ์ กล่าวคือ ต่อให้นักศึกษาปรับให้ได้เกรดสูงสุดเมื่อเทียบกับแรงที่ลงไป ก็ยังต้องทำให้บรรลุเป้าหมายการเรียนรู้
ดังนั้นนอกจากข้อสอบกระดาษแล้ว เรายังใส่ การสัมภาษณ์ 1:1 เพื่อตรวจว่านักศึกษาเข้าใจงานที่ส่งมาหรือไม่ มีทั้งคำถามเชิงข้อเท็จจริงอย่าง “มาโครนี้ในไลบรารีนี้ทำอะไร?”, “ฟังก์ชันนี้ทำอะไรและทำงานอย่างไร?” และคำถามเชิงแนวคิดอย่าง “ทำไมถึงจัดโครงสร้างโค้ดแบบนี้แทนที่จะใช้ $whatever?”, “ลองวิธีแก้แบบอื่นอะไรมาบ้าง?”
เราหยุดการสร้างโค้ดไม่ได้ แต่อย่างน้อยพวกเขาต้องเข้าใจโค้ดที่สร้างขึ้นอย่างละเอียด
มันไม่ดีเท่ากับการเขียนโค้ดเอง แต่ผมก็ไม่รู้ว่าแย่กว่ากันแค่ไหน ในวิชาคณิตศาสตร์ ช่องว่างนั้นกว้างมาก เพราะการเข้าใจบทพิสูจน์ของคนอื่นง่ายกว่าการเขียนเองมาก ในวิชาโปรแกรมมิง แม้ไม่มีหลักฐาน แต่ผมคิดว่าช่องว่างนั้นเล็กกว่านิดหน่อย
จากประสบการณ์ในอดีต ถ้าทำให้ชัดเจนตั้งแต่แรกว่าจะประเมินแบบนี้ นักศึกษาจะคาดการณ์ได้และรับมือได้ดี หรือไม่ก็ดร็อปวิชาในสัปดาห์แรก แต่ถ้าเริ่มด้วยการสอบที่บ้านแล้วจู่ ๆ กลางเทอมเปลี่ยนเป็นสอบกระดาษ เหมือนในบทความ ก็จะกู้สถานการณ์ไม่ได้เพราะครึ่งหนึ่งโกงไปแล้ว
นักศึกษาก็มีความอยากเรียนรู้เชิงนามธรรมอยู่บ้าง แต่ถูกจูงใจด้วยเกรดมากกว่ามาก ถ้ามีเส้นทางชัดเจนที่ใช้แรงน้อยแล้วได้เกรดดี ส่วนใหญ่ก็จะเลือกเส้นทางนั้น มันโจ่งแจ้งถึงขั้นเว็บรีวิววิชาของนักศึกษาปริญญาตรีมีชื่อว่า “Layup List” แบบตรงตัว
งานของผู้สอนคือทำให้ทุกเส้นทางที่นำไปสู่เกรดดีต้องอาศัยการเรียนรู้จริง หรือทำให้การทำแบบอื่นยากกว่าการเรียนไปเลย
ไม่ควรโทษนักศึกษา นักศึกษาเก่งเรื่องการปรับให้เหมาะกับตัวชี้วัด และนั่นแหละคือสิ่งที่พาพวกเขามาถึงจุดนี้ เราแค่ต้องปรับตัวชี้วัดการประเมินให้สอดคล้องกับผลลัพธ์ที่เราต้องการมากขึ้น
มีคนอีกมากที่ไม่ได้รับโอกาสเข้า Ivy League โทษของการโกงควรเป็น ไล่ออกโดยอัตโนมัติ
ในมุมผู้จัดการฝ่ายจ้างงาน ถ้าโรงเรียนไม่สามารถแสดงความซื่อสัตย์ของนักศึกษาได้ ปริญญามหาวิทยาลัยก็ไม่มีค่าอะไรเลย
เหมือนกับในโปรแกรมมิงที่บางครั้ง “แค่สร้าง X เอง” ง่ายกว่า คำอธิบายบทพิสูจน์บางแบบอัดแน่นเกินจำเป็น จนการคิดเอง 90% แล้วค่อยอาศัยประโยคใบ้ไม่กี่ประโยคสำหรับ 10% สุดท้าย กลับเหนื่อยน้อยกว่า
ผมไม่เสียใจที่เห็นคำอธิบายหรือวิธีแก้ของ LLM ที่หรูหราแต่ชวนหงุดหงิดแล้วเลิกใช้ ก่อนจะลงมือทำเองไปเลย การถามตอบแบบโสเครตีส กับ AI บางครั้งก็ไม่คุ้มกับแรงที่ลงไป
ผมจบปริญญาตรี CS แต่ไม่เคยมีใครถามเกรดเลย ผมพยายามปรับให้เรียนรู้ได้มากที่สุด และพอออกสู่โลกจริง สิ่งนั้นก็ได้รับผลตอบแทนค่อนข้างดี
หากสาขาวิจัยคือทฤษฎีเกม ก็ควรรู้ว่าในสถานการณ์ที่คู่แข่งทุกคนมีโอกาสใช้ LLM ตัวเลือกที่เหมาะที่สุดตามทฤษฎีเกม ก็คือการใช้ LLM
สังคมควรให้รางวัลกับใบรับรองคุณวุฒิ หรือควรให้รางวัลกับความสามารถ?
แน่นอนว่ามันใช้ไม่ได้ในที่ที่เป้าหมายคือปริญญาจากสถาบันชั้นนำในตัวมันเอง แต่ในวิทยาลัย liberal arts ขนาดเล็กที่มีความสัมพันธ์แน่นแฟ้น กฎเกียรติยศ อาจทำงานได้ค่อนข้างดี
พูดตรง ๆ ในฐานะอาจารย์มหาวิทยาลัย ผมไม่เข้าใจความหมายของ การให้เกรด
ใครกันที่ดูเกรดแล้วใส่ใจ? น่าจะเป็นฝ่าย HR ของบริษัท ถ้าอย่างนั้นทำไมอาจารย์ต้องคัดกรองให้บริษัทฟรี ๆ?
อีกทั้งภาวะเกรดเฟ้อก็มาถึงจุดที่อาจให้ A ทุกคนแล้วปล่อยให้บริษัทคัดเลือกเองได้แล้ว
ก่อนที่แวดวงวิชาการจะกลายเป็นสนามรบทางอุดมการณ์แบบทุกวันนี้ ผมเคยทำงานช่วงสั้น ๆ ในการศึกษาด้าน CS หลังมัธยม ถ้าพูดแบบนั้นตอนนั้นก็คงถูกไล่ออกแล้ว
ถ้าเกรดเฟ้อเป็นปัญหา ก็อย่าทำให้มันเฟ้อ การสอบมาตรฐานก็มีประโยชน์ตรงนี้พอดี แต่เหตุผลที่หลายคนคัดค้านคงเป็นเพราะมันจะเผยให้เห็นว่าระดับจริง ๆ แย่แค่ไหน
“ปลามักเน่าจากหัวก่อน”
นี่ไม่ใช่งานที่ทำฟรี การตรวจให้คะแนนเป็นส่วนหนึ่งของงานที่ UC จ่ายค่าจ้างและสวัสดิการมากกว่า 250,000 ดอลลาร์ให้อาจารย์
HR เพียงใช้สัญญาณที่มีอยู่เท่านั้น ถ้าคนฉลาดมีแนวโน้มจะมีวุฒิมหาวิทยาลัย ก็ใช้สิ่งนั้นเป็นตัวกรอง ถ้ามีแนวโน้มจะจบจากบางมหาวิทยาลัย ก็ใช้รายชื่อนั้นเป็นตัวกรอง และถ้ามีใบแสดงผลการเรียน โดยที่คนฉลาดมีแนวโน้มได้เกรดดีกว่า ก็ขอใบแสดงผลการเรียน
HR ไม่ได้เป็นคนคิดค้นเกรดหรือใบแสดงผลการเรียนขึ้นมา
เห็นด้วยกับประโยคสุดท้าย สัญญาณจากเกรด หรือแม้แต่การจบการศึกษาเอง อ่อนลงมากแม้ในมหาวิทยาลัยมีชื่อเสียง
หากอยากปรับปรุงสถานการณ์นั้น เริ่มได้จากการเพิ่มชื่อของคุณลงในจดหมายเปิดผนึกฉบับนี้ของคณาจารย์ STEM ที่ UC: https://docs.google.com/forms/d/e/1FAIpQLSdwvDywR-CAt3t_U3Aw...
ภายหลังได้รู้ว่า tutor นำงานนั้นไปเสนอต่อคณะกรรมการเพื่อผลักดันให้เป็น high distinction แต่พลาดไปอย่างหวุดหวิด และถึงอย่างนั้นงานนั้นก็ยังถูกเก็บไว้เป็นตัวอย่างของผลงานที่วิชานั้นต้องการ
ตอนนั้นยังเป็นวัยหนุ่มที่กำลังเรียนรู้ความสัมพันธ์ระหว่างความพยายามกับผลตอบแทน จึงรู้สึกสะเทือนใจมาก ผมทุ่มเทอย่างมากกับวิชาที่ไม่ได้มีพรสวรรค์โดยธรรมชาติมากนัก แต่ผลลัพธ์ส่วนใหญ่ออกมาธรรมดา การได้รู้ว่าถ้าพยายามอย่างต่อเนื่องก็สามารถสร้างสิ่งที่ได้รับการยอมรับได้นั้นน่าทึ่งมาก
ในทางกลับกัน ภรรยาผมตอนนี้เคยเรียนวิชาในระดับ diploma ที่สถาบันเดียวกัน ซึ่งให้แค่ pass/fail หลายคนสับสน และช่วงคุณภาพของงานที่นับว่า “pass” นั้นกว้างมาก
จิตใจมนุษย์ใช้ ระบบรางวัล ภายในวงจรป้อนกลับ หากอยากตัดมันทิ้งเพราะความชอบส่วนตัว ก็เท่ากับเพิกเฉยต่อความเป็นจริงของมนุษย์
จะได้ไม่ตกอยู่ในความมั่นใจเกินจริงหรือภาวะ impostor syndrome เมื่อรับมือกับเนื้อหาใหม่ ๆ การมองระดับโปรเจกต์ของตัวเองอย่างเป็นกลางทำได้ยาก
“การสอบแบบปิดตำราที่บ้าน” เป็นคำที่ขัดแย้งในตัวเอง
เห็นด้วยกับคนอื่น ๆ ที่บอกว่า AI ไม่ใช่ปัญหา
มีเวลาเพียงพอ และพอรู้ขอบเขตคำถามคร่าว ๆ มันให้รางวัลกับการเชี่ยวชาญเนื้อหาจริง ๆ มากกว่าการท่องจำ
ตอนสอบ CS บางคนเอาหนังสือมามากจนแทบยกไม่ไหว แต่ผมคิดว่าไม่ได้ช่วยอะไรมากนัก
แนวคิดคือการสอบทั่วไปสั้นเกินกว่าจะประเมินความรู้ของนักศึกษา และนักศึกษาที่ทำเร็วไม่ควรได้เปรียบ
เห็นด้วยว่ายุคที่ให้สอบที่บ้านแล้วคาดหวังว่านักศึกษาจะไม่ทุจริตนั้นผ่านไปแล้ว อาจเคยมีช่วงเวลาที่พอคาดหวังได้ว่านักศึกษาส่วนใหญ่จะซื่อสัตย์ แต่บรรยากาศปัจจุบันไม่เข้ากับสิ่งนั้นเลย
โดยเฉพาะหลังโควิด ด้วยเหตุผลหลายอย่างรวมกัน นักศึกษาดูเหมือนไม่ค่อยสนใจอะไรนอกจากการทำให้สัดส่วนเกรดต่อความพยายามอยู่ในระดับที่เหมาะที่สุดแบบ minimax
ผลคือ นักศึกษาใช้ ChatGPT ตั้งแต่ช่วงต้น ๆ และคิดว่าจะทำแบบนั้นต่อไปได้ แล้วพอเจองานครั้งแรกที่โกงไม่ได้ ก็พังทลายอย่างสิ้นเชิง
พวกเราให้ความสำคัญกับกฎเกียรติยศอย่างจริงจังมาก เมื่อก่อนผมเองก็มักให้นักศึกษาทำข้อสอบที่บ้านแบบเปิดตำรา แต่มีข้อกำหนดว่า “ห้ามใช้แหล่งข้อมูลภายนอก” อยู่บ่อย ๆ แต่ตอนนี้สรุปแล้วว่าแทบเป็นไปไม่ได้ ที่นี่ก็ไม่มีกฎเกียรติยศอย่างเป็นทางการด้วย
สิ่งที่น่าประทับใจเป็นพิเศษคือข้อสอบคณิตศาสตร์แบบปิดตำราที่มีเวลาจำกัด โดยในกระดาษข้อสอบมีแค่เลขข้อจากตำราสี่ข้อ ต้องเปิดหนังสือ คัดลอกเฉพาะโจทย์เหล่านั้น แล้วไม่ดูอย่างอื่นก่อนปิดหนังสือ
พูดตรง ๆ นั่นเป็นวิธีที่เชื้อเชิญปัญหา และตอนนี้เมื่อผมกลายเป็นอาจารย์แล้ว ก็คิดว่าอาจารย์คนนั้นขี้เกียจอย่างไร้เหตุผล ถึงอย่างนั้นก็แสดงให้เห็นจิตวิญญาณนั้นได้ดี จริง ๆ แล้วเขาไม่ใช่อาจารย์ของ Harvey Mudd แต่เป็นอาจารย์บัณฑิตวิทยาลัยที่อยู่ใกล้กัน ซึ่งก็อาจมีผลอยู่บ้าง
ในโปรแกรมที่แข่งขันสูงของมหาวิทยาลัยชั้นนำ เมื่อถูกประเมินแบบอิงกลุ่ม และรู้ว่าเพื่อนร่วมชั้นโกงด้วย AI ก็มีแรงกดดันอย่างมากจนเหมือนจำเป็นต้องทำแบบเดียวกัน
โดยเฉพาะงานสำหรับบัณฑิตจบใหม่ยิ่งหายากขึ้น และแรงกดดันให้ต้องทำทั้งอินเทิร์นชิประหว่างเรียนกับโปรเจกต์เสริมก็ยิ่งมากขึ้น หากไม่โกงก็ไม่มีทางแข่งขันได้
ปัญหาการโกงและ AI ตอนนี้เป็นวิกฤตที่ใหญ่กว่าโควิดแล้ว จากประสบการณ์ของผม ในคลาสระดับสูงและ AP มีนักเรียนน้อยมากที่ไม่โกง และเหตุผลก็โดยมากเป็นอย่างที่กล่าวไว้ข้างต้น
การออกแบบการเรียนการสอนและข้อสอบให้การโกงด้วย AI ไม่กลายเป็นปัญหา ต้องใช้ทรัพยากรมหาศาลจากครู ครูจำนวนมากที่ผมรู้จักแทบจะถอดใจแล้ว ในสถานการณ์ที่ความต้องการด้านเวลาและพลังงานของครูสูงลิ่วอยู่แล้ว ต้นทุนและความพยายามในการหลบเลี่ยงการโกงสูงเกินไป
ฝ่ายบริหารโรงเรียนก็ไม่ได้ช่วยอะไรมาก เพราะพึ่งพาซอฟต์แวร์อย่างไม่วิพากษ์และกระตือรือร้นในทุกระดับ ในบางแง่ฝ่ายบริหารก็เป็นส่วนหนึ่งของปัญหาเช่นกัน
ไม่รู้ว่าโรงเรียนนอกสหรัฐฯ เป็นอย่างไร แต่ที่นี่มันกลายเป็น การแข่งขันสะสมอาวุธ ไปแล้ว
จริยธรรมแบบหน้าที่นิยมเริ่มต้นที่บ้าน
ในกรณีนี้ สิ่งที่ถูกต้องคือหยิบยกปัญหานี้ขึ้นไปกดดันฝ่ายบริหาร ผู้บริจาค และนักการเมืองอย่างจริงจัง ถ้าจำเป็นก็ใช้ AI ช่วยทำด้วย
ปัญหาที่โรงเรียนปฏิเสธจะลงโทษการโกงกำลังรั่วไหลไปถึงภาคธุรกิจและการเมืองแล้ว
เช่น MIT ก็ทำแบบนั้น มาตรฐานควรเป็นแบบสัมบูรณ์
ทางเลือกมีอยู่ แค่แกล้งทำเหมือนไม่มีเพื่อหลีกเลี่ยงความรับผิดชอบเท่านั้น
อีกอย่าง นอกจากบริษัทการเงิน/ควอนต์ที่น่าอึดอัดไม่กี่แห่ง ก็ไม่มีที่ไหนถามเลยว่า GPA มหาวิทยาลัยของผมเท่าไร และก็ไม่สนใจด้วย
ผมไม่ได้สนับสนุนการโกงด้วย AI เลย แต่จากประสบการณ์บอกได้ว่าไม่มีอะไรน่าเบื่อและบั่นทอนจิตวิญญาณไปกว่าการคุมสอบข้อเขียนที่กินเวลาหลายชั่วโมง
งานนั้นทำให้ผมหมดใจที่จะสอนในอุดมศึกษา
ผมคิดว่าเพื่อแก้ปัญหาหลายอย่าง เราต้องทำให้การศึกษาเป็น การศึกษาในตัวมันเอง ไม่ใช่การสอบและการรับรอง ตามแนวคิดของ Ivan Illich https://en.wikipedia.org/wiki/Deschooling_Society
เคยมีกระแสไร้สาระทำนองว่าคะแนนเป็นการเหยียดเชื้อชาติ และส่วนหนึ่งเป็นปฏิกิริยาตอบโต้ต่อ NCLB
มันใช้ไม่ได้ผล การเรียนรู้จำเป็นต้องมีกระบวนการเผชิญกับความยากและการประเมิน ต่อให้เรียนด้วยตัวเองก็เหมือนกัน
ถ้าอยากเห็นว่าการเรียนรู้แบบไม่มีการสอบหน้าตาเป็นอย่างไร ให้ดูคนที่คุยกับ AI แล้วเชื่อว่าตัวเองเรียนหัวข้อหนึ่งด้วยตัวเองแล้ว สิบคนมีเก้าคนคิดว่าตัวเองรู้อะไรบางอย่าง แต่แก้ปัญหาจริงด้วยตัวเองไม่ได้
ระหว่างที่นักเรียนทำข้อสอบ ก็แค่เดินหรือยืนอยู่ได้ การตรวจข้อสอบน่าเบื่อก็จริง แต่การคุมสอบเป็นประสบการณ์ที่เป็นกลาง
ถึงจะเรียกว่า “ยุค AI” แต่เมื่อก่อนก็สามารถค้นหาโจทย์ด้วย Google แล้วหาคำตอบได้อยู่แล้ว
สิ่งที่ลดการทุจริตที่ UVA ได้คือ กฎเกียรติยศ และความเชื่อของอาจารย์แต่ละคนในความซื่อสัตย์ของนักศึกษา วัฒนธรรมนั้นเพียงอย่างเดียวก็เพียงพอที่จะทำให้ไม่ทุจริต
ผมคิดว่าทางแก้คือการโฟกัสที่วัฒนธรรม การทุจริตควรเป็นตัวเลือกที่เย้ายวนอยู่เสมอ และนักศึกษาต้องฝึกฝนความซื่อสัตย์ท่ามกลางแรงยั่วยุนั้น ความซื่อสัตย์ก็เหมือนกล้ามเนื้อ ถ้าไม่ใช้ก็จะลีบลง
สมัยเรียนมหาวิทยาลัย ถ้าถูกจับได้ว่าทุจริตจะเดือดร้อนหนัก คนที่ทำซ้ำจะเจอผลลัพธ์ร้ายแรงอย่างสอบตกวิชานั้น และถ้าเป็นวิชาบังคับในสายหลักก็อาจทำให้จบช้าลง พอเริ่มทำงานช้าลงก็มีต้นทุนทางการเงินจริงตามมา
มหาวิทยาลัยทุกวันนี้ดูเหมือนพยายามหลีกเลี่ยงปัญหาการทุจริตไม่ทางใดก็ทางหนึ่ง อาจารย์ในบทความเองก็บ่นว่าการดึงความสนใจไปที่ปัญหาการทุจริตนั้นยากแค่ไหน และแม้แต่ในภาควิชาของตนเองก็ไม่มีปฏิกิริยา
นักศึกษาก็รู้เรื่องนี้ เมื่อการทุจริตเกินจุดวิกฤต และเห็นว่าคนทุจริตไม่ได้เจออะไรแย่ ๆ ก็เริ่มรู้สึกว่าถ้าไม่ทุจริตเองจะเสี่ยงตามหลัง คนทุจริตได้เกรดสูงกว่า ในกรณีนี้หลายคนได้ 100% แล้วออกไปปาร์ตี้ระหว่างที่คนอื่นอ่านหนังสือ ถ้าเกรดถูกแจกตามโค้งก็เสียเปรียบจริง ๆ
ดังนั้นแรงยั่วยุจึงแพร่กระจาย ผมเห็นคนหนุ่มสาวบางคนรอบตัวหลอกตัวเองว่าใช้ ChatGPT เพื่อตรวจคำตอบและเรียนรู้ แต่พวกเขาไม่ตระหนักว่าการที่ ChatGPT แก้โจทย์และไล่ดูคำตอบที่ถูกนั้นเป็นเรื่องผิวเผินมาก
พอรู้ว่ามีปุ่มให้กด ความพยายามในการตรวจงานของตัวเองก็ลดลงด้วย เมื่ออยู่ในสถานการณ์ที่พึ่งปุ่มนั้นไม่ได้ ทุกอย่างก็พังหมด
ช่วงใดช่วงหนึ่งใน 20 ปีที่ผ่านมา มหาวิทยาลัยกลายเป็นสินค้าฟุ่มเฟือย และตามธรรมชาติก็เกิดความรู้สึกว่าลูกค้ามีสิทธิ์ต่าง ๆ ตามมา
บวกกับความรับรู้ที่เพิ่มขึ้นว่าการเรียนในห้อง โดยเฉพาะวิชาของอาจารย์ประจำสายวิจัยที่ดูเหมือนรำคาญการสอน แทบไม่เกี่ยวข้องกับทักษะในที่ทำงาน
ดังนั้นผมจึงคิดว่าก็มีส่วนถูกอยู่บ้างที่นักศึกษาตัดสินใจว่าการมองข้ามกฎแล้วโฟกัสกับการติ๊กเช็กลิสต์ให้ครบเป็นเรื่องฉลาด
เรายังตกลงเรื่องนั้นไม่ได้ด้วยซ้ำ จึงแก้ไขได้ยาก
ต้องอาศัยสัญญาระหว่างรุ่นทั้งหมด การได้รับความไว้วางใจจากนักศึกษา และความยินยอมโดยสมัครใจของพวกเขา มีการตีตัวออกห่างจำนวนมากที่เกิดจากความเย้ยหยัน ความไม่ไว้วางใจ และการไม่สามารถยอมรับอย่างจริงใจได้
ไม่ใช่เรื่องของการดุเพิ่มอีกนิดแล้วพูดว่า “การทุจริตเป็นเรื่องไม่ดีนะ เข้าใจไหม”
หนึ่งในจุดเริ่มต้นคือการตั้งคำถามอย่างจริงจังว่าใครต้องการปริญญามหาวิทยาลัยและเพราะอะไร และ ลัทธิยึดวุฒิการศึกษา นี้พรากปีที่ควรใช้สร้างผลงานของคนหนุ่มสาวไปอย่างไร
อย่างน้อยข้อตกลงเดิมคือ แม้ปริญญาตรีที่ไม่เกี่ยวกับสาขางานจะเป็นด่านผ่าน ก็ยังคาดหวังงานชนชั้นกลางได้ แต่แม้แต่ข้อตกลงนั้นก็แย่ลงแล้ว
ในความเป็นจริง บทบาทหลักของปริญญา ไม่ว่าในอุดมคติควรเป็นอะไร คือ ประตูสู่ตำแหน่งงานค่าจ้างสูง
ปัญหาเกิดขึ้นตรงนี้ สมมติว่าเรียนเอก X ในมหาวิทยาลัยเพื่อให้ได้งาน Y เราจะคิดว่าบริษัทกำหนดให้มีปริญญาเพราะต้องการหลักฐานว่าความสามารถด้าน X จำเป็นต่อการทำงาน Y
แต่พอไปมหาวิทยาลัย กลับพบว่าวิชาส่วนใหญ่ที่จำเป็นต่อการได้ปริญญา X จริง ๆ แล้วไม่เกี่ยวกับ X เลย แถมยังมีนักศึกษาที่แค่อัดหนังสือก่อนสอบและไม่มีความรู้จริงเกี่ยวกับ X ก็ได้ A และจบออกไป
พอไปฝึกงานภาคฤดูร้อนในงาน Y ก็รู้ว่าการเรียนรู้งาน Y แทบไม่เกี่ยวข้องกับ X ที่เรียนในโรงเรียนเลย ผู้จัดการและคนในบริษัทที่ทำงาน Y ได้ดีมาก ซึ่งทั้งหมดเคยเรียนเอก X ต่างก็ลืมเรื่อง X ไปเกือบหมดแล้ว และกลับรู้น้อยกว่าผมด้วยซ้ำ แต่ทำงาน Y ได้ยอดเยี่ยม
หลังฝึกงานเสร็จ คุณรู้ว่าตัวเองทำงาน Y ได้เพียงพอแล้ว แต่เพราะไม่มีปริญญา จึงยังได้งาน Y ไม่ได้ คุณรู้เรื่อง X มากกว่าคนที่ทำงาน Y และเห็นแล้วว่าพวกเขาไม่ต้องใช้ความรู้ X ในการทำงานนั้น แต่ก็ยังต้องกลับไปเรียน X เพิ่ม
สุดท้ายจึงถูกบังคับให้เอาปริญญา X เพื่อให้ได้งาน Y ทั้งที่งาน Y ไม่ได้ต้องใช้ความรู้ X จริง ๆ แม้แต่ปริญญา X เองก็ไม่ได้หมายความว่ามีความรู้จริงเกี่ยวกับ X อยู่ดี เพราะอย่างไรก็เรียนงาน Y กันหน้างาน
ดังนั้นเมื่อถึงเวลาสอบ X ก็จะคิดว่า “ทำไมต้องใช้เวลากับเรื่องนี้?” และตัดสินใจใช้ ChatGPT เพราะทั้งระบบมันเละเทะ
สิ่งนี้คล้ายกับประสบการณ์ของผมในมหาวิทยาลัย ตอนนั้นยังไม่มี LLM จึงยากกว่า และแม้ไม่ได้อ่านมากก็ยังได้ A เลยไม่ได้ทุจริต แต่ผมคิดว่ามันยากที่จะโทษคนที่ทำ
ผมไม่รู้จริง ๆ ว่าความซื่อสัตย์อยู่ตรงไหนในระบบนี้ ตัวระบบเองไม่มีความซื่อสัตย์ ดังนั้นบางครั้งการทำตัวซื่อสัตย์ในระบบนั้นจึงดูเหมือนเป็นคนโง่
หากอยากเปลี่ยนวัฒนธรรมให้ส่งเสริมความซื่อสัตย์ การศึกษาและปริญญาต้องมีความหมายมากกว่าการเป็นด่านราชการตามอำเภอใจ
ดูเหมือนว่า การสอบที่บ้าน คงจบลงแล้ว
ไม่เข้าใจพฤติกรรมแบบนี้ของนักศึกษาปริญญาตรีเลย จ่ายเงินก้อนใหญ่เพื่อการศึกษา แล้วทำไมถึงข้ามส่วนของการเรียนไป?
ในงานแรกหลังจบมหาวิทยาลัย เหล่าพนักงานรุ่นเก๋าในบริษัทล้วนเป็นคนที่เข้ามาทำงานได้ด้วยแค่วุฒิมัธยมปลาย แต่ตอนนี้ถ้าจะให้แข่งขันได้ ในทางปฏิบัติต้องมีปริญญาโท เพราะที่นอร์เวย์ที่ฉันอยู่ ผู้สมัครส่วนใหญ่มีปริญญาโทหลักสูตร 5 ปี และจริง ๆ แล้วมันคือ ภาวะเงินเฟ้อทางวุฒิการศึกษา
ที่นี่มีคำพูดเชิงล้อเล่นว่า “Mastersyken” หรือ “โรคปริญญาโท” หมายถึงปรากฏการณ์ที่คนจำนวนมากเกินไปไปเรียนปริญญาโทเพียงเพื่อใบปริญญา พยายามทำให้ตัวเองดูน่าสนใจขึ้นในการหางาน แต่สุดท้าย “ทุกคน” ก็มีปริญญาโทกันหมด ทำให้ทุกคนยังอยู่ในตำแหน่งเดิมเหมือนก่อน และมีแค่หนี้กู้ยืมเพื่อการศึกษาที่เพิ่มขึ้น
สิ่งที่แย่ที่สุดคือหลังเริ่มทำงานแล้ว ได้ตระหนักจริง ๆ ว่างานนี้เป็นงานที่สามารถทำได้ดีพอแม้เพิ่งจบมัธยมปลายก็ตาม
สำหรับคนส่วนใหญ่ จุดประสงค์ของมหาวิทยาลัยคือการได้กระดาษหนึ่งใบที่เปิดโอกาสให้มีเงินเดือนสูงขึ้น ดังนั้นจึงทำสิ่งที่จำเป็นเพื่อให้ได้กระดาษใบนั้นด้วยความพยายามขั้นต่ำ
ตราบใดที่ปริญญา โดยเฉพาะปริญญาจากมหาวิทยาลัยที่มีชื่อเสียง ยังไม่หยุดเป็นเครื่องมือแบบนั้น พฤติกรรมนี้ก็จะดำเนินต่อไป
หรืออาจมองมหาวิทยาลัยเป็นแค่โอกาสในการสร้างเครือข่ายก็ได้
ถ้าตั้งแต่แรกไม่ได้อยากอยู่ที่นั่น หรือไม่เห็นคุณค่าของการเรียนรู้ ก็ไม่น่าแปลกใจที่จะเลือกทางลัด หรืออาจเป็นไปได้ว่าพวกเขาโกงมาตั้งแต่ตอนเข้ามา Brown แล้ว และยังทำต่อไป
แต่ฉันสนใจการเรียนรู้อยู่เสมอ และเข้าใจว่าการโกงคือวิธีหลีกเลี่ยงการเรียนรู้ ทำไมถึงต้องปล่อยให้ทรัพยากรการเรียนรู้อันน่าทึ่งที่สถานที่อย่าง Brown มอบให้สูญเปล่า ไม่ว่าจะเป็นคณาจารย์ ผู้ช่วยสอน การบรรยาย ห้องปฏิบัติการ ห้องสมุด สตูดิโอ พื้นที่ฝึกซ้อม วิทยากรที่น่าสนใจ งานศิลปะและวัฒนธรรม สิ่งอำนวยความสะดวกด้านคอมพิวติ้ง และเมกเกอร์สเปซ?
ข้อสอบบอกให้รู้ถึงข้อเท็จจริงนั้น
มี ออราเคิล อยู่ ไม่ว่าจะในรูปของตำราเรียน, LLM, อินเทอร์เน็ต หรือทั้งหมดนั้น
การกระทำแบบไหนคือการข้ามการศึกษา? การค้นหาคำตอบ หรือการไม่ค้นหาคำตอบ?
ครูควรเลิกทำจริง ๆ การสร้างตัวชี้วัดที่ติดตามว่าใครหลอกลวงและโกหกได้เก่งแค่ไหน แล้วบังคับให้คุณต้องหลอกลวงและโกหกด้วย เพราะในทางปฏิบัติทุกคนก็ทำกันเพื่อให้ได้งานนั้น เป็นเรื่องทำลายล้างเกินไป