-
ผลกระทบของความรู้เชิงกระบวนการต่อการให้เหตุผลของโมเดลภาษาขนาดใหญ่
-
ความสามารถและข้อจำกัดของโมเดลภาษาขนาดใหญ่ (LLM) ได้รับการศึกษาอย่างละเอียดในช่วงไม่กี่ปีที่ผ่านมา แม้ LLM จะแสดงความสามารถในการแก้ปัญหา แต่เมื่อเทียบกับมนุษย์ยังมีช่องว่างด้านการให้เหตุผล ซึ่งทำให้เกิดข้อสงสัยต่อความแข็งแกร่งของกลยุทธ์การทำให้เป็นทั่วไป
-
เนื่องจากข้อมูลที่ใช้ในการออกแบบ LLM มีปริมาณมหาศาล วิธีวัดการทำให้เป็นทั่วไปแบบดั้งเดิมอย่างการแยกชุดฝึก-ชุดทดสอบจึงทำได้ยาก เพื่อก้าวข้ามข้อจำกัดนี้ จึงมีการตรวจสอบกลยุทธ์การทำให้เป็นทั่วไปที่ LLM ใช้เมื่อทำงานด้านการให้เหตุผลจากข้อมูลพรีเทรน
-
โดยใช้โมเดลสองขนาด (7B และ 35B) และโทเค็นพรีเทรน 2.5B มีการระบุเอกสารที่ส่งผลต่อผลลัพธ์ของโมเดลสำหรับงานการให้เหตุผลทางคณิตศาสตร์อย่างง่าย 3 งาน และเปรียบเทียบกับข้อมูลที่มีอิทธิพลต่อการตอบคำถามเชิงข้อเท็จจริง
-
โมเดลใช้ชุดข้อมูลที่แยกจากกันเป็นหลักสำหรับคำถามเชิงข้อเท็จจริงแต่ละข้อ แต่ในคำถามการให้เหตุผลที่ต่างกันภายในงานเดียวกัน เอกสารมักมีอิทธิพลคล้ายกัน ซึ่งบ่งชี้ถึงการมีอยู่ของความรู้เชิงกระบวนการ
-
คำตอบของคำถามเชิงข้อเท็จจริงมักปรากฏอยู่บ่อยครั้งในข้อมูลที่มีอิทธิพลสูงสุด แต่สำหรับคำถามการให้เหตุผล ไม่พบว่าคำตอบหรือคำตอบของขั้นตอนการให้เหตุผลระหว่างทางมีอิทธิพลสูง
-
การวิเคราะห์เชิงคุณภาพของเอกสารอันดับต้น ๆ สำหรับคำถามการให้เหตุผลยืนยันว่า เอกสารที่มีอิทธิพลมักมีความรู้เชิงกระบวนการที่แสดงวิธีแก้ปัญหาผ่านสูตรหรือโค้ดรวมอยู่ด้วย
-
ข้อค้นพบเหล่านี้ชี้ให้เห็นว่าแนวทางการให้เหตุผลที่โมเดลใช้นั้นไม่ใช่เพียงการดึงข้อมูล แต่เป็นกลยุทธ์ที่ทำให้เป็นทั่วไปได้ ซึ่งสังเคราะห์ความรู้เชิงกระบวนการจากเอกสารที่ทำการให้เหตุผลในรูปแบบคล้ายกัน
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
มีการชี้ว่า LLM ไม่สามารถหา "ตัวอย่างของทุกปัญหา" ได้จากข้อมูลฝึกทั้งหมด และยังมีตัวอย่างการดึงข้อเท็จจริงกลับมาใช้ที่จำเป็นต่อการค้นหาแบบ information retrieval ไม่เพียงพอ
ชี้ว่ามนุษย์ต้องแก้ปัญหาเป็นลำดับขั้นก่อนที่โครงข่ายประสาทจะเลียนแบบสิ่งนั้นได้
กล่าวถึงว่า LLM แสดงความสามารถในการแก้ปัญหาได้ แต่เมื่อเทียบกับมนุษย์แล้วยังมีช่องว่างด้านการให้เหตุผลอยู่
อธิบายว่าเมื่อโมเดลภาษาตอบคำถามเชิงให้เหตุผล มักเป็นการดึงข้อมูลจากชุดเอกสารที่จำกัด
อ้างว่าการฝึกล่วงหน้าของ Google มีบทบาทสำคัญในการออกแบบชิป
ตั้งคำถามว่าทำไมภาพที่สร้างขึ้นถึงดูเหมือนฝันร้าย และอ้างว่าจำเป็นต้องมีข้อมูลฝึกด้านการให้เหตุผลมากขึ้น
อธิบายผ่านการเปรียบเทียบ AlphaGo กับ AlphaZero ว่าความรู้เชิงกระบวนการของมนุษย์ช่วยการฝึก ML ได้ แต่ก็อาจมีข้อจำกัด
เสนอว่าการฝึกด้วยโน้ตของนักเรียน ข้อสอบ รีวิวหนังสือ ฯลฯ อาจทำให้ LLM ดีขึ้น และบอกว่านั่นน่าสนใจมาก