-
ภาพรวมงานวิจัย
- โมเดล LIMO นำเสนอการค้นพบที่ช่วยให้เข้าใจใหม่ว่า ความสามารถในการให้เหตุผลที่ซับซ้อนเกิดขึ้นได้อย่างไรในโมเดลภาษาขนาดใหญ่
- แตกต่างจากความเชื่อเดิม การให้เหตุผลทางคณิตศาสตร์ที่ซับซ้อนสามารถชักนำได้อย่างมีประสิทธิภาพแม้ใช้ตัวอย่างจำนวนน้อย
- LIMO ทำคะแนนความแม่นยำได้ 57.1% บน AIME และ 94.8% บน MATH โดยใช้ตัวอย่างฝึกเพียง 817 ตัวอย่าง
- นี่เป็นผลลัพธ์ที่ดีขึ้นอย่างมากเมื่อเทียบกับ 6.5% และ 59.2% ของโมเดลแบบ SFT เดิม และใช้ข้อมูลฝึกเพียง 1% ของแนวทางก่อนหน้า
-
ประสิทธิภาพของ LIMO
- LIMO แสดงการปรับปรุงประสิทธิภาพเชิงสัมบูรณ์ 40.5% บนเบนช์มาร์กที่หลากหลาย 10 ชุด และเหนือกว่าโมเดลที่ฝึกด้วยข้อมูลมากกว่าถึง 100 เท่า
- สิ่งนี้ท้าทายความเชื่อเดิมที่ว่า SFT นำไปสู่การท่องจำมากกว่าการทำให้ทั่วไปได้
-
สมมติฐาน LIMO
- สมมติฐาน LIMO เสนอว่า หากความรู้เฉพาะโดเมนถูกเข้ารหัสไว้อย่างครบถ้วนในโมเดลพื้นฐานระหว่างการพรีเทรน ความสามารถในการให้เหตุผลที่ซับซ้อนก็อาจเกิดขึ้นได้แม้มีการสาธิตเพียงเล็กน้อย
- เกณฑ์ที่ทำให้เกิดการให้เหตุผลที่ซับซ้อนถูกกำหนดโดยปัจจัยหลัก 2 ประการ:
- ความสมบูรณ์ของฐานความรู้ที่ถูกเข้ารหัสไว้ในโมเดลระหว่างการพรีเทรน
- ประสิทธิผลของตัวอย่างหลังการฝึกในฐานะ "เทมเพลตการรับรู้" ที่แสดงให้โมเดลเห็นว่าจะใช้ฐานความรู้อย่างไรเพื่อแก้งานการให้เหตุผลที่ซับซ้อน
-
การเปิดเป็นโอเพนซอร์ส
- เพื่อส่งเสริมความสามารถในการทำซ้ำได้และการวิจัยในอนาคตเกี่ยวกับการให้เหตุผลอย่างมีประสิทธิภาพด้านข้อมูล LIMO ถูกเผยแพร่ในรูปแบบชุดโอเพนซอร์สที่ครอบคลุม
ยังไม่มีความคิดเห็น