1 คะแนน โดย GN⁺ 2024-12-03 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ผลกระทบของความรู้เชิงกระบวนการต่อการให้เหตุผลของโมเดลภาษาขนาดใหญ่

  • ความสามารถและข้อจำกัดของโมเดลภาษาขนาดใหญ่ (LLM) ได้รับการศึกษาอย่างละเอียดในช่วงไม่กี่ปีที่ผ่านมา แม้ LLM จะแสดงความสามารถในการแก้ปัญหา แต่เมื่อเทียบกับมนุษย์ยังมีช่องว่างด้านการให้เหตุผล ซึ่งทำให้เกิดข้อสงสัยต่อความแข็งแกร่งของกลยุทธ์การทำให้เป็นทั่วไป

  • เนื่องจากข้อมูลที่ใช้ในการออกแบบ LLM มีปริมาณมหาศาล วิธีวัดการทำให้เป็นทั่วไปแบบดั้งเดิมอย่างการแยกชุดฝึก-ชุดทดสอบจึงทำได้ยาก เพื่อก้าวข้ามข้อจำกัดนี้ จึงมีการตรวจสอบกลยุทธ์การทำให้เป็นทั่วไปที่ LLM ใช้เมื่อทำงานด้านการให้เหตุผลจากข้อมูลพรีเทรน

  • โดยใช้โมเดลสองขนาด (7B และ 35B) และโทเค็นพรีเทรน 2.5B มีการระบุเอกสารที่ส่งผลต่อผลลัพธ์ของโมเดลสำหรับงานการให้เหตุผลทางคณิตศาสตร์อย่างง่าย 3 งาน และเปรียบเทียบกับข้อมูลที่มีอิทธิพลต่อการตอบคำถามเชิงข้อเท็จจริง

  • โมเดลใช้ชุดข้อมูลที่แยกจากกันเป็นหลักสำหรับคำถามเชิงข้อเท็จจริงแต่ละข้อ แต่ในคำถามการให้เหตุผลที่ต่างกันภายในงานเดียวกัน เอกสารมักมีอิทธิพลคล้ายกัน ซึ่งบ่งชี้ถึงการมีอยู่ของความรู้เชิงกระบวนการ

  • คำตอบของคำถามเชิงข้อเท็จจริงมักปรากฏอยู่บ่อยครั้งในข้อมูลที่มีอิทธิพลสูงสุด แต่สำหรับคำถามการให้เหตุผล ไม่พบว่าคำตอบหรือคำตอบของขั้นตอนการให้เหตุผลระหว่างทางมีอิทธิพลสูง

  • การวิเคราะห์เชิงคุณภาพของเอกสารอันดับต้น ๆ สำหรับคำถามการให้เหตุผลยืนยันว่า เอกสารที่มีอิทธิพลมักมีความรู้เชิงกระบวนการที่แสดงวิธีแก้ปัญหาผ่านสูตรหรือโค้ดรวมอยู่ด้วย

  • ข้อค้นพบเหล่านี้ชี้ให้เห็นว่าแนวทางการให้เหตุผลที่โมเดลใช้นั้นไม่ใช่เพียงการดึงข้อมูล แต่เป็นกลยุทธ์ที่ทำให้เป็นทั่วไปได้ ซึ่งสังเคราะห์ความรู้เชิงกระบวนการจากเอกสารที่ทำการให้เหตุผลในรูปแบบคล้ายกัน

1 ความคิดเห็น

 
GN⁺ 2024-12-03
ความคิดเห็นจาก Hacker News
  • มีการชี้ว่า LLM ไม่สามารถหา "ตัวอย่างของทุกปัญหา" ได้จากข้อมูลฝึกทั้งหมด และยังมีตัวอย่างการดึงข้อเท็จจริงกลับมาใช้ที่จำเป็นต่อการค้นหาแบบ information retrieval ไม่เพียงพอ

    • สิ่งนี้ไม่ได้ขัดกับบทความวิจัย LLM ของ Apple และเชื่อว่า LLM ทำได้เพียงดัดแปลงจากตัวอย่างเดิมเล็กน้อย
    • แสดงความไม่พอใจกับการใช้คำว่า "การให้เหตุผล" โดยอ้างว่าเป็นคำที่บริษัท LLM สร้างขึ้นเพื่อทำให้เทคโนโลยีดูมีอารมณ์ร่วม
    • เน้นว่าความสามารถในการสั่งเครื่องด้วยภาษาธรรมชาติเป็นความก้าวหน้าครั้งใหญ่
  • ชี้ว่ามนุษย์ต้องแก้ปัญหาเป็นลำดับขั้นก่อนที่โครงข่ายประสาทจะเลียนแบบสิ่งนั้นได้

    • อธิบายประโยชน์ที่ไม่คาดคิดของการฝึกด้วยโค้ด
  • กล่าวถึงว่า LLM แสดงความสามารถในการแก้ปัญหาได้ แต่เมื่อเทียบกับมนุษย์แล้วยังมีช่องว่างด้านการให้เหตุผลอยู่

    • ชี้ว่ามีผู้ใช้จำนวนมากที่มอง LLM เป็นเพียงตัวทำนายโทเค็นถัดไป
  • อธิบายว่าเมื่อโมเดลภาษาตอบคำถามเชิงให้เหตุผล มักเป็นการดึงข้อมูลจากชุดเอกสารที่จำกัด

    • ในทางกลับกัน เสนอว่าการดึงข้อมูลจากเอกสารหลากหลายที่เกี่ยวข้องกับคำถามในเชิงนามธรรมควรเป็นกลยุทธ์การให้เหตุผลที่ทั่วไปกว่า
  • อ้างว่าการฝึกล่วงหน้าของ Google มีบทบาทสำคัญในการออกแบบชิป

    • อธิบายว่าผลลัพธ์จากการลองทำโดยไม่มีการฝึกล่วงหน้าย่อมไม่ถึงระดับเทคโนโลยีปัจจุบันเป็นเรื่องธรรมดา
  • ตั้งคำถามว่าทำไมภาพที่สร้างขึ้นถึงดูเหมือนฝันร้าย และอ้างว่าจำเป็นต้องมีข้อมูลฝึกด้านการให้เหตุผลมากขึ้น

    • กล่าวว่าการพิสูจน์ทางคณิตศาสตร์อาจเป็นผลไม้ที่เด็ดได้ง่ายที่สุดในบรรดาข้อมูลสังเคราะห์ที่ไม่ใช่ข้อมูลสังเคราะห์
  • อธิบายผ่านการเปรียบเทียบ AlphaGo กับ AlphaZero ว่าความรู้เชิงกระบวนการของมนุษย์ช่วยการฝึก ML ได้ แต่ก็อาจมีข้อจำกัด

  • เสนอว่าการฝึกด้วยโน้ตของนักเรียน ข้อสอบ รีวิวหนังสือ ฯลฯ อาจทำให้ LLM ดีขึ้น และบอกว่านั่นน่าสนใจมาก