การปรับจูนละเอียด Mistral 7B สำหรับการดราฟต์ Magic: The Gathering
(generallyintelligent.substack.com)สรุป: สำรวจเทคนิคการปรับจูนละเอียดของปัญญาประดิษฐ์
- ประสิทธิผลและความยากของเทคนิคการปรับจูนละเอียด
- การปรับจูนละเอียดช่วยเสริมความสามารถของ GPT-4 และสัญญาว่าจะให้ทั้งความเร็วและความคุ้มค่าด้านต้นทุน
- เพื่อแก้ปัญหาการขาดข้อมูลว่าการปรับจูนละเอียดมีประสิทธิภาพมากเพียงใดและยากแค่ไหน จึงได้ทำการทดลองด้วยตนเอง
การเลือกปัญหา
- ทดสอบความสามารถในการให้เหตุผลของโมเดลผ่านการดราฟต์ Magic: The Gathering (MTG)
- MTG เป็นเกมการ์ดเชิงกลยุทธ์ โดยการดราฟต์คือการเลือกการ์ดจากพูลการ์ดแบบสุ่มเพื่อประกอบเป็นเด็ค
- การดราฟต์เป็นงานที่ซับซ้อนและเหมาะสำหรับการทดสอบ เพราะต้องอาศัยการให้เหตุผลและความเข้าใจข้อมูลใหม่
- ใช้ข้อมูลประวัติขนาดใหญ่จากบริการชื่อ 17lands และใช้การเลือกดราฟต์ของผู้เล่นระดับท็อปเป็น "ground truth"
ผลลัพธ์และสรุป
- ประสิทธิภาพของโมเดล 7B ที่ผ่านการปรับจูนละเอียด
- โมเดล 7B ที่ปรับจูนละเอียดแล้วมีประสิทธิภาพเหนือกว่า GPT-4 และเข้าใกล้ระดับมนุษย์
- การปรับจูนละเอียด GPT-3.5 อาจให้ผลลัพธ์ที่ดีกว่า แต่มีต้นทุนสูงมาก
- การปรับจูนละเอียดยังคงเป็นกระบวนการเชิงทดลอง โดยเฉพาะการทำ prompt engineering ที่ใช้เวลามาก
- หลังจากปรับจูนละเอียดกับชุดการ์ดใหม่แล้ว โมเดลยังแสดงความสามารถในการ generalize ไปยังชุดการ์ดที่ไม่เคยเห็นได้
รายงานภาคสนาม: วิธีการและกระบวนการเรียนรู้
- การสร้างข้อมูล
- แปลงข้อมูลรูปแบบไฟล์ CSV จาก 17lands ให้อยู่ในรูปแบบข้อความที่เหมาะกับการปรับจูนละเอียด
- การจัดรูปแบบข้อมูลเป็นกระบวนการที่ท้าทายและต้องอาศัยการทดลอง
- การรันการปรับจูนละเอียด
- เนื่องจากปัญหาการเข้าถึง GPU จึงเช่า GPU รายชั่วโมงจาก Runpod
- ใช้ axolotl เพื่อให้การเพิ่มประสิทธิภาพการปรับจูนละเอียดทำได้ง่ายขึ้น
- การประเมินผล
- การกำหนดเกณฑ์ประเมินก่อนเริ่มการทดลองเป็นสิ่งสำคัญ
- การตั้งเกณฑ์ประเมินสำหรับ language model อาจเป็นเรื่องยาก
บทเรียนสำคัญ
- ผลของการปรับจูนละเอียด
- การปรับจูนละเอียดกับข้อมูลใหม่ให้ความแม่นยำและความคุ้มค่าด้านต้นทุนเหนือกว่า GPT-4
- การปรับจูนละเอียดต้องอาศัยกระบวนการเชิงทดลองเพื่อให้ทำได้อย่างถูกต้อง และเป็นทักษะเฉพาะทางที่เรียนรู้ยากกว่า prompt engineering
ข้อมูลเพิ่มเติมเกี่ยวกับ Magic
- ประสิทธิภาพของบอตดราฟต์ AI ที่ปรับจูนละเอียดแล้ว
- พัฒนาแอปช่วยดราฟต์โดยใช้โมเดลดราฟต์ที่เชื่อมต่อกับล็อกของ Magic Arena
- โมเดลที่ปรับจูนละเอียดแล้วเป็นผู้สร้างตัวเลือก ขณะที่ GPT-4 ทำหน้าที่ให้คำอธิบาย
- มีการจำลองบอตดราฟต์ AI หลายตัว และพบว่ามีประสิทธิภาพใกล้เคียงกับผู้ดราฟต์ที่เป็นมนุษย์
ความเห็นของ GN⁺
ประเด็นสำคัญที่สุดของบทความนี้คือ เทคโนโลยีการปรับจูนละเอียดมีศักยภาพที่จะทำผลงานเหนือกว่า large language model ที่มีอยู่เดิม (เช่น GPT-4) และช่วยยกระดับทั้งความเข้าใจและประสิทธิภาพของปัญญาประดิษฐ์สำหรับงานเฉพาะทางได้อย่างมาก เหตุผลที่บทความนี้น่าสนใจคือมันแสดงให้เห็นทั้งกระบวนการปรับจูนละเอียดอย่างเป็นรูปธรรมและผลลัพธ์จากการใช้งานจริง ซึ่งจะช่วยให้แม้แต่วิศวกรซอฟต์แวร์ระดับเริ่มต้นก็เข้าใจแนวโน้มการพัฒนาเทคโนโลยี AI และวิธีนำไปประยุกต์ใช้ได้ดีขึ้น
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News