สรุปประเด็นสำคัญของโมเดล MiniMax M2
- ภาพรวมโมเดล: โมเดล M2 ของ MiniMax จากจีน (พารามิเตอร์ 230 พันล้าน, โครงสร้างการเปิดใช้งานแบบเลือกเฉพาะ) ให้ประสิทธิภาพเหนือกว่า Claude Opus 4.1 ขณะที่มีต้นทุนเพียง 8% ของ Claude Sonnet ($0.30/1 ล้านโทเค็นอินพุต) และเร็วกว่า 2 เท่า
- นวัตกรรมด้านประสิทธิภาพ: ใช้โครงสร้าง MoE เพื่อเปิดใช้งานเฉพาะพารามิเตอร์ที่จำเป็น ลดต้นทุนได้ 92% และถูกพัฒนาโดยเน้นการใช้งานจริงเป็นหลัก (แก้งานโค้ดที่ซับซ้อนและงานเอเจนต์)
- ประสิทธิภาพด้านเบนช์มาร์ก: ได้ 61 คะแนนใน Intelligence Index (อันดับ 1 ในโอเพนซอร์ส), 69.4 คะแนนใน SWE-bench, 46.3 คะแนนใน Terminal-Bench, และ 44 คะแนนใน BrowseComp ซึ่งใกล้เคียงหรือเหนือกว่าโมเดลของ Claude และ Gemini
- การใช้งานจริง: ทำได้ดีในเวิร์กโฟลว์ด้านคณิตศาสตร์ การเขียนโค้ด และเอเจนต์ (การวิเคราะห์ข้อมูล การตรวจสอบประเด็น และการเขียนโปรแกรม) โดยผ่านการทดสอบจากนักพัฒนาและพิสูจน์ความสามารถในการแก้ไขข้อผิดพลาด
- วิธีใช้งาน: ใช้งานฟรีผ่านเว็บบริการ (https://agent.minimax.io/), ผสานรวมผ่าน API และแนะนำให้ดาวน์โหลดโอเพนซอร์สจาก Hugging Face (สัญญาอนุญาต MIT โดยต้องตั้งค่าบางอย่างเฉพาะ)
- ความหมาย: การเติบโตของโมเดลโอเพนซอร์สกำลังทำให้การแข่งขันด้าน AI เปลี่ยนไปสู่การเน้นประสิทธิภาพและการใช้งานจริง
3 ความคิดเห็น
ถ้าเป็น 23B (แต่ในเนื้อหาคือ 230B) ก็น่าจะเอาลง mac mini ได้ เลยดีใจเก้ออยู่แวบหนึ่ง..
ผมก็เหมือนกัน.. พอได้ยินว่า 23B ระดับพอๆ กับ Claude 4.1 Opus เลยเข้าไปดูใน Hugging Face แต่พอเห็นว่าเป็น 230B ก็ผิดหวัง.....
ไม่ใช่ 2.3 หมื่นล้าน แต่เป็น 2.3 แสนล้านพารามิเตอร์ครับ