1 คะแนน โดย recast7838 3 시간 전 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

สตาร์ตอัป AI จากจีน MiniMax เปิดตัว 'M3' โมเดลภาษาขนาดใหญ่แบบมัลติโหมดที่ใช้น้ำหนักแบบเปิด ซึ่งทำผลงานเหนือกว่า GPT-5.5 และ Gemini 3.1 Pro ด้วยต้นทุนที่ต่ำกว่ามาก เพียง 5~10% เมื่อเทียบกับโมเดลเชิงพาณิชย์จากสหรัฐฯ ที่มีอยู่เดิม


บทแปลฉบับเต็ม

MiniMax สตาร์ตอัป AI จากจีน ได้เปิดตัว 'M3' โมเดลภาษาขนาดใหญ่แบบมัลติโหมดที่มีความสามารถด้านการเขียนโค้ดระดับ frontier และมีหน้าต่างคอนเท็กซ์ 1 ล้านโทเค็น สร้างแรงสั่นสะเทือนครั้งใหญ่ต่อ ตลาด AI สำหรับองค์กรทั่วโลก โดยภายใน 10 วันข้างหน้า M3 จะถูกเผยแพร่ผ่าน Hugging Face และ GitHub ภายใต้ไลเซนส์โอเพนซอร์สแบบ 'Open Weights' เพื่อให้องค์กรสามารถดาวน์โหลดไปใช้บนเซิร์ฟเวอร์ภายในและปรับแต่งเพิ่มประสิทธิภาพได้เอง ปัจจุบันมีราคาเปิดตัวพิเศษที่ 0.3 ดอลลาร์ต่อ 1 ล้านโทเค็นขาเข้า และ 1.20 ดอลลาร์ต่อโทเค็นขาออก (รวมต้นทุน 1.50 ดอลลาร์ {b:4}) และแม้จะกลับไปใช้ราคาปกติ ก็ยังมีต้นทุนเพียง 8~20% {p:14} ของโมเดลเชิงพาณิชย์หลักจากสหรัฐฯ เท่านั้น จึงเหนือกว่า Google, OpenAI และ Anthropic อย่างชัดเจนในด้านต้นทุน

หัวใจสำคัญที่ทำให้ M3 ลดต้นทุนได้อย่างมาก มาจากสถาปัตยกรรม 'MiniMax Sparse Attention (MSA)' ที่แก้ปัญหาต้นทุนการคำนวณของทรานส์ฟอร์เมอร์แบบเดิมซึ่งพุ่งขึ้นตามกำลังสอง เทคโนโลยี MSA แบ่งข้อมูลออกเป็นบล็อกความละเอียดสูงและจับคู่เฉพาะคิวรีที่จำเป็นแบบไดนามิก เพื่อเพิ่มประสิทธิภาพฮาร์ดแวร์ให้สูงสุด ทำให้เมื่อประมวลผล 1 ล้านโทเค็น ความต้องการการคำนวณลดลงเหลือเพียง 1 ใน 20 ของเดิม {p:5} และเพิ่มความเร็วในการถอดรหัสได้ถึง 15 เท่า จากนวัตกรรมเชิงโครงสร้างนี้ M3 ทำคะแนน 59.0% {p:59} ใน SWE-Bench Pro ซึ่งใช้ประเมินความสามารถด้านวิศวกรรมซอฟต์แวร์อัตโนมัติ และแซงหน้าโมเดลปิดอย่าง GPT-5.5 และ Gemini 3.1 Pro ได้สำเร็จ อีกทั้งยังทำผลงานด้านการท่องเว็บและการค้นหาข้อมูลได้โดดเด่น (BrowseComp 83.5% {p:84}) จนทำลายสถิติเดิมของ Claude Opus 4.7

เมื่อเทียบกับ Claude Opus 4.8 ซึ่งเป็นโมเดลปิดประสิทธิภาพสูงสุดที่เพิ่งเปิดตัวเมื่อไม่นานนี้ (SWE-Bench Pro 69.2% {b:59,69}) M3 อาจยังมีช่องว่างด้านประสิทธิภาพอยู่บ้างในงานให้เหตุผลระดับยากมาก แต่ M3 มอบจุดอ้างอิงที่ทรงพลังสำหรับระบบอัตโนมัติแบบโลคัลโดยไม่ต้องเสียค่า API subscription มหาศาล นอกจากนี้ MiniMax ยังเปิดตัวกลุ่มผลิตภัณฑ์เอเจนต์ 'MiniMax Code' ที่ขับเคลื่อนด้วย M3 ซึ่งสามารถเขียนโค้ดเอง รันลูปตรวจสอบอย่างอิสระ และแก้ไขตัวเองได้ พร้อมใช้โมเดลค่าบริการเชิงรุกที่เริ่มต้นเพียง 20 ดอลลาร์ต่อเดือน (Plus) ในสภาพแวดล้อมองค์กรที่ต้องการความเป็นส่วนตัวของข้อมูลและการปฏิบัติตามข้อกำหนดอย่างเข้มงวด การเปิดให้น้ำหนักโมเดลของ M3 ใช้งานได้จึงถูกคาดว่าจะช่วยตัดความเสี่ยงจากการรั่วไหลของข้อมูลบนคลาวด์ได้ตั้งแต่ต้นทาง และมอบความคุ้มค่าสูงสุดสำหรับการทำให้กลายเป็นทรัพย์สินหลักเฉพาะขององค์กร

ความเห็นสั้น ๆ ของผู้เขียน

น่าจะต้องลองใช้บน ollama cloud ดูครับ

2 ความคิดเห็น

 
b8g6pn 3 시간 전

เกณฑ์ที่ว่าโมเดลสู้กันได้อาจจะพูดเกินจริงไปหน่อย แต่ราคานี่ช็อกจริงๆ

 
recast7838 3 시간 전

ตอนนี้กำลังใช้อยู่ แต่ไม่มีปัญหาแบบโมเดลจีนตัวอื่นที่พอเขียนไปแล้วจู่ๆ ก็มีภาษาจีนโผล่ออกมา แล้วก็ดูเหมือนว่าจะทำ tool call ได้ดีด้วย