- Magistral คือโมเดล reasoning รุ่นแรกที่ Mistral AI เปิดตัว โดยเน้น ความเชี่ยวชาญเฉพาะโดเมน, ความโปร่งใส, และการให้เหตุผลหลายภาษา
- เปิดตัว 2 รุ่นคือ Magistral Small (24B พารามิเตอร์) แบบโอเพนซอร์ส และ Magistral Medium เวอร์ชันเอนเทอร์ไพรส์สำหรับองค์กร
- ใช้การให้เหตุผลหลายภาษาบนพื้นฐาน Chain of Thought และแสดงกระบวนการตรรกะแบบเป็นขั้นตอนอย่างโปร่งใสในภาษาของผู้ใช้
- บน AIME2024 ทำผลงานได้ที่ Magistral Medium 73.6% (สูงสุด 90%) และ Small 70.7% (สูงสุด 83.3%)
- รองรับ การไล่เหตุผลแบบแม่นยำทีละขั้น และ ความเร็วตอบสนองเร็วขึ้น 10 เท่า สำหรับหลายภาษาและหลายอุตสาหกรรม เช่น กฎหมาย การเงิน เฮลท์แคร์, data engineering, software development และคอนเทนต์เชิงสร้างสรรค์
Magistral — Mistral AI เปิดตัวโมเดล reasoning รุ่นแรก
- Magistral เป็นโมเดล reasoning ที่มุ่งเน้น ความสามารถในการแก้ปัญหาในโลกจริง และ การปรับปรุงจากฟีดแบ็ก
- เปิดตัวแบบคู่ขนาน โดย Magistral Small เป็นเวอร์ชันโอเพนซอร์ส 24B พารามิเตอร์ และ Magistral Medium เป็นเวอร์ชันเอนเทอร์ไพรส์ที่ทรงพลังกว่า
- ตัวชี้วัดประสิทธิภาพ:
- Magistral Medium: AIME2024 73.6%, และทำได้ 90% ตามเกณฑ์ majority vote
- Magistral Small: 70.7% และ 83.3% ตามลำดับ
- ใช้การให้เหตุผลแบบ Chain of Thought บนพื้นฐานภาษาและอักษรทั่วโลก ทำให้สามารถลำดับความคิดได้ในระดับภาษาแม่
- เหมาะกับงานหลากหลาย เช่น การคำนวณเชิงโครงสร้าง, programming logic, decision tree, และระบบ rule-based
- ฟีเจอร์ Think mode และ Flash Answers ของ Le Chat ช่วยเพิ่มความเร็วตอบสนองได้ 10 เท่าเมื่อเทียบกับคู่แข่ง
- ในงานวิจัยอย่างเป็นทางการมีการประเมินครอบคลุม อัลกอริทึม, โครงสร้างพื้นฐานการฝึก, เทคนิค reinforcement learning, และอินไซต์จากการฝึก
รายละเอียดของโมเดลและเทคโนโลยี
- กระบวนการให้เหตุผลที่โปร่งใส:
- Magistral ถูกปรับแต่งมาสำหรับ ตรรกะหลายขั้นตอน ทำให้ผู้ใช้สามารถ ดูและติดตามกระบวนการให้เหตุผลในภาษาของตนเอง ได้
- แตกต่างจากโมเดลทั่วไปด้วยการเสริม ความสามารถในการตีความ และการตรวจสอบความถูกต้อง
- ตั้งเป้าอัปเดตโมเดลอย่างต่อเนื่องและปรับปรุงอย่างรวดเร็ว
- การให้เหตุผลหลายภาษา: มีความแม่นยำสูงและคงตรรกะได้ดีในภาษาอังกฤษ ฝรั่งเศส สเปน เยอรมัน อิตาลี อาหรับ รัสเซีย จีน และภาษาอื่น ๆ
- ความเร็วในการตอบสนอง:
- Magistral Medium รองรับ การให้เหตุผลและฟีดแบ็กแบบเรียลไทม์ ผ่านฟีเจอร์ Flash Answers ของ Le Chat ด้วย ความเร็วประมวลผลโทเคนสูงกว่าคู่แข่ง 10 เท่า
- แสดงให้เห็นถึง ความโดดเด่นด้านความเร็ว เมื่อเทียบกับโมเดลคู่แข่งหลักอย่าง ChatGPT
โอเพนซอร์สและการมีส่วนร่วมของชุมชน
- Magistral Small เปิดเผยภายใต้ Apache 2.0 license
- ผู้ใช้สามารถ วิเคราะห์ แก้ไข และประกอบโครงสร้างกับวิธีการให้เหตุผลใหม่ ได้ด้วยตนเอง
- โมเดลโอเพนซอร์สก่อนหน้านี้ถูกนำไปใช้ใน โครงการวิจัยเชิงนวัตกรรม เช่น ether0 และ DeepHermes 3
กรณีการใช้งานที่ครอบคลุมกว้าง
- Magistral ถูกปรับให้เหมาะกับงานที่ การให้เหตุผลแบบละเอียดทีละขั้น และ ความโปร่งใส มีความสำคัญ เช่น กฎหมาย การเงิน การพัฒนาซอฟต์แวร์ และการเล่าเรื่อง
-
กลยุทธ์และการดำเนินงานทางธุรกิจ
- สามารถทำงานอย่าง การวางแผนเชิงกลยุทธ์, การประเมินความเสี่ยง, การตัดสินใจบนพื้นฐานข้อมูล, และ การคำนวณคำตอบที่เหมาะสมที่สุด ภายใต้ข้อจำกัดที่ซับซ้อน
-
อุตสาหกรรมกำกับดูแลและภาครัฐ
- ผู้เชี่ยวชาญด้านกฎหมาย การเงิน เฮลท์แคร์ และภาครัฐ สามารถ ติดตามเส้นทางการให้เหตุผลเชิงตรรกะ และ สร้างความสามารถในการตรวจสอบย้อนหลัง ได้
- ช่วยรองรับ ความสามารถในการตรวจสอบผลลัพธ์และการปฏิบัติตามข้อกำหนด
-
งานด้านระบบ ซอฟต์แวร์ และ data engineering
- ปรับปรุงคุณภาพการสนับสนุนในงาน programming, การออกแบบโปรเจกต์, backend architecture, และ data engineering เมื่อเทียบกับ LLM ที่ไม่เน้น reasoning
- มีประสิทธิภาพกับ งานหลายขั้นตอน เช่น การเชื่อมต่อเครื่องมือภายนอกและ API
-
การสร้างคอนเทนต์และการสื่อสาร
- Magistral ให้ผลลัพธ์ที่ยอดเยี่ยมในด้าน การเขียนเชิงสร้างสรรค์และการเล่าเรื่อง
- ไม่เพียงสร้างข้อความที่สอดคล้องกัน แต่ยัง สร้างไอเดียที่แปลกใหม่และชาญฉลาด ได้ด้วย
วิธีใช้งานและช่องทางการให้บริการ
- รุ่น Small สามารถ ดาวน์โหลดแล้วนำไป deploy เองได้
- รุ่น Medium พร้อมใช้งานทันทีบน Le Chat (เว็บ), API, และ Amazon SageMaker
- จะรองรับเพิ่มเติมบน IBM WatsonX, Azure AI และ Google Cloud Marketplace ในเร็ว ๆ นี้
- การติดตั้งแบบปรับแต่งสำหรับองค์กรและแบบ on-premises ต้องติดต่อแยกต่างหาก
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ollama run hf.co/unsloth/Magistral-Small-2506-GGUF:UD-Q4_K_XLและสำหรับ llama.cpp อยากย้ำว่าควรใส่ออปชันอย่าง--jinja,--temp 0.7,--top-p 0.95ด้วย แนะนำให้เพิ่ม context length ของ Ollama เป็น 8192 ขึ้นไป และดูคำแนะนำเพิ่มเติมได้จากเอกสารทางการ