7 คะแนน โดย xguru 21 일 전 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • เป็น โมเดลออมนิโหมดแบบเนทีฟ ที่รวมการประมวลผลข้อความ ภาพ วิดีโอ และเสียงไว้ใน สถาปัตยกรรมเดียว โดย ออกแบบมาเฉพาะสำหรับงานเอเจนต์
  • ใช้ไลเซนส์ MIT จึงสามารถแจกจ่ายเชิงพาณิชย์และทำฟाइनจูนได้ทั้งหมด โดยไม่ต้องขออนุญาตเพิ่มเติม
  • ใช้สถาปัตยกรรม Sparse MoE โดยเปิดใช้งานเพียง 15B จากพารามิเตอร์ทั้งหมด 310B เพื่อให้ทำ inference ได้อย่างมีประสิทธิภาพ (เวอร์ชัน Pro คือ 1.02T/42B)
  • ใช้ Hybrid Attention (SWA + GA อัตราส่วน 5:1, หน้าต่าง 128) เพื่อลดปริมาณการจัดเก็บ KV-cache ลงได้ราว 6 เท่า พร้อมรองรับคอนเท็กซ์ได้สูงสุด 1M โทเค็น
  • มาพร้อม vision encoder เฉพาะทาง (ViT 729M พารามิเตอร์, hybrid window attention) และ audio encoder (261M พารามิเตอร์, อิงตาม MiMo-Audio-Tokenizer)
  • มีโมดูล Multi-Token Prediction(MTP) จำนวน 3 เลเยอร์ เพื่อเร่ง inference แบบ speculative decoding และเพิ่มประสิทธิภาพการฝึก RL
  • ฝึกด้วยข้อมูลรวมประมาณ 48T โทเค็น ด้วย FP8 mixed precision และในขั้นตอน post-training ได้ใช้ SFT, เอเจนต์ RL ขนาดใหญ่, Multi-Teacher On-Policy Distillation(MOPD) เพื่อยกระดับประสิทธิภาพบนเบนช์มาร์กด้านเอเจนต์และมัลติโหมด
    • ไปป์ไลน์ 5 ขั้นตอน (พรีเทรนข้อความ → วอร์มอัปโปรเจ็กเตอร์ → พรีเทรนมัลติโหมด → SFT/โพสต์โปรเซสสำหรับเอเจนต์ → RL/MOPD)
  • รองรับ SGLang(FP8 quantization, dp/tp parallel) และ การแจกจ่ายอย่างเป็นทางการบน vLLM
  • มีให้เลือกสองเวอร์ชันคือ Base(256K) และ Full(1M)

2 ความคิดเห็น

 
xguru 21 일 전

อันนี้ VentureBeat ทดสอบแล้วบอกว่าค่อนข้างเหมาะกับ OpenClaw
https://venturebeat.com/ai/…

  • ในเบนช์มาร์ก ClawEval โมเดล Pro ทำสถิติเป็นผู้นำในกลุ่มโอเพนซอร์สด้วย อัตราความสำเร็จ 63.8%
  • เมื่อเทียบกับ Anthropic Claude Opus 4.6, Google Gemini 3.1 Pro และ OpenAI GPT-5.4 สามารถให้ผลลัพธ์เทียบเท่ากันโดยใช้ โทเคนน้อยลง 40~60%
  • MiMo-V2.5 ("Omni") เป็นโมเดลเฉพาะทางแบบมัลติโหมดเนทีฟ ที่ประมวลผลภาพ เสียง และข้อความแบบบูรณาการ
  • MiMo-V2.5-Pro ("Agent") เชี่ยวชาญด้าน "ความสอดคล้องระยะยาว (long-horizon coherence)" และงานวิศวกรรมซอฟต์แวร์ที่ซับซ้อน
  • โมเดล Pro ทำได้ 1581 คะแนน ในเบนช์มาร์ก GDPVal-AA(Elo) สูงกว่า Kimi K2.6 และ GLM 5.1
  • ต่างจากโมเดล "โอเพน" จำนวนมากที่ยังมีนโยบาย "Acceptable Use" แบบจำกัด MiMo-V2.5 เปิดเผยภายใต้ สัญญาอนุญาต MIT
    • ไม่ต้องขออนุมัติ: สามารถเผยแพร่เชิงพาณิชย์ได้โดยไม่ต้องได้รับอนุญาตอย่างชัดแจ้งจาก Xiaomi
    • อิสระในการฝึกต่อ: สามารถไฟน์จูนด้วยข้อมูลของตนเองและเผยแพร่น้ำหนักที่ต่อยอดแล้วได้
    • ใช้งานเชิงพาณิชย์ได้ไม่จำกัด: ไม่มีเพดานรายได้หรือข้อจำกัดจำนวนผู้ใช้แบบที่มักพบในคอมมูนิตีไลเซนส์
  • ผู้นำโครงการ Fuli Luo (อดีตสมาชิกแกนหลักของ DeepSeek)

    "คุณค่าของโมเดลไม่ได้วัดจากอันดับ แต่วัดจากปัญหาที่มันแก้ได้"

 
cosine20 19 일 전

เมื่อคิดถึงธุรกิจหลักของ Xiaomi ก็เป็นไปได้เหมือนกันว่าโมเดลนี้อาจถูกสร้างขึ้นโดยคำนึงถึงเอเจนต์อย่าง OpenClaw และ Hermes ด้วย