4 คะแนน โดย xguru 2024-08-11 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Qwen2-Math ที่สร้างบนพื้นฐานของ Qwen2 LLM มีความสามารถด้านคณิตศาสตร์เหนือกว่าอย่างมากทั้งโมเดลโอเพนซอร์สและโมเดลปิด (เช่น GPT-4o)
    • ซีรีส์โมเดลภาษาขนาดใหญ่ที่เชี่ยวชาญด้านคณิตศาสตร์ ซึ่งรวมถึง Qwen2-Math และ Qwen2-Math-Instruct-1.5B/7B/72B
  • พบว่า Qwen2-Math-72B-Instruct ซึ่งเป็นโมเดลขนาดใหญ่ที่สุด มีประสิทธิภาพเหนือกว่าโมเดลล่าสุดอย่าง GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro และ Llama-3.1-405B
  • ขณะนี้โมเดลรองรับเฉพาะภาษาอังกฤษ และมีแผนจะเปิดตัวโมเดลคณิตศาสตร์แบบสองภาษา (อังกฤษและจีน) ในเร็ว ๆ นี้