Alibaba เปิดตัวโมเดล Qwen2-Math
(qwenlm.github.io)- Qwen2-Math ที่สร้างบนพื้นฐานของ Qwen2 LLM มีความสามารถด้านคณิตศาสตร์เหนือกว่าอย่างมากทั้งโมเดลโอเพนซอร์สและโมเดลปิด (เช่น GPT-4o)
- ซีรีส์โมเดลภาษาขนาดใหญ่ที่เชี่ยวชาญด้านคณิตศาสตร์ ซึ่งรวมถึง Qwen2-Math และ Qwen2-Math-Instruct-1.5B/7B/72B
- พบว่า Qwen2-Math-72B-Instruct ซึ่งเป็นโมเดลขนาดใหญ่ที่สุด มีประสิทธิภาพเหนือกว่าโมเดลล่าสุดอย่าง GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro และ Llama-3.1-405B
- ขณะนี้โมเดลรองรับเฉพาะภาษาอังกฤษ และมีแผนจะเปิดตัวโมเดลคณิตศาสตร์แบบสองภาษา (อังกฤษและจีน) ในเร็ว ๆ นี้
1 ความคิดเห็น
Alibaba เปิดตัวโมเดล Qwen 2
Qwen1.5-110B : โมเดล 100B+ ตัวแรกของซีรีส์โอเพนซอร์ส LLM Qwen1.5 ของ Alibaba
Alibaba เปิดตัวโมเดล AI โอเพนซอร์ส QWEN