- รองรับความยาวคอนเท็กซ์ 128K, รองรับ 8 ภาษา และเพิ่มโมเดล 405B เข้ามา (8B, 70B, 405B)
- โมเดล AI แบบ instruction-tuned โอเพนซอร์สที่ทุกคนสามารถ fine-tune, ปรับแต่ง และนำไป deploy ได้ทุกที่
- โมเดล 405B ที่เปิดตัวใหม่ทำผลงานได้ใกล้เคียงหรือดีกว่า GPT-4o ในหลายเบนช์มาร์ก เช่น MMLU (ทั่วไป), Human Eval (โค้ดดิ้ง), GSM8K (คณิตศาสตร์)
- เป็นโมเดล AI ระดับแนวหน้าทั้งด้านความยืดหยุ่นและความสามารถในการควบคุม
- ช่วยให้ชุมชนสามารถใช้เวิร์กโฟลว์ใหม่ ๆ เช่น การสร้างข้อมูลสังเคราะห์และการกลั่นโมเดล
- ผ่านการฝึกด้วยโทเคนมากกว่า 15 ล้านล้านโทเคน และใช้ GPU H100 มากกว่า 16,000 ตัว
- โมเดล 70B ที่อัปเกรดแล้วเหนือกว่า GPT-3.5 Turbo อย่างชัดเจนในเบนช์มาร์กส่วนใหญ่
3 ความคิดเห็น
ว้าว ถ้าจะรัน 405B นี่ต้องจัดคอนฟิก GPU ยังไงกันนะ
ดูเหมือนว่า 405B จะไม่ได้มีไว้สำหรับการฟাইনจูนหรือการให้บริการโดยตรง ซีอีโอกล่าวถึง distillation หลายครั้ง เลยคิดว่าอาจมีไว้ใช้เป็นโมเดล teacher สำหรับการฟाइनจูนเพื่อยกระดับคุณภาพของโมเดลขนาดเล็ก
ความคิดเห็นจาก Hacker News
โมเดล Llama 3.1 มีประสิทธิภาพดีขึ้น
เปรียบเทียบ GPT-4o กับโมเดล Llama 3.1 405B
สามารถพูดคุยกับโมเดลใหม่ ๆ ได้ที่ Groq.com ด้วยความหน่วงต่ำมาก
หากใช้ฮาร์ดแวร์ที่เหมาะสม ก็สามารถรัน LLM ที่แข่งขันกับ GPT-4o ได้ที่บ้าน
สามารถรันโมเดลแบบโลคัลได้ผ่าน Ollama, Huggingface, Groq เป็นต้น
ลองรันเวอร์ชัน 70B บน Ollama แล้วพบว่าดีมาก
Claude 3.5 Sonnet ดีมากสำหรับงานเขียนโค้ด
สอบถามข้อมูลราคาของโมเดลโอเพนซอร์ส