- รองรับโมเดลใหม่
- Llama 3: โมเดลใหม่จาก Meta และเป็น LLM แบบเปิดที่มีประสิทธิภาพดีที่สุดเท่าที่มีมาในตอนนี้
- Phi 3 Mini: โมเดลเปิดขนาดเบารุ่นใหม่จาก Microsoft ที่มีพารามิเตอร์ 3.8 พันล้านตัว
- Moondream: โมเดลวิชันภาษาแบบขนาดเล็กที่ออกแบบมาให้รันได้อย่างมีประสิทธิภาพบนอุปกรณ์เอดจ์
- Dolphin Llama 3: โมเดลแบบไม่เซ็นเซอร์ที่ Eric Hartford ฝึกบนพื้นฐานของ Llama 3 พร้อมความสามารถด้านการสอน การสนทนา และการเขียนโค้ดที่หลากหลาย
- Qwen 110B: โมเดลขนาดพารามิเตอร์ 100B จาก Alibaba ที่ทำผลงานได้โดดเด่นในการประเมินผล
- แก้ไขบั๊ก
- แก้ปัญหาที่โมเดลไม่ยอมปิดจนทำให้ API หยุดทำงาน
- แก้ข้อผิดพลาดหน่วยความจำไม่พอบน Mac ที่ใช้ Apple Silicon
- แก้ข้อผิดพลาดหน่วยความจำไม่พอเมื่อรันโมเดลสถาปัตยกรรม Mixtral
- ฟีเจอร์ concurrency แบบทดลอง
OLLAMA_NUM_PARALLEL: ประมวลผลหลายคำขอพร้อมกันสำหรับโมเดลเดียว
OLLAMA_MAX_LOADED_MODELS: โหลดหลายโมเดลพร้อมกัน
- ต้องตั้งค่าตัวแปรสภาพแวดล้อม
OLLAMA_NUM_PARALLEL=4 OLLAMA_MAX_LOADED_MODELS=4 ollama serve
1 ความคิดเห็น
จำเป็นต้องใช้หลายโมเดลอยู่พอดี ตอนนี้ทำได้แล้วนะ ^^=b