Ollama 0.4 รองรับ Llama 3.2 Vision
(ollama.com)- Llama 3.2 Vision เป็นโมเดลสร้างการอนุมานจากภาพขนาด 11B/90B
- ปรับแต่งมาให้เหมาะกับการจดจำภาพ การอนุมานจากภาพ การสร้างคำบรรยายภาพ และการตอบคำถามทั่วไปเกี่ยวกับภาพ
- สามารถรันได้ด้วย
ollama run llama3.2-vision:90bแล้วเพิ่มรูปภาพเข้าไปในพรอมป์ต์เพื่อถามคำถามได้ - ตัวอย่างการใช้งาน: การรู้จำลายมือเขียน, OCR, การตีความกราฟ/ตาราง, Q/A เกี่ยวกับภาพ
ยังไม่มีความคิดเห็น