LLaVA: การปรับแต่งตามคำสั่งสำหรับภาพ

xguru · 2023-04-22T10:32:01+09:00

"LLaVA : Large Language and Vision Assistant" โมเดลมัลติโหมดขนาดใหญ่ที่ผสานวิชันเอนโค้ดเดอร์และ Vicuna เพื่อความเข้าใจด้านภาพและภาษาแบบทั่วไป มุ่งสู่ความสามารถระดับ Multimodal GPT-4 และความแม่นยำระดับ SOTA ในงานถาม-ตอบเชิงวิทยาศาสตร์ เปิดเผยทั้งงานวิจัย โค้ด และเดโม

(llava-vl.github.io)

6 คะแนน โดย xguru 2023-04-22 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

"LLaVA : Large Language and Vision Assistant"
โมเดลมัลติโหมดขนาดใหญ่ที่ผสานวิชันเอนโค้ดเดอร์และ Vicuna เพื่อความเข้าใจด้านภาพและภาษาแบบทั่วไป
มุ่งสู่ความสามารถระดับ Multimodal GPT-4 และความแม่นยำระดับ SOTA ในงานถาม-ตอบเชิงวิทยาศาสตร์
เปิดเผยทั้งงานวิจัย โค้ด และเดโม

LLaVA: การปรับแต่งตามคำสั่งสำหรับภาพ

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น