ImageBind - โมเดล AI แบบมัลติโหมดของ Meta

xguru · 2023-05-12T10:02:01+09:00

สามารถ bind ข้อมูลจาก 6 โมดาลิตีพร้อมกันได้โดยไม่ต้องมี supervision ทำให้วิเคราะห์ข้อมูลหลากหลายประเภทได้ดีขึ้น รูปภาพ, วิดีโอ, เสียง, ข้อความ, ความลึก, ความร้อน (Thermal), IMU (อุปกรณ์วัดความเฉื่อย) สามารถสร้างภาพจากเสียง หรือค้นหาข้อมูลโดยรวมข้อมูลเสียง/วิดีโอ/ภาพ/ความลึกเข้าด้วยกันได้ มีประสิทธิภาพการรู้จำแบบ Zero-shot / Few-Shot ที่ยอดเยี่ยม

(imagebind.metademolab.com)

7 คะแนน โดย xguru 2023-05-12 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

สามารถ bind ข้อมูลจาก 6 โมดาลิตีพร้อมกันได้โดยไม่ต้องมี supervision ทำให้วิเคราะห์ข้อมูลหลากหลายประเภทได้ดีขึ้น
- รูปภาพ, วิดีโอ, เสียง, ข้อความ, ความลึก, ความร้อน (Thermal), IMU (อุปกรณ์วัดความเฉื่อย)
- สามารถสร้างภาพจากเสียง หรือค้นหาข้อมูลโดยรวมข้อมูลเสียง/วิดีโอ/ภาพ/ความลึกเข้าด้วยกันได้
มีประสิทธิภาพการรู้จำแบบ Zero-shot / Few-Shot ที่ยอดเยี่ยม

ImageBind - โมเดล AI แบบมัลติโหมดของ Meta

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น