ImageBind - โมเดล AI แบบมัลติโหมดของ Meta
(imagebind.metademolab.com)- สามารถ bind ข้อมูลจาก 6 โมดาลิตีพร้อมกันได้โดยไม่ต้องมี supervision ทำให้วิเคราะห์ข้อมูลหลากหลายประเภทได้ดีขึ้น
- รูปภาพ, วิดีโอ, เสียง, ข้อความ, ความลึก, ความร้อน (Thermal), IMU (อุปกรณ์วัดความเฉื่อย)
- สามารถสร้างภาพจากเสียง หรือค้นหาข้อมูลโดยรวมข้อมูลเสียง/วิดีโอ/ภาพ/ความลึกเข้าด้วยกันได้
- มีประสิทธิภาพการรู้จำแบบ Zero-shot / Few-Shot ที่ยอดเยี่ยม
ยังไม่มีความคิดเห็น