• สามารถ bind ข้อมูลจาก 6 โมดาลิตีพร้อมกันได้โดยไม่ต้องมี supervision ทำให้วิเคราะห์ข้อมูลหลากหลายประเภทได้ดีขึ้น
    • รูปภาพ, วิดีโอ, เสียง, ข้อความ, ความลึก, ความร้อน (Thermal), IMU (อุปกรณ์วัดความเฉื่อย)
    • สามารถสร้างภาพจากเสียง หรือค้นหาข้อมูลโดยรวมข้อมูลเสียง/วิดีโอ/ภาพ/ความลึกเข้าด้วยกันได้
  • มีประสิทธิภาพการรู้จำแบบ Zero-shot / Few-Shot ที่ยอดเยี่ยม

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น