การค้นหารูปภาพด้วยการทำ Localisation และการจัดอันดับใหม่ด้วย Open-Vocabulary โดยใช้ Marqo, yolox, CLIP และ OWL-ViT
(github.com/marqo-ai)สรุปสำคัญ: บทความนี้แสดงวิธีพัฒนาการค้นหารูปภาพด้วย Marqo, yolox, CLIP และ OWL-ViT โดยเพิ่มความสามารถด้านการทำ localisation และการจัดอันดับใหม่เข้าไป การเพิ่มมิติของ localisation ช่วยปรับปรุงประสิทธิภาพการค้นหา เปิด use case ใหม่สำหรับการค้นหารูปภาพ และเพิ่มความสามารถในการอธิบายผลลัพธ์ได้มากขึ้น การจัดอันดับใหม่โดยใช้โมเดลตรวจจับแบบ open-vocabulary ยังช่วยให้ทำ localisation ได้ละเอียดมากยิ่งขึ้น ส่วนแรกของบทความจะกล่าวถึงข้อมูลพื้นฐาน และส่วนที่สองมีโค้ดสำหรับใช้งานจริง (สามารถดูได้จากที่นี่เช่นกัน)
ยังไม่มีความคิดเห็น