ค้นหาภายในวิดีโอ YouTube ด้วยภาษาธรรมชาติ
(github.com)- ค้นหาฉากเฉพาะภายในวิดีโอด้วยโครงข่ายประสาท CLIP ของ OpenAI
→ ค้นหารูปภาพภายในวิดีโอ เช่น "Road Works", "People crossing the street", "Fire truck"
วิธีการทำงาน
-
ดาวน์โหลดวิดีโอ YouTube
-
แยกแต่ละเฟรม
-
เข้ารหัสทุกเฟรมด้วย CLIP
-
เข้ารหัสคำค้นภาษาธรรมชาติด้วย CLIP
-
ค้นหาฉากเฉพาะด้วยคำค้นภาษาธรรมชาติ
- รันได้ทันทีเป็นโน้ตบุ๊กบน Google Colab
1 ความคิดเห็น
ในคอมเมนต์มีอันที่นักพัฒนาคนเดียวกันทำระบบค้นหารูปภาพของ Unsplash ด้วย CLIP ไว้ด้วย ซึ่งอันนี้ก็น่าจะมีประโยชน์มากเช่นกัน
https://github.com/haltakov/natural-language-image-search
Google Colab : https://colab.research.google.com/github/haltakov/…
มันช่วยค้นหารูปภาพที่ต้องการจากภาพถ่าย 2 ล้านภาพที่อัปโหลดอยู่บน Unsplash