- Meta AI เปิดตัว CoTracker โมเดลใหม่สำหรับติดตามจุด (พิกเซล) ในวิดีโอ
- CoTracker มีเป้าหมายเพื่อติดตามหลายจุดตลอดทั้งวิดีโอโดยคำนึงถึงความสัมพันธ์ระหว่างจุดต่าง ๆ
- สถาปัตยกรรมนี้อิงจากแนวคิดในงานด้าน optical flow และวรรณกรรมด้านการติดตาม โดยใช้เครือข่ายทรานส์ฟอร์เมอร์ที่มีเลเยอร์ attention แบบเฉพาะทาง
- ใช้วิธี sliding window จึงสามารถนำไปใช้กับวิดีโอขนาดยาวได้ และพิสูจน์แล้วว่ามีประสิทธิภาพและความแม่นยำสูงเมื่อเทียบกับวิธีติดตามจุดแบบอื่น
- โมเดลนี้สร้างการติดตามที่สะอาดและเป็นเส้นตรงมากขึ้น โดยเฉพาะในกรณีที่มีการบังวัตถุ
- CoTracker แสดงประสิทธิภาพที่เหนือกว่างานวิจัยอื่น ๆ เช่น TAPIR และ Multi-Flow Tracking ในด้านความแม่นยำ
- นับเป็นความก้าวหน้าสำคัญที่มอบเครื่องมือใหม่อันทรงพลังให้วิศวกรซอฟต์แวร์สำหรับการติดตามจุดในวิดีโอ เพื่อยกระดับประสิทธิภาพและความแม่นยำ
3 ความคิดเห็น
เดโมดูสวยดีนะ พอคิดถึงสิ่งที่จำเป็นใน VR แล้ว ก็ดูเหมือนว่าจะมีบางส่วนที่สอดคล้องกับธุรกิจอยู่เหมือนกัน...
ความเห็นจาก Hacker News
มุมมองเชิงธุรกิจของฝ่ายวิจัยของ Meta ยังไม่ชัดเจน และไม่เข้าใจว่ามันเชื่อมโยงกับธุรกิจหลักอย่างไร
นี่คือคอมเมนต์ที่ตรงประเด็นเลย งานวิจัยก็ดีอยู่หรอก แต่ก็มีหลายส่วนที่ยังไม่ค่อยเข้าใจว่ามันสอดคล้องกับธุรกิจอย่างไร
ให้ความรู้สึกเหมือนกำลังมอง Google ในยุคก่อน ๆ อยู่เหมือนกัน..