ONE-PEACE: โมเดลการแทนค่าทั่วไปสำหรับมัลติโมดัลลิตีแบบไม่จำกัด
(github.com/OFA-Sys)- General Representation Model ที่ครอบคลุมทั้งวิชัน, ออดิโอ และภาษา
- ให้ผลลัพธ์ที่ยอดเยี่ยมกับงานแบบบูรณาการได้แม้ไม่มีโมเดลที่พรีเทรนไว้ล่วงหน้า
- สามารถจัดแนวโมดัลลิตีที่ไม่ได้ถูกจับคู่กันในข้อมูลฝึกได้ด้วย Emergent Zero-shot Retrieval ที่ทรงพลัง
- Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image
1 ความคิดเห็น
ดูเหมือนว่าจะทำลายสถิติ SOTA ได้ในหลายงานเลยนะ