เปิดตัว OpenFlamingo V2
(laion.ai)- การนำโมเดล Flamingo ของ DeepMind มาอิมพลีเมนต์แบบโอเพนซอร์ส
- เปิดเผยโมเดลขนาด 3B, 4B, 9B
- อิงจาก MPT-1B/7B และ RedPajama-3B
- ทำผลงานได้มากกว่า 80% ของประสิทธิภาพโมเดล Flamingo รุ่นเดียวกัน
- ปรับปรุงโค้ดสำหรับการฝึกและการประเมินผล
- รองรับ Fully Sharded Data Parallel (FSDP)
- เพิ่มชุดข้อมูลใหม่ในชุดประเมินผล (TextVQA, VizWiz, HatefulMemes, Flickr30k)
1 ความคิดเห็น
OpenFlamingo - เฟรมเวิร์กโอเพนซอร์สสำหรับฝึก/ประเมินโมเดลมัลติโหมดขนาดใหญ่ (LMM)