เปิดตัว OpenFlamingo V2

xguru · 2023-07-03T10:32:01+09:00

การนำโมเดล Flamingo ของ DeepMind มาอิมพลีเมนต์แบบโอเพนซอร์ส เปิดเผยโมเดลขนาด 3B, 4B, 9B อิงจาก MPT-1B/7B และ RedPajama-3B ทำผลงานได้มากกว่า 80% ของประสิทธิภาพโมเดล Flamingo รุ่นเดียวกัน ปรับปรุงโค้ดสำหรับการฝึกและการประเมินผล รองรับ Fully Sharded Data Parallel (FSDP) เพิ่มชุดข้อมูลใหม่ในชุดประเมินผล (TextVQA, VizWiz, HatefulMemes, Flickr30k)

(laion.ai)

7 คะแนน โดย xguru 2023-07-03 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

การนำโมเดล Flamingo ของ DeepMind มาอิมพลีเมนต์แบบโอเพนซอร์ส
เปิดเผยโมเดลขนาด 3B, 4B, 9B
- อิงจาก MPT-1B/7B และ RedPajama-3B
ทำผลงานได้มากกว่า 80% ของประสิทธิภาพโมเดล Flamingo รุ่นเดียวกัน
ปรับปรุงโค้ดสำหรับการฝึกและการประเมินผล
- รองรับ Fully Sharded Data Parallel (FSDP)
- เพิ่มชุดข้อมูลใหม่ในชุดประเมินผล (TextVQA, VizWiz, HatefulMemes, Flickr30k)

1 ความคิดเห็น

xguru 2023-07-03

OpenFlamingo - เฟรมเวิร์กโอเพนซอร์สสำหรับฝึก/ประเมินโมเดลมัลติโหมดขนาดใหญ่ (LMM)

เปิดตัว OpenFlamingo V2

บทความที่เกี่ยวข้อง

1 ความคิดเห็น