7 คะแนน โดย xguru 2023-07-03 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • การนำโมเดล Flamingo ของ DeepMind มาอิมพลีเมนต์แบบโอเพนซอร์ส
  • เปิดเผยโมเดลขนาด 3B, 4B, 9B
    • อิงจาก MPT-1B/7B และ RedPajama-3B
  • ทำผลงานได้มากกว่า 80% ของประสิทธิภาพโมเดล Flamingo รุ่นเดียวกัน
  • ปรับปรุงโค้ดสำหรับการฝึกและการประเมินผล
    • รองรับ Fully Sharded Data Parallel (FSDP)
    • เพิ่มชุดข้อมูลใหม่ในชุดประเมินผล (TextVQA, VizWiz, HatefulMemes, Flickr30k)