LLaMA - LLM ขนาด 65B พารามิเตอร์ที่ Meta เปิดเผย

xguru · 2023-02-28T10:49:01+09:00

เปิดเผยมา 4 ขนาดคือ 7B, 13B, 33B, 65B แม้จะมีขนาดเล็กกว่ามาก แต่เป็นโมเดลที่มีประสิทธิภาพและสามารถเทียบกับโมเดลขนาดใหญ่กว่าได้ ด้วยการเสริมการฝึกข้อมูลและการปรับจูนแบบละเอียด 33B/65B ถูกฝึกด้วยโทเคน 1.4 ล้านล้านโทเคน (7B คือ 1 ล้านล้าน) "โมเดล 13B เหนือกว่า GPT-3 ขนาด 175B และ 65B สามารถแข่งขันกับ Chinchilla70B และ PaLM-540B ที่มีขนาดใหญ่กว่ามากได้" สามารถใช้งานได้เฉพาะเพื่อการวิจัยด้านปัญญาประดิษฐ์และวัตถุประสงค์ที่ไม่ใช่เชิงพาณิชย์เท่านั้น (ต้องยื่นขอและได้รับอนุมัติ)

(ai.facebook.com)

7 คะแนน โดย xguru 2023-02-28 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

เปิดเผยมา 4 ขนาดคือ 7B, 13B, 33B, 65B
แม้จะมีขนาดเล็กกว่ามาก แต่เป็นโมเดลที่มีประสิทธิภาพและสามารถเทียบกับโมเดลขนาดใหญ่กว่าได้ ด้วยการเสริมการฝึกข้อมูลและการปรับจูนแบบละเอียด
33B/65B ถูกฝึกด้วยโทเคน 1.4 ล้านล้านโทเคน (7B คือ 1 ล้านล้าน)
"โมเดล 13B เหนือกว่า GPT-3 ขนาด 175B และ 65B สามารถแข่งขันกับ Chinchilla70B และ PaLM-540B ที่มีขนาดใหญ่กว่ามากได้"
สามารถใช้งานได้เฉพาะเพื่อการวิจัยด้านปัญญาประดิษฐ์และวัตถุประสงค์ที่ไม่ใช่เชิงพาณิชย์เท่านั้น (ต้องยื่นขอและได้รับอนุมัติ)

LLaMA - LLM ขนาด 65B พารามิเตอร์ที่ Meta เปิดเผย

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น