YaLM 100B - โมเดลภาษาสไตล์ GPT ที่มีพารามิเตอร์ 1 แสนล้านตัว
(github.com/yandex)- Yandex เปิดให้ใช้งานฟรี เพื่อให้นักพัฒนา/นักวิจัยทุกคนสามารถใช้งานได้
- ฝึกด้วยข้อความภาษาอังกฤษและภาษารัสเซียขนาด 1.7TB โดยใช้ GPU A100 จำนวน 800 ตัวเป็นเวลา 65 วัน
- พัฒนาบนพื้นฐานโค้ด Megatron-LM ของ Microsoft
ยังไม่มีความคิดเห็น