16 คะแนน โดย xguru 2023-05-08 | 3 ความคิดเห็น | แชร์ทาง WhatsApp
  • โมเดลขนาด 15.5B ที่ฝึกด้วยโทเคน 1 ล้านล้านโทเคนสำหรับภาษาโปรแกรมมากกว่า 80 ภาษา
  • ใช้ MQA เพื่อการสร้างที่มีประสิทธิภาพ และมีหน้าต่างคอนเท็กซ์ 8192 โทเคน
    • StarCoderBase: ฝึกด้วยชุดข้อมูล The-Stack v1.2 (6TB) ที่มีข้อมูลจากมากกว่า 80 ภาษา
    • StarCoder: โมเดลที่ฝึกเพิ่มเติมสำหรับ Python
  • มี Chat Demo และส่วนขยายสำหรับ VSCode

3 ความคิดเห็น

 
ninebow 2023-05-08

ลิงก์งานวิจัยที่อยู่ในโพสต์ประกาศบน Twitter ครับ :)

https://drive.google.com/file/d/1cN-b9GnWtHzQRoE7M7gAEyivY0kl4BYs/view

 
ninebow 2023-05-08

มีการเปิดให้ใช้งานได้ทันทีบน HuggingFace Chat ด้วยเหมือนกันนะครับ :)
https://huggingface.co/chat/?model=bigcode/starcoder