• LLM โอเพนซอร์สขนาด 7B พารามิเตอร์ที่รองรับความยาวคอนเท็กซ์ 8k
  • ต่อจาก MPT-7B ได้ทำการเทรนเพิ่มเติมเป็นเวลา 3 วันบน NVidia H100 จำนวน 256 ตัว โดยใช้ข้อมูล 500B โทเค็น
  • เปิดตัว 3 โมเดล: MPT-7B-8k, MPT-7B-8k-Instruct, MPT-7B-8k-Chat
  • สามารถใช้งานเพื่อวัตถุประสงค์เชิงพาณิชย์ได้
  • รองรับอินพุต 8k ด้วย ALiBi (Attention with Linear Biases Enables Input Length Extrapolation)
  • เทรนและอนุมานได้รวดเร็วด้วย FlashAttention และ FasterTrasformer

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น