MPT-7B, LLM โอเพนซอร์สที่ใช้งานเชิงพาณิชย์ได้

xguru · 2023-05-09T09:41:02+09:00

ทรานส์ฟอร์เมอร์ที่ฝึกด้วยโทเคน 1 ล้านล้านโทเคน คุณภาพใกล้เคียงกับ LLaMA-7B แต่เป็นโอเพนซอร์สและใช้งานเชิงพาณิชย์ได้ เปิดตัวโมเดลที่ผ่านการปรับจูนเพิ่มเติมอีก 3 รุ่น MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (รองรับ 65K โทเคน) ฝึกบนแพลตฟอร์ม MosaicML เป็นเวลา 9.5 วัน ด้วยค่าใช้จ่ายประมาณ ~$200K และสามารถฝึก ปรับจูน และดีพลอยโมเดล MPT ของตนเองได้ MPT: Mosaic Pretrained Transformers

(mosaicml.com)

14 คะแนน โดย xguru 2023-05-09 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

ทรานส์ฟอร์เมอร์ที่ฝึกด้วยโทเคน 1 ล้านล้านโทเคน
คุณภาพใกล้เคียงกับ LLaMA-7B แต่เป็นโอเพนซอร์สและใช้งานเชิงพาณิชย์ได้
เปิดตัวโมเดลที่ผ่านการปรับจูนเพิ่มเติมอีก 3 รุ่น
- MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (รองรับ 65K โทเคน)
ฝึกบนแพลตฟอร์ม MosaicML เป็นเวลา 9.5 วัน ด้วยค่าใช้จ่ายประมาณ ~$200K และสามารถฝึก ปรับจูน และดีพลอยโมเดล MPT ของตนเองได้
MPT: Mosaic Pretrained Transformers

2 ความคิดเห็น

kuroneko 2023-05-09

ช่วงนี้พอเห็นโมเดล LLM โอเพนซอร์สที่นำไปใช้เชิงพาณิชย์ได้เปิดตัวออกมาเยอะมาก
ก็ดูเหมือนกำลังแข่งกันเพื่อจะเป็น Stable Diffusion แห่งวงการ LLM นะครับ

น่าติดตามว่าใครจะเป็นผู้ชนะครับ +_+

xguru 2023-05-09

ผมคิดว่าการพัฒนาโดยเชื่อมต่อกับ ChatGPT ก่อนในช่วงแรก แล้วค่อยเปลี่ยนไปใช้โอเพนซอร์สที่ก้าวหน้าที่สุดในภายหลัง น่าจะเป็นทางเลือกที่ดีครับ

MPT-7B, LLM โอเพนซอร์สที่ใช้งานเชิงพาณิชย์ได้

บทความที่เกี่ยวข้อง

2 ความคิดเห็น