เปิดตัวโมเดล RedPajama 3B และ 7B

xguru · 2023-05-08T10:01:01+09:00

โปรเจ็กต์เพื่อสร้างโมเดลภาษาที่เปิดอย่างสมบูรณ์ เปิดตัวโมเดล RedPajama-INCITE ที่มีพารามิเตอร์ 3B (เสร็จสมบูรณ์) และ 7B (พรีวิว) โดยอิงจากชุดข้อมูล RedPajama-Data-1T ที่เปิดตัวไปเมื่อ 3 สัปดาห์ก่อน โมเดล Base โมเดล Instruction-Tuned โมเดล Chat โมเดล 3B ทรงพลังที่สุดในระดับเดียวกัน ขนาดเล็กจึงทำงานได้รวดเร็ว และสามารถรันได้บนอุปกรณ์อย่าง RTX 2070 ที่เปิดตัวเมื่อ 5 ปีก่อน โมเดล 7B เวอร์ชันปรับจูนตามคำสั่ง ทำคะแนนบน HELM benchmark สูงกว่า LLaMA 7B อยู่ 3 คะแนน โมเดล 7B (ฝึกเสร็จแล้ว 80%) แซงหน้าโมเดล Pythia 7B ไปแล้ว หากการฝึก 7B เสร็จสมบูรณ์ภายในไม่กี่สัปดาห์ข้างหน้า ก็น่าจะแซง LLaMA 7B ได้ โมเดล 3B มีเสถียรภาพแล้วที่ 8 แสนล้านโทเค็น และโมเดล 7B กำลังฝึกให้เสร็จด้วย 1 ล้านล้านโทเค็นพร้อมการปรับปรุงอย่างต่อเนื่อง

(together.xyz)

7 คะแนน โดย xguru 2023-05-08 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

โปรเจ็กต์เพื่อสร้างโมเดลภาษาที่เปิดอย่างสมบูรณ์
เปิดตัวโมเดล RedPajama-INCITE ที่มีพารามิเตอร์ 3B (เสร็จสมบูรณ์) และ 7B (พรีวิว) โดยอิงจากชุดข้อมูล RedPajama-Data-1T ที่เปิดตัวไปเมื่อ 3 สัปดาห์ก่อน
- โมเดล Base
- โมเดล Instruction-Tuned
- โมเดล Chat
โมเดล 3B ทรงพลังที่สุดในระดับเดียวกัน ขนาดเล็กจึงทำงานได้รวดเร็ว และสามารถรันได้บนอุปกรณ์อย่าง RTX 2070 ที่เปิดตัวเมื่อ 5 ปีก่อน
โมเดล 7B เวอร์ชันปรับจูนตามคำสั่ง ทำคะแนนบน HELM benchmark สูงกว่า LLaMA 7B อยู่ 3 คะแนน
โมเดล 7B (ฝึกเสร็จแล้ว 80%) แซงหน้าโมเดล Pythia 7B ไปแล้ว
หากการฝึก 7B เสร็จสมบูรณ์ภายในไม่กี่สัปดาห์ข้างหน้า ก็น่าจะแซง LLaMA 7B ได้
โมเดล 3B มีเสถียรภาพแล้วที่ 8 แสนล้านโทเค็น และโมเดล 7B กำลังฝึกให้เสร็จด้วย 1 ล้านล้านโทเค็นพร้อมการปรับปรุงอย่างต่อเนื่อง

2 ความคิดเห็น

coremaker 2023-05-08

แม้จะเป็นเหตุการณ์สำคัญต่อการวิจัยและความก้าวหน้าของ AI,
แต่มีความเป็นไปได้สูงว่าโมเดลลักษณะนี้จะไม่ได้นำเสนอวิธีแก้ไขในประเด็นที่เป็นปัญหาเมื่อใช้งานเชิงพาณิชย์
ในเชิงพาณิชย์ ดูเหมือนว่าการใช้งานโมเดลจะต้องมาพร้อมกับงานอย่างการปรับแต่งหรือการเตรียมฟิลเตอร์เพิ่มเติมอยู่เสมอ

xguru 2023-05-08

RedPajama - โครงการโอเพนซอร์สที่เขียนชุดข้อมูล LLaMA ขึ้นใหม่

เปิดตัวโมเดล RedPajama 3B และ 7B

บทความที่เกี่ยวข้อง

2 ความคิดเห็น