• โมเดลภาษาขนาดใหญ่สไตล์ผู้ช่วย
  • เปิดเผยทั้งหมดทั้งข้อมูลที่รวบรวม กระบวนการรวบรวมข้อมูล โค้ดสำหรับการฝึก และค่าน้ำหนักของโมเดลสุดท้าย
  • ฝึกด้วยข้อมูล 800k (โค้ด/สตอรี่/บทสนทนา) ที่สร้างโดย GPT 3.5 Turbo
    • ใช้ LAION OIG, คำถามเขียนโค้ดจาก Stack Overflow และ instruction tuning ของ Big-Science/P3 เป็นชุดข้อมูลพื้นฐาน
    • อ้างอิง Stanford Alpaca เป็นต้น และอัปโหลดข้อมูลขึ้น ATLAS เพื่อคัดสรรและทำความสะอาดข้อมูล

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น