• เปิดเผยซอร์สโค้ด, น้ำหนักโมเดล และชุดข้อมูลฝึกทั้งหมดภายใต้ Apache-2.0
  • องค์ประกอบหลัก 4 ส่วน
    • Instruction-Tuned LLM ที่ฟাইনจูน GPT-NEOX-20B ด้วยชุดคำสั่ง 43 ล้านรายการ
    • Customization Recipe ที่สามารถนำไปฟাইনจูนให้เหมาะกับงานของตนเองได้
    • Extensible Retrieval System ที่สามารถดึงข้อมูลจาก Document Repo, API และแหล่งข้อมูลที่อัปเดตแบบเรียลไทม์ในช่วงทำ inference เพื่อเสริมคำตอบได้
    • Moderation Model ที่ฟাইনจูน GPT-JT-6B และออกแบบมาเพื่อกรองคำถามที่บอตจะตอบ
  • ความร่วมมือระหว่าง LAION และ Ontocord: ชุดข้อมูล OIG (เผยแพร่แยกต่างหาก) ที่มีคำสั่งรวม 43 ล้านรายการ

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น