- เปิดเผยซอร์สโค้ด, น้ำหนักโมเดล และชุดข้อมูลฝึกทั้งหมดภายใต้ Apache-2.0
- องค์ประกอบหลัก 4 ส่วน
- Instruction-Tuned LLM ที่ฟাইনจูน GPT-NEOX-20B ด้วยชุดคำสั่ง 43 ล้านรายการ
- Customization Recipe ที่สามารถนำไปฟাইনจูนให้เหมาะกับงานของตนเองได้
- Extensible Retrieval System ที่สามารถดึงข้อมูลจาก Document Repo, API และแหล่งข้อมูลที่อัปเดตแบบเรียลไทม์ในช่วงทำ inference เพื่อเสริมคำตอบได้
- Moderation Model ที่ฟাইনจูน GPT-JT-6B และออกแบบมาเพื่อกรองคำถามที่บอตจะตอบ
- ความร่วมมือระหว่าง LAION และ Ontocord: ชุดข้อมูล OIG (เผยแพร่แยกต่างหาก) ที่มีคำสั่งรวม 43 ล้านรายการ
ยังไม่มีความคิดเห็น