- ปรับจูนคำสั่งและฝึก RLHF บน Vicuna v0 13B
- ทำ SFT (Supervised Fine-Tuning) โดยใช้ 3 ชุดข้อมูล
- OpenAssistant Conversations Dataset (OASST1)
- GPT4All Prompt Generations
- Alpaca
- ดาวน์โหลดได้บน HuggingFace ในรูปแบบ weight delta สำหรับโมเดล LLaMA (ต้องมีข้อมูล LLaMA ต้นฉบับ)
ยังไม่มีความคิดเห็น