• ปรับจูนคำสั่งและฝึก RLHF บน Vicuna v0 13B
  • ทำ SFT (Supervised Fine-Tuning) โดยใช้ 3 ชุดข้อมูล
    • OpenAssistant Conversations Dataset (OASST1)
    • GPT4All Prompt Generations
    • Alpaca
  • ดาวน์โหลดได้บน HuggingFace ในรูปแบบ weight delta สำหรับโมเดล LLaMA (ต้องมีข้อมูล LLaMA ต้นฉบับ)

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น