Stability AI เปิดตัว StableVicuna แชตบอต LLM แบบโอเพนซอร์สที่ใช้ RLHF รายแรกของโลก

xguru · 2023-05-01T10:32:02+09:00

ปรับจูนคำสั่งและฝึก RLHF บน Vicuna v0 13B ทำ SFT (Supervised Fine-Tuning) โดยใช้ 3 ชุดข้อมูล OpenAssistant Conversations Dataset (OASST1) GPT4All Prompt Generations Alpaca ดาวน์โหลดได้บน HuggingFace ในรูปแบบ weight delta สำหรับโมเดล LLaMA (ต้องมีข้อมูล LLaMA ต้นฉบับ)

(stability.ai)

16 คะแนน โดย xguru 2023-05-01 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

ปรับจูนคำสั่งและฝึก RLHF บน Vicuna v0 13B
ทำ SFT (Supervised Fine-Tuning) โดยใช้ 3 ชุดข้อมูล
- OpenAssistant Conversations Dataset (OASST1)
- GPT4All Prompt Generations
- Alpaca
ดาวน์โหลดได้บน HuggingFace ในรูปแบบ weight delta สำหรับโมเดล LLaMA (ต้องมีข้อมูล LLaMA ต้นฉบับ)

Stability AI เปิดตัว StableVicuna แชตบอต LLM แบบโอเพนซอร์สที่ใช้ RLHF รายแรกของโลก

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น