KoAlpaca - โมเดล Alpaca ภาษาเกาหลี
(github.com/Beomi)- ฝึกด้วยวิธีเดียวกับแนวทางการฝึกของโมเดล Alpaca ของ Stanford
- ใช้ Polyglot-ko 5.8B และ LLaMA 7B เป็นโมเดลแกนหลัก
- LLaMA มีการฝึกด้วยชุดข้อมูลภาษาเกาหลีไม่เพียงพอ จึงมีประสิทธิภาพด้านภาษาเกาหลีต่ำ และได้มีการฝึกโมเดลภาษาเกาหลีเพิ่มเติม
- ชุดข้อมูลคำสั่ง 52k ของ LLaMA ถูกแปลด้วย DeepL API
1 ความคิดเห็น
โอ้... ระบบนิเวศนี้กำลังพัฒนาอย่างรวดเร็วมากจริงๆ นะครับ แม้แต่โมเดล Transformer ที่มีอยู่เดิมก็ยังมีความแตกต่างด้านประสิทธิภาพระหว่างโมเดลที่ปรับให้เข้ากับภาษาเกาหลีโดยเฉพาะกับโมเดลแบบใช้งานทั่วไปอย่างมาก นับเป็นโอเพนซอร์สที่ดีมากครับ