33 คะแนน โดย xguru 2023-03-19 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ฝึกด้วยวิธีเดียวกับแนวทางการฝึกของโมเดล Alpaca ของ Stanford
  • ใช้ Polyglot-ko 5.8B และ LLaMA 7B เป็นโมเดลแกนหลัก
    • LLaMA มีการฝึกด้วยชุดข้อมูลภาษาเกาหลีไม่เพียงพอ จึงมีประสิทธิภาพด้านภาษาเกาหลีต่ำ และได้มีการฝึกโมเดลภาษาเกาหลีเพิ่มเติม
  • ชุดข้อมูลคำสั่ง 52k ของ LLaMA ถูกแปลด้วย DeepL API

1 ความคิดเห็น

 
luckydaun 2023-03-19

โอ้... ระบบนิเวศนี้กำลังพัฒนาอย่างรวดเร็วมากจริงๆ นะครับ แม้แต่โมเดล Transformer ที่มีอยู่เดิมก็ยังมีความแตกต่างด้านประสิทธิภาพระหว่างโมเดลที่ปรับให้เข้ากับภาษาเกาหลีโดยเฉพาะกับโมเดลแบบใช้งานทั่วไปอย่างมาก นับเป็นโอเพนซอร์สที่ดีมากครับ