KoAlpaca - โมเดล Alpaca ภาษาเกาหลี

xguru · 2023-03-19T10:49:01+09:00

ฝึกด้วยวิธีเดียวกับแนวทางการฝึกของโมเดล Alpaca ของ Stanford ใช้ Polyglot-ko 5.8B และ LLaMA 7B เป็นโมเดลแกนหลัก LLaMA มีการฝึกด้วยชุดข้อมูลภาษาเกาหลีไม่เพียงพอ จึงมีประสิทธิภาพด้านภาษาเกาหลีต่ำ และได้มีการฝึกโมเดลภาษาเกาหลีเพิ่มเติม ชุดข้อมูลคำสั่ง 52k ของ LLaMA ถูกแปลด้วย DeepL API

(github.com/Beomi)

33 คะแนน โดย xguru 2023-03-19 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ฝึกด้วยวิธีเดียวกับแนวทางการฝึกของโมเดล Alpaca ของ Stanford
ใช้ Polyglot-ko 5.8B และ LLaMA 7B เป็นโมเดลแกนหลัก
- LLaMA มีการฝึกด้วยชุดข้อมูลภาษาเกาหลีไม่เพียงพอ จึงมีประสิทธิภาพด้านภาษาเกาหลีต่ำ และได้มีการฝึกโมเดลภาษาเกาหลีเพิ่มเติม
ชุดข้อมูลคำสั่ง 52k ของ LLaMA ถูกแปลด้วย DeepL API

1 ความคิดเห็น

luckydaun 2023-03-19

โอ้... ระบบนิเวศนี้กำลังพัฒนาอย่างรวดเร็วมากจริงๆ นะครับ แม้แต่โมเดล Transformer ที่มีอยู่เดิมก็ยังมีความแตกต่างด้านประสิทธิภาพระหว่างโมเดลที่ปรับให้เข้ากับภาษาเกาหลีโดยเฉพาะกับโมเดลแบบใช้งานทั่วไปอย่างมาก นับเป็นโอเพนซอร์สที่ดีมากครับ

KoAlpaca - โมเดล Alpaca ภาษาเกาหลี

บทความที่เกี่ยวข้อง

1 ความคิดเห็น