LIMA - เข้าใกล้ GPT-4 ด้วยโมเดล LLaMA 65B และพรอมป์ต์เพียง 1,000 รายการ

xguru · 2023-05-23T09:36:28+09:00

"Less Is More for Alignment" โมเดล LLaMA ที่ผ่านการฟाइनจูนด้วยพรอมป์ต์ที่คัดสรรมาอย่างดีเพียง 1,000 รายการ โดยไม่ใช้การเรียนรู้แบบเสริมกำลังหรือการสร้างแบบจำลองความชอบ ใน 43% ของกรณี ได้รับความนิยมเทียบเท่าหรือมากกว่า GPT-4, เมื่อเทียบกับ Bard อยู่ที่ 58%, และสูงกว่า DaVinci003 ที่ฝึกด้วย human feedback อยู่ 65% สมมติฐานของงานวิจัยคือ ความรู้แทบทั้งหมดของ LLM ถูกเรียนรู้ในช่วง pretraining และ alignment เป็นกระบวนการง่าย ๆ ในการเรียนรู้รูปแบบ/สไตล์สำหรับการโต้ตอบกับผู้ใช้ งานวิจัยฉบับใหม่จาก Meta AI

(arxiv.org)

24 คะแนน โดย xguru 2023-05-23 | 4 ความคิดเห็น | แชร์ทาง WhatsApp

"Less Is More for Alignment"
โมเดล LLaMA ที่ผ่านการฟाइनจูนด้วยพรอมป์ต์ที่คัดสรรมาอย่างดีเพียง 1,000 รายการ โดยไม่ใช้การเรียนรู้แบบเสริมกำลังหรือการสร้างแบบจำลองความชอบ
ใน 43% ของกรณี ได้รับความนิยมเทียบเท่าหรือมากกว่า GPT-4, เมื่อเทียบกับ Bard อยู่ที่ 58%, และสูงกว่า DaVinci003 ที่ฝึกด้วย human feedback อยู่ 65%
สมมติฐานของงานวิจัยคือ ความรู้แทบทั้งหมดของ LLM ถูกเรียนรู้ในช่วง pretraining และ alignment เป็นกระบวนการง่าย ๆ ในการเรียนรู้รูปแบบ/สไตล์สำหรับการโต้ตอบกับผู้ใช้
งานวิจัยฉบับใหม่จาก Meta AI

4 ความคิดเห็น

merong 2023-05-23

ควรสานต่อโครงการ Sejong และสะสมข้อมูลโมเดลภาษาภาษาเกาหลีแบบโอเพนซอร์สต่อไปจริง ๆ น่าเสียดายมากที่เป็นโครงการแบบนี้...

kuroneko 2023-05-23

แม้ประสิทธิภาพภาษาอังกฤษจะพัฒนาเร็วขนาดนี้ แต่ก็น่าเสียดายที่โมเดลส่วนใหญ่ที่ไม่ใช่ GPT ยังใช้ภาษาเกาหลีได้ไม่ค่อยดี...

dulco 2023-05-23

การฝึกภาษาเกาหลีของ Claude ของ Anthropic อยู่ในระดับที่ค่อนข้างดี แต่ความสามารถในการใช้ภาษายังแตกต่างจาก ChatGPT อยู่บ้าง

test4458 2023-05-23

T_T ใช่เลย ภาษาเกาหลีนี่นอกจาก GPT API แล้ว ที่เหลือคุณภาพระดับขยะทั้งหมด...

LIMA - เข้าใกล้ GPT-4 ด้วยโมเดล LLaMA 65B และพรอมป์ต์เพียง 1,000 รายการ

บทความที่เกี่ยวข้อง

4 ความคิดเห็น