M2M-100 เป็นโมเดล MMT (Multilingual Machine Translation)

ซึ่งเป็นครั้งแรกที่สามารถแปลข้ามกันระหว่าง 100 คู่ภาษาได้ โดยไม่ต้องพึ่งพาข้อมูลภาษาอังกฤษ

โดยปกติการแปลส่วนใหญ่มักต้องผ่านภาษาอังกฤษซึ่งมีข้อมูลเทรนนิงจำนวนมาก แต่โมเดลนี้แปลได้โดยตรง จึงช่วยคงความหมายไว้ได้ดีกว่า

แสดงผลลัพธ์ที่ดีกว่ามากกว่า 10% ในคะแนน BLEU (Bilingual Evaluation Understudy)

ได้รับการเทรนในทิศทางภาษารวม 2,200 แบบ ซึ่งมากกว่าโมเดลพหุภาษาที่ยึดภาษาอังกฤษเป็นศูนย์กลางระดับแนวหน้ารุ่นก่อนถึง 10 เท่า

การใช้ M2M-100 จะช่วยยกระดับคุณภาพการแปลให้กับผู้ใช้ภาษาที่มีข้อมูลน้อย

บทความนี้ได้แบ่งปันรายละเอียดเกี่ยวกับชุดข้อมูลฝึก MMT และวิธีสร้างโมเดล

รวมถึงเปิดเผยตัวโมเดล วิธีการฝึก และวิธีประเมินผล เพื่อให้นักวิจัยคนอื่นสามารถทำซ้ำและพัฒนาโมเดลพหุภาษาที่ดียิ่งขึ้นได้

สามารถดาวน์โหลดไฟล์โมเดลที่เทรนด้วยพารามิเตอร์ 12 พันล้านตัวได้ (136GB)

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น