KoGPT - เปิดซอร์สโมเดลภาษา AI ภาษาเกาหลี
(github.com)- เวอร์ชันที่ปรับแต่งเฉพาะสำหรับภาษาเกาหลีของโมเดล GPT-3 ที่สร้างโดย Kakao Brain
→ สร้างขึ้นจากพารามิเตอร์ 6 พันล้านตัวและข้อมูลภาษาเกาหลี 2 แสนล้านโทเค็น
-
รองรับงานด้านภาษาทุกประเภท เช่น การตัดสินว่าประโยคที่กำหนดเป็นเชิงบวกหรือเชิงลบ การสรุปประโยคยาวให้เหลือหนึ่งบรรทัด การอนุมานจากประโยคเพื่อคาดการณ์ข้อสรุป และการทำความเข้าใจบริบทของคำถามเพื่อตอบคำถาม
-
มีแผนจะเปิดซอร์สโมเดลภาษาอังกฤษ ญี่ปุ่น เวียดนาม และมาเลเซีย ต่อจากภาษาเกาหลี
-
เปิดให้เป็นโอเพนซอร์สเพื่อรับประกันการเข้าถึง และมีเป้าหมายเพื่อช่วยพัฒนาเทคโนโลยีไอทีภายในประเทศและกระตุ้นการวิจัย
3 ความคิดเห็น
เว็บไซต์เดโม: https://huggingface.co/spaces/akhaliq/kogpt
เมื่อผมลองป้อนประโยคต่อไปนี้ที่มีอยู่เป็นตัวอย่างเข้าไปตามเดิม ก็ต้องรอคิวประมาณ 2 นาที จึงได้ผลลัพธ์แบบนี้ออกมาครับ ดูเหมือนว่าเวลาที่ใช้ประมวลผลจริงจะอยู่ที่ราว 16.9 วินาที
input:
“ผ่าน 'ปัญญา' ที่คิดและกระทำได้เหมือนมนุษย์ ซึ่งมนุษยชาติยังไม่สามารถแก้ไขได้จนถึงตอนนี้”
output:
“ยุคสมัยมาถึงแล้วที่เราต้องตอบคำถามนับไม่ถ้วนซึ่งมนุษยชาติยังไม่สามารถแก้ไขได้จนถึงตอนนี้ ผ่าน 'ปัญญา' ที่คิดและกระทำได้เหมือนมนุษย์ c Pixabay มนุษยชาติของเราได้ผ่านช่วงเวลาหลายหมื่นปีมา โดยสิ่งที่สำคัญที่สุดที่ต้องแก้ไขเพื่อจะมีชีวิตที่สมกับความเป็นมนุษย์คือ”
เจ๋งดีนะ
GPT-J-6B, Cedille และ KoGPT ต่างก็เป็นโมเดลที่มีพารามิเตอร์ 6 พันล้าน (6B) ทั้งหมดเลยนะครับ
ตอนนี้ GPT-3 ไม่ได้เป็นเพียงรายเดียวในตลาดอีกต่อไป https://th.news.hada.io/topic?id=5349
GPT-Neo : โปรเจ็กต์ที่ทำโมเดลขนาดเท่า GPT-3 ให้เป็นโอเพนซอร์ส/ใช้ฟรี https://th.news.hada.io/topic?id=3599
Cedille - เปิดซอร์สโมเดลภาษาฝรั่งเศสขนาด 6B https://th.news.hada.io/topic?id=5372