สถานะปัจจุบันของโมเดลภาษาโอเพนซอร์ส

xguru · 2023-08-09T11:03:01+09:00

ร้อนแรงยิ่งขึ้นหลังการเปิดตัว LLaMA 2 แทบทุกกลุ่มโมเดลโอเพนซอร์สได้อัปเดตโมเดลของตนโดยใช้เบสโมเดลใหม่ WizardLM, Airoboros, Hermes เป็นต้น โมเดลที่ทรงพลังที่สุดในตอนนี้คือ Stable Beluga 2 ของ StabilityAI ปรับจูนละเอียดจากโมเดล Llama2 70B ด้วยชุดข้อมูลสไตล์ Orca เทียบกับ ChatGPT ได้ โมเดล Long LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K โมเดลขนาดเล็กแต่ทรงพลัง โมเดลพารามิเตอร์ 3B ที่ทรงพลังระดับ 7B ยังไปไม่ถึงขีดจำกัด และยังมีสิ่งให้พัฒนาอีกมาก SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP) โมเดลเปิดชนะ ChatGPT บน MMLU : llama-2-70b-guanaco-qlora แชตแบบ Multi-Turn : llama2-13b-orca-8k-3319 โมเดลจากจีนกำลังแข่งขันกัน : CodeGeex2 โมเดลเปิดไปถึงระดับ ChatGPT แล้วหรือยัง? ยังไม่ถึง แต่ก็อาจไปถึงได้ในไม่ช้า

(twitter.com/Yampeleg)

22 คะแนน โดย xguru 2023-08-09 | 3 ความคิดเห็น | แชร์ทาง WhatsApp

ร้อนแรงยิ่งขึ้นหลังการเปิดตัว LLaMA 2
- แทบทุกกลุ่มโมเดลโอเพนซอร์สได้อัปเดตโมเดลของตนโดยใช้เบสโมเดลใหม่
  - WizardLM, Airoboros, Hermes เป็นต้น
- โมเดลที่ทรงพลังที่สุดในตอนนี้คือ Stable Beluga 2 ของ StabilityAI
  - ปรับจูนละเอียดจากโมเดล Llama2 70B ด้วยชุดข้อมูลสไตล์ Orca
  - เทียบกับ ChatGPT ได้
โมเดล Long
- LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K
โมเดลขนาดเล็กแต่ทรงพลัง
- โมเดลพารามิเตอร์ 3B ที่ทรงพลังระดับ 7B
- ยังไปไม่ถึงขีดจำกัด และยังมีสิ่งให้พัฒนาอีกมาก
- SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP)
โมเดลเปิดชนะ ChatGPT บน MMLU : llama-2-70b-guanaco-qlora
แชตแบบ Multi-Turn : llama2-13b-orca-8k-3319
โมเดลจากจีนกำลังแข่งขันกัน : CodeGeex2
โมเดลเปิดไปถึงระดับ ChatGPT แล้วหรือยัง?
- ยังไม่ถึง แต่ก็อาจไปถึงได้ในไม่ช้า

3 ความคิดเห็น

botplaysdice 2023-08-10

ดูเหมือนว่าทุกคนจะต้องคิดหนักกันมากขึ้นว่าจะหารายได้จากบทบาทของตัวเองอย่างไรในด้าน monetization

geekbini 2023-08-09

ตอนนี้มีบริการ AI สารพัดแบบมากขึ้นจนเลือกไม่ถูกเลยครับ ทั้งบริการ AI แบบอเนกประสงค์ แล้วก็บริการ AI ที่ออกแบบมาเฉพาะสำหรับนักพัฒนาด้วย~

kuroneko 2023-08-09

หวังว่าโมเดลภาษาเกาหลีจะพัฒนาขึ้นด้วยนะครับ

สถานะปัจจุบันของโมเดลภาษาโอเพนซอร์ส

บทความที่เกี่ยวข้อง

3 ความคิดเห็น