Code Llama - โมเดลภาษาขนาดใหญ่ล้ำสมัยสำหรับการเขียนโค้ด

kuroneko · 2023-08-25T09:35:56+09:00

Meta เปิดตัว Code Llama ซึ่งเป็นโมเดลสำหรับการเขียนโค้ดโดยเฉพาะที่สร้างขึ้นบนพื้นฐานของ Llama 2. สามารถสร้างโค้ดได้จากทั้งโค้ดและพรอมป์ต์ภาษาธรรมชาติ และจากผลเบนช์มาร์กภายในพบว่าประสิทธิภาพเหนือกว่า ChatGPT. เปิดตัวโมเดลขนาด 7B, 13B และ 34B ที่ฝึกด้วยโทเค็นโค้ด 5 แสนล้านโทเค็นและข้อมูลที่เกี่ยวข้อง. รองรับคอนเท็กซ์โทเค็นสูงสุด 100,000 โทเค็น จึงเหมาะกับการเขียนโปรแกรมที่ยาวขึ้น หรือป้อนเงื่อนไขที่ละเอียดและโค้ดจริงเป็นพรอมป์ต์ได้สะดวก. นอกจากโมเดลต้นฉบับแล้ว Code Llama ยังเปิดตัวเพิ่มเติมอีก 2 รุ่นย่อย. Code Llama - Python: โมเดลที่ปรับจูนเพิ่มด้วยโทเค็นโค้ด Python อีก 1 แสนล้านโทเค็น. Code Llama - Instruct: โมเดลที่ปรับจูนด้วยโทเค็นคำสั่ง 5 พันล้านโทเค็น และปรับให้เหมาะกับอินพุตภาษาธรรมชาติและเอาต์พุตเป็นโค้ด. โมเดลอื่นไม่ได้เหมาะกับภาษาธรรมชาติโดยตรง ดังนั้นหากต้องการสร้างโค้ดผ่านภาษาธรรมชาติควรใช้รุ่นนี้. ผลการวัดประสิทธิภาพของโมเดลผ่าน HumanEval และ MBPP แสดงให้เห็นว่ามีความสามารถเทียบเท่าหรือสูงกว่า ChatGPT (GPT 3.5). เมื่อ GPT 3.5 ทำคะแนน HumanEval ได้ 48.1% นั้น Code Llama - Python ทำได้ 53.7%. ส่วน GPT 4 ยังนำอยู่ที่ 67% จึงยังมีช่องว่างให้พัฒนาอีกมาก. มีการเพิ่มมาตรการความปลอดภัยหลายอย่างเพื่อลดความเสี่ยงที่ Code Llama จะสร้างมัลแวร์ได้. จากการทดสอบจริงพบว่าสร้างโค้ดอันตรายได้น้อยกว่า ChatGPT.

(ai.meta.com)

22 คะแนน โดย kuroneko 2023-08-25 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

Meta เปิดตัว Code Llama ซึ่งเป็นโมเดลสำหรับการเขียนโค้ดโดยเฉพาะที่สร้างขึ้นบนพื้นฐานของ Llama 2.
สามารถสร้างโค้ดได้จากทั้งโค้ดและพรอมป์ต์ภาษาธรรมชาติ และจากผลเบนช์มาร์กภายในพบว่าประสิทธิภาพเหนือกว่า ChatGPT.
เปิดตัวโมเดลขนาด 7B, 13B และ 34B ที่ฝึกด้วยโทเค็นโค้ด 5 แสนล้านโทเค็นและข้อมูลที่เกี่ยวข้อง.
รองรับคอนเท็กซ์โทเค็นสูงสุด 100,000 โทเค็น จึงเหมาะกับการเขียนโปรแกรมที่ยาวขึ้น หรือป้อนเงื่อนไขที่ละเอียดและโค้ดจริงเป็นพรอมป์ต์ได้สะดวก.
นอกจากโมเดลต้นฉบับแล้ว Code Llama ยังเปิดตัวเพิ่มเติมอีก 2 รุ่นย่อย.
- Code Llama - Python: โมเดลที่ปรับจูนเพิ่มด้วยโทเค็นโค้ด Python อีก 1 แสนล้านโทเค็น.
- Code Llama - Instruct: โมเดลที่ปรับจูนด้วยโทเค็นคำสั่ง 5 พันล้านโทเค็น และปรับให้เหมาะกับอินพุตภาษาธรรมชาติและเอาต์พุตเป็นโค้ด.
  - โมเดลอื่นไม่ได้เหมาะกับภาษาธรรมชาติโดยตรง ดังนั้นหากต้องการสร้างโค้ดผ่านภาษาธรรมชาติควรใช้รุ่นนี้.
ผลการวัดประสิทธิภาพของโมเดลผ่าน HumanEval และ MBPP แสดงให้เห็นว่ามีความสามารถเทียบเท่าหรือสูงกว่า ChatGPT (GPT 3.5).
- เมื่อ GPT 3.5 ทำคะแนน HumanEval ได้ 48.1% นั้น Code Llama - Python ทำได้ 53.7%.
- ส่วน GPT 4 ยังนำอยู่ที่ 67% จึงยังมีช่องว่างให้พัฒนาอีกมาก.
โฆษณา
มีการเพิ่มมาตรการความปลอดภัยหลายอย่างเพื่อลดความเสี่ยงที่ Code Llama จะสร้างมัลแวร์ได้.
- จากการทดสอบจริงพบว่าสร้างโค้ดอันตรายได้น้อยกว่า ChatGPT.

2 ความคิดเห็น

xguru 2023-08-25

ดูเหมือนว่าไลเซนส์จะเหมือนกับ Llama นะ ถ้า MAU เกิน 700 ล้านคน ต้องขอไลเซนส์ก่อน
แต่บริษัทเกาหลีน่าจะไม่มีปัญหาใหญ่อะไร 555

kuroneko 2023-08-25

เปิดตัวภายใต้ไลเซนส์เดียวกับ Llama 2
ก่อนหน้านี้ก็รู้สึกว่า StarCoder ยังขาดอะไรไปนิดหน่อย แบบนี้ในที่สุดก็มีทางเลือกแทน Copilot จริง ๆ แล้วหรือเปล่า?

ไม่ว่าอย่างไร พอมาคิดแบบนี้ก็ยิ่งรู้สึกว่า GPT 4 มีประสิทธิภาพที่ยอดเยี่ยมมากจริง ๆ
ทั้งรองรับภาษาเกาหลีได้ดี และในเบนช์มาร์กก็ออกมาว่า GPT 4 มีประสิทธิภาพสูงกว่ามาก...

แม้แต่ GPT 3.5 ก็ยังเหนือกว่าโมเดลแบบเปิดอื่น ๆ อย่างชัดเจนในภาษาเกาหลี

หวังว่าจะมีโมเดลโอเพนซอร์สสำหรับสร้างโค้ดที่ทำงานกับภาษาเกาหลีได้เกิดขึ้นด้วย

Code Llama - โมเดลภาษาขนาดใหญ่ล้ำสมัยสำหรับการเขียนโค้ด

บทความที่เกี่ยวข้อง

2 ความคิดเห็น