Meta AI เปิดตัวโมเดล Code Llama 70B

(twitter.com/AIatMeta)

11 คะแนน โดย GN⁺ 2024-01-30 | 4 ความคิดเห็น | แชร์ทาง WhatsApp

LLM ประสิทธิภาพสูงสำหรับการสร้างโค้ด โดยนำ LLama 2 มาใช้กับชุดข้อมูลที่ปรับให้เหมาะกับโค้ด พร้อมสุ่มตัวอย่างข้อมูลเพิ่มขึ้นและฝึกนานขึ้น
ทำคะแนน 67.8 บน HumanEval ซึ่งเป็นประสิทธิภาพสูงสุดในบรรดาโอเพนโมเดล
เช่นเดียวกับไลเซนส์ก่อนหน้า สามารถใช้งานได้ทั้งเพื่อการวิจัยและเชิงพาณิชย์
มี 3 รุ่น
- CodeLlama-70B
- CodeLlama-70B-Python
- CodeLlama-70B-Instruct
ตอนนี้มีให้เลือก 4 ขนาด: 7B/13B/34B/70B

4 ความคิดเห็น

ragingwind 2024-01-30

ถ้ารันแบบโลคัลได้บน M2 Max ขึ้นไป ก็น่าจะเป็นของเล่นที่เจ๋งที่สุดเลย

xguru 2024-01-30

ถ้าถูกทำ quantization ก็น่าจะรันได้ดีนะครับ อีกไม่นานคงจะออกมาใช่ไหม

xguru 2024-01-30

ลิงก์ด้านบนเป็นลิงก์สำหรับขอสิทธิ์เข้าถึงจาก Meta แต่บน Hugging Face เปิดเผยไว้ทั้งหมดแล้ว
https://huggingface.co/codellama

GN⁺ 2024-01-30

ความคิดเห็นจาก Hacker News

มีคนพัฒนา CodeGPT ซึ่งเป็นปลั๊กอินสำหรับ Jetbrains และสามารถรันแบบโลคัลได้ ดูปลั๊กอินได้ที่ นี่
สามารถดูโมเดลได้บน Hugging Face: CodeLlama-70b-hf
ผู้ใช้รายหนึ่งที่ใช้ ChatGPT และ GitHub Copilot สงสัยว่าจะนำโมเดลเหล่านี้ไปใช้ใน VS Code ได้อย่างไร แม้จะมีส่วนขยาย GPT สำหรับ VS Code อยู่มาก แต่ส่วนใหญ่ไม่ได้อัปเดตแล้วหรือพาไปสู่แพ็กเกจแบบเสียเงิน จึงคิดว่าน่าจะใช้ GitHub Copilot ต่อไปจะดีกว่า
ต้องยอมรับว่า Meta แสดงให้เห็นถึงความมุ่งมั่นที่ยอดเยี่ยมต่อแมชชีนเลิร์นนิงโอเพนซอร์ส
เมื่อดูว่าโมเดลโค้ดขนาดเล็กทำได้ดีแค่ไหน ก็ยิ่งสงสัยว่าโมเดล 70B นี้จะมีความสามารถระดับใด
หลายคนพูดถึงการใช้ 4090 กับโมเดลขนาดเล็ก แต่ไม่ค่อยเห็นการวิเคราะห์เรื่องการใช้พลังงาน คิดว่า Microsoft อุดหนุน Copilot อย่างมาก และถ้าใช้ Copilot ราว 30% ของเวลาในแต่ละวัน ก็สงสัยว่าต่อเดือนแล้วโมเดล 7B หรือ 13B บน 4090 จะใช้ไฟกี่ kWh และมีค่าไฟเท่าไร
สงสัยว่าโมเดล Copilot แบบโลคัลที่ดีที่สุดในตอนนี้คืออะไร และมีส่วนขยายที่ให้ประสบการณ์คล้ายกันบน vscode หรือไม่ มี 4090 อยู่แล้ว จึงคาดว่าน่าจะรันโมเดลได้จำนวนไม่น้อย
Baptiste Roziere เพิ่งบรรยายเรื่อง Code Llama ได้ยอดเยี่ยมมากเมื่อไม่นานมานี้ และรับชมได้ที่ นี่
ถ้าสามารถรันแบบโลคัลบนอุปกรณ์อย่าง M2 Max และทำงานแบบเดียวกับ Copilot ผ่านปลั๊กอิน IDE ได้ ก็น่าสนใจมาก เพราะช่วยประหยัดเวลาจากการแก้ปัญหาน่าเบื่อในโปรเจ็กต์หรือการเขียนโค้ด "boilerplate" ทำให้ไปโฟกัสกับงานวิศวกรรมซอฟต์แวร์ที่ยากกว่าได้
มีความเป็นไปได้ว่าคนเขียนโปรแกรมทั่วไปจะไม่มีฮาร์ดแวร์ที่รันสิ่งนี้ได้ด้วยความเร็วตามที่ต้องการ จึงยังไม่แน่ใจว่าปลั๊กอินนี้ทำมาเพื่อใคร ถึงอย่างนั้นก็ยังเป็นความสามารถที่เจ๋งมาก

Meta AI เปิดตัวโมเดล Code Llama 70B

บทความที่เกี่ยวข้อง

4 ความคิดเห็น

ความคิดเห็นจาก Hacker News