11 คะแนน โดย GN⁺ 2024-01-30 | 4 ความคิดเห็น | แชร์ทาง WhatsApp
  • LLM ประสิทธิภาพสูงสำหรับการสร้างโค้ด โดยนำ LLama 2 มาใช้กับชุดข้อมูลที่ปรับให้เหมาะกับโค้ด พร้อมสุ่มตัวอย่างข้อมูลเพิ่มขึ้นและฝึกนานขึ้น
  • ทำคะแนน 67.8 บน HumanEval ซึ่งเป็นประสิทธิภาพสูงสุดในบรรดาโอเพนโมเดล
  • เช่นเดียวกับไลเซนส์ก่อนหน้า สามารถใช้งานได้ทั้งเพื่อการวิจัยและเชิงพาณิชย์
  • มี 3 รุ่น
    • CodeLlama-70B
    • CodeLlama-70B-Python
    • CodeLlama-70B-Instruct
  • ตอนนี้มีให้เลือก 4 ขนาด: 7B/13B/34B/70B

4 ความคิดเห็น

 
ragingwind 2024-01-30

ถ้ารันแบบโลคัลได้บน M2 Max ขึ้นไป ก็น่าจะเป็นของเล่นที่เจ๋งที่สุดเลย

 
xguru 2024-01-30

ถ้าถูกทำ quantization ก็น่าจะรันได้ดีนะครับ อีกไม่นานคงจะออกมาใช่ไหม

 
xguru 2024-01-30

ลิงก์ด้านบนเป็นลิงก์สำหรับขอสิทธิ์เข้าถึงจาก Meta แต่บน Hugging Face เปิดเผยไว้ทั้งหมดแล้ว
https://huggingface.co/codellama

 
GN⁺ 2024-01-30
ความคิดเห็นจาก Hacker News
  • มีคนพัฒนา CodeGPT ซึ่งเป็นปลั๊กอินสำหรับ Jetbrains และสามารถรันแบบโลคัลได้ ดูปลั๊กอินได้ที่ นี่
  • สามารถดูโมเดลได้บน Hugging Face: CodeLlama-70b-hf
  • ผู้ใช้รายหนึ่งที่ใช้ ChatGPT และ GitHub Copilot สงสัยว่าจะนำโมเดลเหล่านี้ไปใช้ใน VS Code ได้อย่างไร แม้จะมีส่วนขยาย GPT สำหรับ VS Code อยู่มาก แต่ส่วนใหญ่ไม่ได้อัปเดตแล้วหรือพาไปสู่แพ็กเกจแบบเสียเงิน จึงคิดว่าน่าจะใช้ GitHub Copilot ต่อไปจะดีกว่า
  • ต้องยอมรับว่า Meta แสดงให้เห็นถึงความมุ่งมั่นที่ยอดเยี่ยมต่อแมชชีนเลิร์นนิงโอเพนซอร์ส
  • เมื่อดูว่าโมเดลโค้ดขนาดเล็กทำได้ดีแค่ไหน ก็ยิ่งสงสัยว่าโมเดล 70B นี้จะมีความสามารถระดับใด
  • หลายคนพูดถึงการใช้ 4090 กับโมเดลขนาดเล็ก แต่ไม่ค่อยเห็นการวิเคราะห์เรื่องการใช้พลังงาน คิดว่า Microsoft อุดหนุน Copilot อย่างมาก และถ้าใช้ Copilot ราว 30% ของเวลาในแต่ละวัน ก็สงสัยว่าต่อเดือนแล้วโมเดล 7B หรือ 13B บน 4090 จะใช้ไฟกี่ kWh และมีค่าไฟเท่าไร
  • สงสัยว่าโมเดล Copilot แบบโลคัลที่ดีที่สุดในตอนนี้คืออะไร และมีส่วนขยายที่ให้ประสบการณ์คล้ายกันบน vscode หรือไม่ มี 4090 อยู่แล้ว จึงคาดว่าน่าจะรันโมเดลได้จำนวนไม่น้อย
  • Baptiste Roziere เพิ่งบรรยายเรื่อง Code Llama ได้ยอดเยี่ยมมากเมื่อไม่นานมานี้ และรับชมได้ที่ นี่
  • ถ้าสามารถรันแบบโลคัลบนอุปกรณ์อย่าง M2 Max และทำงานแบบเดียวกับ Copilot ผ่านปลั๊กอิน IDE ได้ ก็น่าสนใจมาก เพราะช่วยประหยัดเวลาจากการแก้ปัญหาน่าเบื่อในโปรเจ็กต์หรือการเขียนโค้ด "boilerplate" ทำให้ไปโฟกัสกับงานวิศวกรรมซอฟต์แวร์ที่ยากกว่าได้
  • มีความเป็นไปได้ว่าคนเขียนโปรแกรมทั่วไปจะไม่มีฮาร์ดแวร์ที่รันสิ่งนี้ได้ด้วยความเร็วตามที่ต้องการ จึงยังไม่แน่ใจว่าปลั๊กอินนี้ทำมาเพื่อใคร ถึงอย่างนั้นก็ยังเป็นความสามารถที่เจ๋งมาก