Stability AI เปิดตัว Stable Code 3B โมเดล LLM สำหรับการเขียนโค้ด

xguru · 2024-01-18T10:02:01+09:00

เล็กกว่า CodeLLaMA 7b อยู่ 60% แต่เป็น LLM ขนาด 3B พารามิเตอร์ที่ให้ประสิทธิภาพใกล้เคียงกันเมื่อสร้างโค้ด สามารถทำงานแบบออฟไลน์บนแล็ปท็อปทั่วไปได้แม้ไม่มี GPU (เช่น MacBook Air) พัฒนาต่อยอดจากโมเดล Stable LM 3B ที่ฝึกด้วยข้อมูลภาษาธรรมชาติ 4 ล้านล้านโทเค็น แล้วนำไปฝึกเพิ่มด้วยข้อมูลด้านซอฟต์แวร์วิศวกรรม/โค้ด เลือกภาษาโปรแกรมมิง 18 ภาษาโดยอ้างอิงจากผลสำรวจนักพัฒนา StackOverflow ปี 2023

(stability.ai)

9 คะแนน โดย xguru 2024-01-18 | 5 ความคิดเห็น | แชร์ทาง WhatsApp

เล็กกว่า CodeLLaMA 7b อยู่ 60% แต่เป็น LLM ขนาด 3B พารามิเตอร์ที่ให้ประสิทธิภาพใกล้เคียงกันเมื่อสร้างโค้ด
สามารถทำงานแบบออฟไลน์บนแล็ปท็อปทั่วไปได้แม้ไม่มี GPU (เช่น MacBook Air)
พัฒนาต่อยอดจากโมเดล Stable LM 3B ที่ฝึกด้วยข้อมูลภาษาธรรมชาติ 4 ล้านล้านโทเค็น แล้วนำไปฝึกเพิ่มด้วยข้อมูลด้านซอฟต์แวร์วิศวกรรม/โค้ด
- เลือกภาษาโปรแกรมมิง 18 ภาษาโดยอ้างอิงจากผลสำรวจนักพัฒนา StackOverflow ปี 2023

5 ความคิดเห็น

misolab 2024-01-18

เราอยู่ในสายการเงินเลยพัฒนาได้เฉพาะในเครือข่ายภายใน แบบนี้ควรเริ่มเข้าหายังไงดีครับ?
พอลองใช้พวก Copilot ที่บ้านแล้วก็เลยอยากถามว่า ถ้าที่บริษัทได้ใช้บ้างก็น่าจะดี

ผมทำฝั่งพัฒนาแอปพลิเคชัน เลยยังไม่ค่อยรู้เรื่อง AI มากนัก ถ้าให้คำใบ้มา ผมจะไปค้นต่ออย่างตั้งใจครับ

cosine20 2024-01-19

https://github.com/janhq/jan
เป็นแอป GUI ที่ช่วยให้สามารถใช้งานโมเดลแบบออฟไลน์ได้ หากคุณใช้งานในเครือข่ายภายใน ก็น่าจะดาวน์โหลดไฟล์ติดตั้งของแอปนี้และไฟล์โมเดลที่จะใช้จากภายนอกไว้ล่วงหน้า แล้วค่อยย้ายเข้ามาใช้ในเครือข่ายภายในได้
วิธีเพิ่มโมเดลด้วยตนเองมีอธิบายไว้ด้านล่าง
https://jan.ai/guides/using-models/import-manually/

ahwjdekf 2024-01-18

พูดตามตรง ในสภาพแวดล้อมที่แยกเครือข่าย มันแทบไม่ต่างจากการใส่ตรวนให้นักพัฒนาเลย

ahwjdekf 2024-01-18

ช่วงนี้มีทั้งการพูดถึงการผ่อนคลายนโยบายแยกเครือข่าย และก็เริ่มเห็นความพยายามที่จะปรับปรุงอยู่บ้าง เลยอาจพอมีความหวังได้ แต่สถานที่ที่จัดการข้อมูลส่วนบุคคลอย่างธนาคารหรือโทรคมนาคมก็น่าจะยังยากอยู่ต่อไปครับ สำหรับนักพัฒนาแล้วมันเป็นสภาพแวดล้อมที่เหมือนคุกจริง ๆ

laeyoung 2024-01-18

เขาเปรียบเทียบประสิทธิภาพกับแค่พวกรุ่นที่มีขนาดโมเดลเล็กใกล้เคียงกัน แต่ถ้าดู Leaderboard ที่กว้างกว่านี้ก็จะเป็นแบบนี้นะครับ
https://huggingface.co/spaces/bigcode/bigcode-models-leaderboard

พอเป็นงานโค้ดแล้ว ก็อดคิดไม่ได้ว่า ต่อให้ช้ากว่าหรือแพงกว่านิดหน่อย ถ้าประสิทธิภาพดีกว่าก็น่าจะดีกว่าไหม?

Stability AI เปิดตัว Stable Code 3B โมเดล LLM สำหรับการเขียนโค้ด

บทความที่เกี่ยวข้อง

5 ความคิดเห็น