LLaMA-CPU - ฟอร์กสำหรับรัน LLaMA บน CPU

xguru · 2023-03-09T11:20:01+09:00

รันโมเดล LLaMA ของ Meta บน CPU การตั้งค่าแทบจะเหมือนกันทั้งหมด เมื่อทดสอบด้วยโมเดล 7B หากต้องการโหลดโมเดล จำเป็นต้องใช้ swap/zram แม้จะมีแรม 32GiB ระหว่างการทำ inference จริง ใช้แรมจริงต่ำกว่าประมาณ 20GiB บน Ryzen 7900X โมเดล 7B สามารถทำ inference ได้หลายคำต่อวินาที

(github.com/markasoftware)

4 คะแนน โดย xguru 2023-03-09 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

รันโมเดล LLaMA ของ Meta บน CPU
การตั้งค่าแทบจะเหมือนกันทั้งหมด
เมื่อทดสอบด้วยโมเดล 7B หากต้องการโหลดโมเดล จำเป็นต้องใช้ swap/zram แม้จะมีแรม 32GiB
ระหว่างการทำ inference จริง ใช้แรมจริงต่ำกว่าประมาณ 20GiB
บน Ryzen 7900X โมเดล 7B สามารถทำ inference ได้หลายคำต่อวินาที

LLaMA-CPU - ฟอร์กสำหรับรัน LLaMA บน CPU

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น