MiniLLM - รัน LLM บน GPU ส่วนตัว

xguru · 2023-03-30T10:45:01+09:00

ระบบขนาดมินิมอลสำหรับรัน LLM รุ่นล่าสุดบน Nvidia GPU สำหรับผู้บริโภค รองรับ LLM หลายตัว (LLAMA, BLOOM, OPT) ได้สูงสุดถึงขนาด 170B รองรับ Nvidia GPU หลากหลายประเภท โค้ดขนาดเล็ก ใช้งานง่าย เขียนด้วย Python ภายในใช้ขั้นตอนวิธี GPTQ สำหรับการบีบอัดแบบ 3-bit เพื่อลดการใช้หน่วยความจำ GPU ให้ต่ำที่สุด

(github.com/kuleshov)

22 คะแนน โดย xguru 2023-03-30 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

ระบบขนาดมินิมอลสำหรับรัน LLM รุ่นล่าสุดบน Nvidia GPU สำหรับผู้บริโภค
รองรับ LLM หลายตัว (LLAMA, BLOOM, OPT) ได้สูงสุดถึงขนาด 170B
รองรับ Nvidia GPU หลากหลายประเภท
โค้ดขนาดเล็ก ใช้งานง่าย เขียนด้วย Python
ภายในใช้ขั้นตอนวิธี GPTQ สำหรับการบีบอัดแบบ 3-bit เพื่อลดการใช้หน่วยความจำ GPU ให้ต่ำที่สุด

MiniLLM - รัน LLM บน GPU ส่วนตัว

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น