Web LLM - รัน LLM แบบเร่งความเร็วในเบราว์เซอร์ด้วย WebGPU

xguru · 2023-04-18T10:17:01+09:00

รัน LLM อย่าง LLaMA และ Vicuna ในเบราว์เซอร์โดยไม่ต้องมีเซิร์ฟเวอร์ ด้วย WASM เร่งความเร็วด้วย WebGPU แต่ยังรองรับแบ็กเอนด์ GPU ที่ Apache TVM รองรับแยกต่างหากด้วย (CUDA, OpenCL, Vulkan) ใช้เทคโนโลยี MLC (Machine Learning Compilation)

(github.com/mlc-ai)

14 คะแนน โดย xguru 2023-04-18 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

รัน LLM อย่าง LLaMA และ Vicuna ในเบราว์เซอร์โดยไม่ต้องมีเซิร์ฟเวอร์ ด้วย WASM
เร่งความเร็วด้วย WebGPU แต่ยังรองรับแบ็กเอนด์ GPU ที่ Apache TVM รองรับแยกต่างหากด้วย (CUDA, OpenCL, Vulkan)
ใช้เทคโนโลยี MLC (Machine Learning Compilation)

Web LLM - รัน LLM แบบเร่งความเร็วในเบราว์เซอร์ด้วย WebGPU

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น