• บทความเกี่ยวกับ Stable Diffusion ที่พัฒนาด้วย C/C++ ล้วน ๆ และโมเดลแมชชีนเลิร์นนิง
  • อิมพลีเมนเทชันที่อิงกับ ggml และมีลักษณะการทำงานคล้ายกับ llama.cpp
  • รองรับการควอนไทซ์จำนวนเต็มแบบ float 16 บิตและ 32 บิต รวมถึง 4 บิต, 5 บิต และ 8 บิต
  • เป็นอิมพลีเมนเทชันที่ใช้หน่วยความจำอย่างมีประสิทธิภาพและปรับให้เหมาะกับการทำ inference บน CPU โดยต้องใช้ประมาณ 2.3GB เมื่อสร้างภาพ 512x512 ด้วย txt2img
  • รองรับ AVX, AVX2, AVX512 สำหรับสถาปัตยกรรม x86
  • มีการพัฒนาโหมด txt2img และ img2img แบบต้นฉบับ พร้อม tokenizer สไตล์ stable-diffusion-webui
  • วิธี sampling ที่ใช้คือ Euler A
  • เป็นอิมพลีเมนเทชันที่เข้ากันได้กับแพลตฟอร์ม Linux, Mac OS และ Windows
  • แผนการปรับปรุงในอนาคต ได้แก่ วิธี sampling เพิ่มเติม, การรองรับ GPU, inference ที่เร็วขึ้น, การลดการใช้หน่วยความจำ, การรองรับ LoRA, การรองรับ k-quants และความสามารถในการทำซ้ำข้ามแพลตฟอร์ม
  • เป็นบทความที่มีคำแนะนำโดยละเอียดเกี่ยวกับการรับโค้ด, การแปลงน้ำหนัก, การบิลด์ และวิธีรันอิมพลีเมนเทชัน
  • เป็นอิมพลีเมนเทชันที่รองรับฟอร์แมตโมเดลผลลัพธ์หลายแบบ รวมถึงเลขทศนิยมลอยตัว 16 บิต, เลขทศนิยมลอยตัว 32 บิต และการควอนไทซ์จำนวนเต็มหลายรูปแบบ
  • เป็นบทความที่มีตัวอย่างการใช้งานอิมพลีเมนเทชันสำหรับโหมด txt2img และ img2img
  • ความต้องการหน่วยความจำและดิสก์จะแตกต่างกันตามความแม่นยำที่ใช้ แต่สำหรับภาพ 512x512 ต้องใช้หน่วยความจำประมาณ 2.0G ถึง 2.8G
  • เป็นอิมพลีเมนเทชันที่อ้างอิงจากหลายโปรเจ็กต์ เช่น ggml, stable-diffusion, stable-diffusion-webui และ k-diffusion

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น