- SDXL Turbo บรรลุประสิทธิภาพระดับล้ำหน้าด้วยการประยุกต์ใช้เทคนิคการกลั่น (distillation) แบบใหม่
- ลดจำนวนขั้นตอนสำหรับการสร้างภาพจาก 50 ขั้นตอนเหลือเพียง 1 ขั้นตอน พร้อมการสร้างภาพแบบ single-step ที่ให้คุณภาพอย่างที่ไม่เคยมีมาก่อน
- สามารถดาวน์โหลดน้ำหนักโมเดลและโค้ดได้จาก Hugging Face ภายใต้ไลเซนส์วิจัยแบบไม่เชิงพาณิชย์
- ขณะนี้มีการสาธิตเบตาฟีเจอร์สร้างภาพจากข้อความแบบเรียลไทม์ของ SDXL Turbo บนแพลตฟอร์มแก้ไขภาพ Clipdrop ของ Stability AI
ข้อดีของ Adversarial Diffusion Distillation
- SDXL Turbo พัฒนาบนพื้นฐานของเทคนิคการกลั่นแบบใหม่ชื่อ Adversarial Diffusion Distillation (ADD)
- ADD ทำให้สามารถสร้างภาพแบบขั้นตอนเดียวได้ พร้อมข้อดีคล้ายกับ GAN (Generative Adversarial Networks)
- หลีกเลี่ยง artifact หรืออาการภาพเบลอที่มักพบในวิธีการกลั่นแบบอื่น
การเปรียบเทียบประสิทธิภาพกับโมเดล diffusion อื่น
- มีการเปรียบเทียบโมเดลหลายเวอร์ชัน (StyleGAN-T++, OpenMUSE, IF-XL, SDXL, LCM-XL) เพื่อคัดเลือก SDXL Turbo
- นำผลลัพธ์ที่สร้างจากพรอมต์เดียวกันไปแสดงแบบสุ่มให้ผู้ประเมินมนุษย์ดู และให้เลือกผลลัพธ์ที่สอดคล้องกับทิศทางของพรอมต์มากที่สุด
- มีการทดสอบเพิ่มเติมด้านคุณภาพของภาพด้วยวิธีเดียวกัน
- SDXL Turbo แบบ 1 ขั้นตอนเหนือกว่า LCM-XL แบบ 4 ขั้นตอน และแบบ 4 ขั้นตอนเหนือกว่า SDXL แบบ 50 ขั้นตอน
- ผลลัพธ์นี้ยืนยันว่า SDXL Turbo สามารถเหนือกว่าโมเดล multi-step ระดับล้ำหน้าได้ ด้วยความต้องการคำนวณที่ต่ำกว่ามากโดยไม่ลดทอนคุณภาพของภาพ
ทดลองใช้ SDXL Turbo ผ่าน Clipdrop
- เพื่อทดสอบความสามารถของโมเดลใหม่นี้ สามารถใช้งานเบตาเดโมสร้างภาพแบบเรียลไทม์ของ SDXL Turbo ได้บนแพลตฟอร์มแก้ไขภาพ Clipdrop ของ Stability AI
- รองรับเบราว์เซอร์ส่วนใหญ่ และขณะนี้สามารถทดลองใช้ได้ฟรี
การใช้งานเชิงพาณิชย์
- หากต้องการใช้โมเดลนี้ในผลิตภัณฑ์หรือวัตถุประสงค์เชิงพาณิชย์ ต้องติดต่อบริษัท
1 ความคิดเห็น
เร็วมากเลยนะ