SDXL Turbo - โมเดลสร้างภาพจากข้อความแบบเรียลไทม์

xguru · 2023-11-30T11:09:11+09:00

SDXL Turbo บรรลุประสิทธิภาพระดับล้ำหน้าด้วยการประยุกต์ใช้เทคนิคการกลั่น (distillation) แบบใหม่ ลดจำนวนขั้นตอนสำหรับการสร้างภาพจาก 50 ขั้นตอนเหลือเพียง 1 ขั้นตอน พร้อมการสร้างภาพแบบ single-step ที่ให้คุณภาพอย่างที่ไม่เคยมีมาก่อน สามารถดาวน์โหลดน้ำหนักโมเดลและโค้ดได้จาก Hugging Face ภายใต้ไลเซนส์วิจัยแบบไม่เชิงพาณิชย์ ขณะนี้มีการสาธิตเบตาฟีเจอร์สร้างภาพจากข้อความแบบเรียลไทม์ของ SDXL Turbo บนแพลตฟอร์มแก้ไขภาพ Clipdrop ของ Stability AI ข้อดีของ Adversarial Diffusion Distillation SDXL Turbo พัฒนาบนพื้นฐานของเทคนิคการกลั่นแบบใหม่ชื่อ Adversarial Diffusion Distillation (ADD) ADD ทำให้สามารถสร้างภาพแบบขั้นตอนเดียวได้ พร้อมข้อดีคล้ายกับ GAN (Generative Adversarial Networks) หลีกเลี่ยง artifact หรืออาการภาพเบลอที่มักพบในวิธีการกลั่นแบบอื่น การเปรียบเทียบประสิทธิภาพกับโมเดล diffusion อื่น มีการเปรียบเทียบโมเดลหลายเวอร์ชัน (StyleGAN-T++, OpenMUSE, IF-XL, SDXL, LCM-XL) เพื่อคัดเลือก SDXL Turbo นำผลลัพธ์ที่สร้างจากพรอมต์เดียวกันไปแสดงแบบสุ่มให้ผู้ประเมินมนุษย์ดู และให้เลือกผลลัพธ์ที่สอดคล้องกับทิศทางของพรอมต์มากที่สุด มีการทดสอบเพิ่มเติมด้านคุณภาพของภาพด้วยวิธีเดียวกัน SDXL Turbo แบบ 1 ขั้นตอนเหนือกว่า LCM-XL แบบ 4 ขั้นตอน และแบบ 4 ขั้นตอนเหนือกว่า SDXL แบบ 50 ขั้นตอน ผลลัพธ์นี้ยืนยันว่า SDXL Turbo สามารถเหนือกว่าโมเดล multi-step ระดับล้ำหน้าได้ ด้วยความต้องการคำนวณที่ต่ำกว่ามากโดยไม่ลดทอนคุณภาพของภาพ ทดลองใช้ SDXL Turbo ผ่าน Clipdrop เพื่อทดสอบความสามารถของโมเดลใหม่นี้ สามารถใช้งานเบตาเดโมสร้างภาพแบบเรียลไทม์ของ SDXL Turbo ได้บนแพลตฟอร์มแก้ไขภาพ Clipdrop ของ Stability AI รองรับเบราว์เซอร์ส่วนใหญ่ และขณะนี้สามารถทดลองใช้ได้ฟรี การใช้งานเชิงพาณิชย์ หากต้องการใช้โมเดลนี้ในผลิตภัณฑ์หรือวัตถุประสงค์เชิงพาณิชย์ ต้องติดต่อบริษัท

(stability.ai)

13 คะแนน โดย xguru 2023-11-30 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

SDXL Turbo บรรลุประสิทธิภาพระดับล้ำหน้าด้วยการประยุกต์ใช้เทคนิคการกลั่น (distillation) แบบใหม่
ลดจำนวนขั้นตอนสำหรับการสร้างภาพจาก 50 ขั้นตอนเหลือเพียง 1 ขั้นตอน พร้อมการสร้างภาพแบบ single-step ที่ให้คุณภาพอย่างที่ไม่เคยมีมาก่อน
สามารถดาวน์โหลดน้ำหนักโมเดลและโค้ดได้จาก Hugging Face ภายใต้ไลเซนส์วิจัยแบบไม่เชิงพาณิชย์
ขณะนี้มีการสาธิตเบตาฟีเจอร์สร้างภาพจากข้อความแบบเรียลไทม์ของ SDXL Turbo บนแพลตฟอร์มแก้ไขภาพ Clipdrop ของ Stability AI

ข้อดีของ Adversarial Diffusion Distillation

SDXL Turbo พัฒนาบนพื้นฐานของเทคนิคการกลั่นแบบใหม่ชื่อ Adversarial Diffusion Distillation (ADD)
ADD ทำให้สามารถสร้างภาพแบบขั้นตอนเดียวได้ พร้อมข้อดีคล้ายกับ GAN (Generative Adversarial Networks)
หลีกเลี่ยง artifact หรืออาการภาพเบลอที่มักพบในวิธีการกลั่นแบบอื่น

การเปรียบเทียบประสิทธิภาพกับโมเดล diffusion อื่น

มีการเปรียบเทียบโมเดลหลายเวอร์ชัน (StyleGAN-T++, OpenMUSE, IF-XL, SDXL, LCM-XL) เพื่อคัดเลือก SDXL Turbo
นำผลลัพธ์ที่สร้างจากพรอมต์เดียวกันไปแสดงแบบสุ่มให้ผู้ประเมินมนุษย์ดู และให้เลือกผลลัพธ์ที่สอดคล้องกับทิศทางของพรอมต์มากที่สุด
มีการทดสอบเพิ่มเติมด้านคุณภาพของภาพด้วยวิธีเดียวกัน
SDXL Turbo แบบ 1 ขั้นตอนเหนือกว่า LCM-XL แบบ 4 ขั้นตอน และแบบ 4 ขั้นตอนเหนือกว่า SDXL แบบ 50 ขั้นตอน
ผลลัพธ์นี้ยืนยันว่า SDXL Turbo สามารถเหนือกว่าโมเดล multi-step ระดับล้ำหน้าได้ ด้วยความต้องการคำนวณที่ต่ำกว่ามากโดยไม่ลดทอนคุณภาพของภาพ

ทดลองใช้ SDXL Turbo ผ่าน Clipdrop

เพื่อทดสอบความสามารถของโมเดลใหม่นี้ สามารถใช้งานเบตาเดโมสร้างภาพแบบเรียลไทม์ของ SDXL Turbo ได้บนแพลตฟอร์มแก้ไขภาพ Clipdrop ของ Stability AI
รองรับเบราว์เซอร์ส่วนใหญ่ และขณะนี้สามารถทดลองใช้ได้ฟรี

การใช้งานเชิงพาณิชย์

หากต้องการใช้โมเดลนี้ในผลิตภัณฑ์หรือวัตถุประสงค์เชิงพาณิชย์ ต้องติดต่อบริษัท

1 ความคิดเห็น

laeyoung 2023-12-01

เร็วมากเลยนะ