Stable Diffusion คือโมเดล AI Art ที่สำคัญที่สุดเท่าที่เคยมีมา
(thealgorithmicbridge.substack.com)- คุณภาพใกล้เคียงกับ DALL·E 2 หรือ MidJourney แต่เป็น 'โอเพนซอร์ส'
- มีการนำไปรันบน Google Colabs แล้ว และมีการสร้างปลั๊กอินสำหรับ Figma ขึ้นมาแล้ว
- MidJourney เองก็เคยพยายามผสานเข้ากับ Stable Diffusion
- คุณภาพดีกว่าโอเพนซอร์สที่ออกมาก่อนหน้านี้อย่าง DALL·E Mini หรือ Disco Diffusion มาก
- สามารถสร้างภาพได้ง่ายผ่าน Dreamstudio: ฟรีถึง 200 ภาพ หลังจากนั้นภาพละ £0.01 (DALL·E อยู่ที่ $0.03)
- เร็ว ๆ นี้มีแผนจะเพิ่มฟีเจอร์ใส่พรอมต์ให้กับภาพอื่นเพื่อสร้างภาพใหม่
- ด้วยข้อได้เปรียบที่เป็นโอเพนซอร์ส จึงเริ่มถูกนำไปใช้งานในหลากหลายที่
- Outpainting + Inpainting collage
- ออกแบบปกนิตยสาร วาดการ์ตูน และสร้างแอนิเมชัน
- Img2Img
- Emad Mostaque จาก Stability.AI ผู้สร้าง Stable Diffusion ได้กล่าวไว้ว่า
เมื่อเราเปิดตัวโมเดลที่เร็วขึ้น ดีขึ้น และเฉพาะทางมากขึ้น คุณภาพก็จะยิ่งดีขึ้นเรื่อย ๆ
ไม่ใช่แค่ภาพเท่านั้น เดือนหน้ามีแผนจะปล่อยออดิโอ และต่อจากนั้นคือ 3D กับวิดีโอ
กำลังฝึกโมเดลเพิ่มเติมสำหรับภาษา โค้ด และอื่น ๆ
2 ความคิดเห็น
ความเร็วของโมเดลเดโมค่อนข้างเร็วมากนะครับ ถ้าเวลาใช้งานจริงได้ความเร็วประมาณนี้ ขอบเขตการใช้งานก็น่าจะมหาศาลทีเดียว
ผมลองทดสอบด้วยภาษาเกาหลีด้วย แต่ส่วนใบหน้าคนออกมาเพี้ยนจนมีมุมที่น่ากลัวอยู่บ้าง
Stable Diffusion - โอเพนซอร์สแบบ Text-To-Image ที่คล้ายกับ DALL-E
Lexica - ค้นหารูปภาพที่สร้างด้วย Stable Diffusion มากกว่า 5 ล้านภาพ