Stable Diffusion คือโมเดล AI Art ที่สำคัญที่สุดเท่าที่เคยมีมา

xguru · 2022-08-30T09:53:19+09:00

คุณภาพใกล้เคียงกับ DALL·E 2 หรือ MidJourney แต่เป็น 'โอเพนซอร์ส' มีการนำไปรันบน Google Colabs แล้ว และมีการสร้างปลั๊กอินสำหรับ Figma ขึ้นมาแล้ว MidJourney เองก็เคยพยายามผสานเข้ากับ Stable Diffusion คุณภาพดีกว่าโอเพนซอร์สที่ออกมาก่อนหน้านี้อย่าง DALL·E Mini หรือ Disco Diffusion มาก สามารถสร้างภาพได้ง่ายผ่าน Dreamstudio: ฟรีถึง 200 ภาพ หลังจากนั้นภาพละ £0.01 (DALL·E อยู่ที่ $0.03) เร็ว ๆ นี้มีแผนจะเพิ่มฟีเจอร์ใส่พรอมต์ให้กับภาพอื่นเพื่อสร้างภาพใหม่ ด้วยข้อได้เปรียบที่เป็นโอเพนซอร์ส จึงเริ่มถูกนำไปใช้งานในหลากหลายที่ Outpainting + Inpainting collage ออกแบบปกนิตยสาร วาดการ์ตูน และสร้างแอนิเมชัน Img2Img Emad Mostaque จาก Stability.AI ผู้สร้าง Stable Diffusion ได้กล่าวไว้ว่า เมื่อเราเปิดตัวโมเดลที่เร็วขึ้น ดีขึ้น และเฉพาะทางมากขึ้น คุณภาพก็จะยิ่งดีขึ้นเรื่อย ๆ ไม่ใช่แค่ภาพเท่านั้น เดือนหน้ามีแผนจะปล่อยออดิโอ และต่อจากนั้นคือ 3D กับวิดีโอ กำลังฝึกโมเดลเพิ่มเติมสำหรับภาษา โค้ด และอื่น ๆ

(thealgorithmicbridge.substack.com)

37 คะแนน โดย xguru 2022-08-30 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

คุณภาพใกล้เคียงกับ DALL·E 2 หรือ MidJourney แต่เป็น 'โอเพนซอร์ส'
มีการนำไปรันบน Google Colabs แล้ว และมีการสร้างปลั๊กอินสำหรับ Figma ขึ้นมาแล้ว
MidJourney เองก็เคยพยายามผสานเข้ากับ Stable Diffusion
คุณภาพดีกว่าโอเพนซอร์สที่ออกมาก่อนหน้านี้อย่าง DALL·E Mini หรือ Disco Diffusion มาก
สามารถสร้างภาพได้ง่ายผ่าน Dreamstudio: ฟรีถึง 200 ภาพ หลังจากนั้นภาพละ £0.01 (DALL·E อยู่ที่ $0.03)
- เร็ว ๆ นี้มีแผนจะเพิ่มฟีเจอร์ใส่พรอมต์ให้กับภาพอื่นเพื่อสร้างภาพใหม่
ด้วยข้อได้เปรียบที่เป็นโอเพนซอร์ส จึงเริ่มถูกนำไปใช้งานในหลากหลายที่
- Outpainting + Inpainting collage
- ออกแบบปกนิตยสาร วาดการ์ตูน และสร้างแอนิเมชัน
- Img2Img
Emad Mostaque จาก Stability.AI ผู้สร้าง Stable Diffusion ได้กล่าวไว้ว่า

เมื่อเราเปิดตัวโมเดลที่เร็วขึ้น ดีขึ้น และเฉพาะทางมากขึ้น คุณภาพก็จะยิ่งดีขึ้นเรื่อย ๆ
ไม่ใช่แค่ภาพเท่านั้น เดือนหน้ามีแผนจะปล่อยออดิโอ และต่อจากนั้นคือ 3D กับวิดีโอ
กำลังฝึกโมเดลเพิ่มเติมสำหรับภาษา โค้ด และอื่น ๆ

2 ความคิดเห็น

forteleaf 2022-08-31

ความเร็วของโมเดลเดโมค่อนข้างเร็วมากนะครับ ถ้าเวลาใช้งานจริงได้ความเร็วประมาณนี้ ขอบเขตการใช้งานก็น่าจะมหาศาลทีเดียว
ผมลองทดสอบด้วยภาษาเกาหลีด้วย แต่ส่วนใบหน้าคนออกมาเพี้ยนจนมีมุมที่น่ากลัวอยู่บ้าง

xguru 2022-08-30

Stable Diffusion - โอเพนซอร์สแบบ Text-To-Image ที่คล้ายกับ DALL-E
Lexica - ค้นหารูปภาพที่สร้างด้วย Stable Diffusion มากกว่า 5 ล้านภาพ

Stable Diffusion คือโมเดล AI Art ที่สำคัญที่สุดเท่าที่เคยมีมา

บทความที่เกี่ยวข้อง

2 ความคิดเห็น