Imagen - โมเดล diffusion แบบ text-to-image ของ Google
(imagen.research.google)- โมเดล AI ที่สร้างภาพสมจริงได้จากการทำความเข้าใจภาษาในระดับลึก
- ในการประเมินโดยมนุษย์ สามารถสร้างภาพที่ได้รับความนิยมมากกว่า DALL-E 2 ของ OpenAI
→ ทั้งในด้านคุณภาพและการจัดแนวระหว่างภาพกับข้อความ - เปิดเผยเฉพาะงานวิจัยและภาพตัวอย่าง
→ ตัดสินใจไม่เปิดเดโมเวอร์ชันที่ใช้งานได้จากภายนอก เนื่องจากปัญหาด้านจริยธรรม เป็นต้น
2 ความคิดเห็น
เมื่อวานฉันเห็นหนังสือ Alice in Wonderland ที่ร้านหนังสือ ซึ่งแทรกภาพนิ่งจากแอนิเมชันของ Disney เป็นภาพประกอบอยู่ เลยสงสัยว่าถ้านำแต่ละฉากของ Alice in Wonderland ไปป้อนให้โมเดลแบบนั้น ผลลัพธ์ที่ออกมาจะเป็นอย่างไร
DALL·E 2 เปิดตัวแล้ว
DALL-E 2 ทำงานอย่างไร?